首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
语落心生
掘友等级
算法infra
Github: kaori-seasons/undertaker86001/kitalkuyo-gita 人生如棋,落子无悔。不过片刻之间,闲敲棋子落灯花而已。 Apache Geaflow Committer, 参与过两次Gsoc,目前在研究AGI相关
获得徽章 8
动态
文章
专栏
沸点
收藏集
关注
作品
赞
190
文章 182
沸点 8
赞
190
返回
|
搜索文章
最新
热门
海量数据集AI自动化打标 - 温度周期检测
温度特征多标签预测: https://github.com/STARTORUS/tok-label/pull/2 概述:让AI识别温度变化的"指纹" 想象一下,在一个等离子体实验装置中,温度从几百电子
海量数据集的AI自动化预测打标 -- 矿业音频分类
两个月前公司有个AI标注的训练数据需求调研,正巧清华某个团队有此需求,于是进行合作。一共开源了三个模型的初版。记录下自己的实现 声音样本多标签预测 - 矿山矿业场景: https://github.c
流式数据湖Paimon探秘之旅 (二十一) 企业级最佳实践和案例分析
第21章:企业级最佳实践和案例分析 导言:从理论到生产的跨越 在前面的20章中,我们讲解了Paimon的所有核心功能和技术细节。但理论和生产实践往往存在巨大差距。本章通过真实的企业级案例分析,展示如何
流式数据湖Paimon探秘之旅 (二十) 性能测试与基准对标
第20章:性能测试与基准对标 导言:用数据说话 在前面的19章中,我们讲解了Paimon的架构、功能和部署方案。但在实际生产环境中,性能指标是最终的评判标准。本章将讲解如何系统地测试Paimon的性能
流式数据湖Paimon探秘之旅 (十九) REST Catalog自定义服务开发
第19章:REST Catalog自定义服务开发 导言:打造跨系统的元数据服务 在前面的章节中,我们讲解了Paimon的Catalog体系。但在分布式系统中,往往需要跨集群、跨云的元数据管理。REST
流式数据湖Paimon探秘之旅 (十八) 常见问题排查与性能调优
第18章:常见问题排查与性能调优 导言:从问题到解决的完整指南 本章汇总了Paimon使用中最常见的问题、诊断方法和解决方案。 第一部分:写入性能问题 问题1:写入吞吐量低(<10K行/秒) 症状:
流式数据湖Paimon探秘之旅 (十七) 集群部署与运维
第17章:集群部署与运维 导言:从开发到生产的关键步骤 在生产环境中部署Paimon需要考虑高可用性、性能、监控和故障恢复。本章讲解部署架构和运维最佳实践。 第一部分:存储后端选择 1.1 HDFS部
流式数据湖Paimon探秘之旅 (十六) Flink集成深度解析
第16章:Flink集成深度解析 导言:数据实时处理的完美伴侣 Paimon与Flink的集成是最重要的应用场景。本章讲解如何在Flink中高效地读写Paimon表。 第一部分:Paimon Tabl
流式数据湖Paimon探秘之旅 (十五) 文件清理与维护
第15章:文件清理与维护 导言:垃圾回收的重要性 随着时间推移,Paimon表会积累大量的旧Snapshot、临时文件、孤儿文件。这些无用数据占用磁盘空间并影响元数据查询性能。本章讲解如何安全高效地清
流式数据湖Paimon探秘之旅 (十四) Tag与分支管理
第14章:Tag与分支管理 导言:数据的版本控制 就像Git管理代码一样,Paimon也提供了**Tag(标签)和Branch(分支)**来管理数据的版本。 第一部分:Tag(标签) 1.1 Tag是
下一页
个人成就
文章被点赞
188
文章被阅读
80,638
掘力值
3,811
关注了
87
关注者
272
收藏集
1
关注标签
32
加入于
2018-02-05