稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
大数据
订阅
avatar
彭皝
更多收藏集

微信扫码分享

微信
新浪微博
QQ

3篇文章 · 0订阅
  • Spark SQL/Hive调优
    1. 数据倾斜的原因 任务进度长时间维持在99%(或100%),查看任务监控页面,发现只有少量(1个或几个)reduce子任务未完成。因为其处理的数据量和其他reduce差异过大。 单一reduce的记录数与平均记录数差异过大,通常可能达到3倍甚至更多。 最长时长远大于平均时长…
    • Meet相识
    • 7年前
    • 1.4k
    • 2
    • 评论
    Spark
  • 北大开源全新中文分词工具包:准确率远超THULAC、结巴分词
    选自GitHub,作者:罗睿轩、许晶晶、孙栩,机器之心编辑。 pkuseg 是由北京大学语言计算与机器学习研究组研制推出的一套全新的中文分词工具包。它简单易用,支持多领域分词,在不同领域的数据上都大幅提高了分词的准确率。 高分词准确率:相比于其他的分词工具包,该工具包在不同领域…
    • 机器之心
    • 7年前
    • 4.5k
    • 19
    • 1
    NLP
  • 基于用户画像的实时异步化视频推荐系统
    标题有点长,其实是为了突出该推荐系统的三个亮点,一个是实时,一个是基于用户画像去做的,一个是异步化。
    • 神奇的命令行
    • 9年前
    • 2.5k
    • 72
    • 评论
    后端
    基于用户画像的实时异步化视频推荐系统