首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
葫角瓜瓜
更多收藏集
微信扫码分享
微信
新浪微博
QQ
11篇文章 · 0订阅
大数据资源整理
scala、spark 使用过程中,各种测试用例以及相关资料整理
后台程序员转算法的参考秘籍:大规模机器学习框架的四重境界
如何利用相对廉价的机器搭建分布式超大规模机器学习集群是一件非常复杂的事情,对工程和算法都有极高的要求,从Spark到李沐的通用参数服务器,业界对此都进行过哪些尝试?本文尝试梳理一下这方面的历史和当前最佳实践。
HDFS NameNode 重启优化
在 Hadoop 集群整个生命周期里,由于调整参数、Patch、升级等多种场景需要频繁操作 NameNode 重启,不论采用何种架构,重启期间集群整体存在可用性和可靠性的风险,所以优化 NameNode 重启非常关键。
Hadoop 实验 - 熟悉常用的 HDFS 操作
理解 HDFS 在 Hadoop 体系结构中的角色。 熟练使用 HDFS 操作常用的 Shell 命令。 熟悉 HDFS 操作常用的 Java API。
No.23 聊一聊数据倾斜那些坑
如何自学人工智能?
最近不少同学跃跃欲试,想投入 AI 的怀抱,但苦于不知如何下手。其中,人工智能的核心就是机器学习(Machine Learning),它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 我们今天就来分享一篇来自 EliteDataScience 上专门讲给机器学习入…
深度剖析 Spark 分布式执行原理
Spark 是大数据领域中相当火热的计算框架,在大数据分析领域有一统江湖的趋势,网上对于 Spark 源码分析的文章有很多,但是介绍 Spark 如何处理代码分布式执行问题的资料少之又少,这也是我撰写文本的目的。
史上最详细的 Hadoop 环境搭建(上篇)
这是一篇入门文章,Hadoop 的学习方法很多。本文的思路是:以安装部署 Apache Hadoop2.x 版本为主线,来介绍 Hadoop2.x 的架构组成、各模块协同工作原理、技术细节。安装不是目的,通过安装认识Hadoop才是目的。
Hadoop和大数据:60款顶级开源工具
这回我们推出了最新的顶级开源大数据工具排行榜。这个领域最近方兴未艾,许多新项目纷纷启动。许多最知名的项目由Apache基金会管理,与Hadoop密切相关。请注意:本文不是要搞什么排名;相反,项目按类别加以介绍。与往常一样,要是你知道另外的开源大数据及/或Hadoop工具应该榜