首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
醉挽清风197
更多收藏集
微信扫码分享
微信
新浪微博
QQ
15篇文章 · 0订阅
大数据研发工程师(两年)字节跳动面经
数据不一致有没有遇到过,怎么解决的。 一道sql的题,一张表,用户id和登录日期,查找连续两天登陆的用户。 规则引擎相关的问题。 规则多了怎么管理,有完全相同的规则怎么解决,多个相似的名字怎么解决 写sql。求一个省份下的uv最高的城市 进阶考察: 出现慢结点怎么处理(考察数据…
计算机网络基础知识总结
如果说计算机把我们从工业时代带到了信息时代,那么计算机网络就可以说把我们带到了网络时代。随着使用计算机人数的不断增加,计算机也经历了一系列的发展,从大型通用计算机 -> 超级计算机 -> 小型机 -> 个人电脑 -> 工作站 -> 便携式电脑 -> 智能手机终端等都是这一过程的…
python 数据挖掘算法简要
数据挖掘是通过对大量数据的清理及处理以发现信息,并应用于分类,推荐系统,预测等方面的过程。 分析业务需求后,选择应用于需求业务相关的数据:业务原始数据、公开的数据集、也可通过爬虫采集网站结构化的数据。明确业务需求并选择好针对性的数据是数据挖掘的先决条件。 python字符串处理…
如果你也想做实时数仓…
数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 数据仓库是伴随着企业信息化发展起来的,在企业信息化的过程中,随着信息化工具…
Kafka 常用命令总结
同时,也欢迎关注我的微信公众号 AlwaysBeta,更多精彩内容等你来。 在 0.9.0.0 之后的 Kafka,出现了几个新变动,一个是在 Server 端增加了 GroupCoordinator 这个角色,另一个较大的变动是将 topic 的 offset 信息由之前存储…
真的,Kafka 入门一篇文章就够了
Kafka 是由 Linkedin 公司开发的,它是一个分布式的,支持多分区、多副本,基于 Zookeeper 的分布式消息流平台,它同时也是一款开源的基于发布订阅模式的消息引擎系统。 消息:Kafka 中的数据单元被称为消息,也被称为记录,可以把它看作数据库表中某一行的记录。…
熬夜肝了这一份C++开发学习路线
大家好,我是帅地。 之前写过几篇学习路线的文章 前端开发学习路线 Java 后端开发学习路线 一般开发岗主流的就是 Java 后台开发,前端开发以及 C++ 后台开发,现在 Go 开发也是越来越多了,
大数据毕业后去什么岗位就业?
大数据毕业后去什么岗位就业?】 大数据专业毕业后比较垂直的就业岗位主要有:数据分析师、数据开发工程师、数据挖掘、数据运营、数据架构师等。 当然大数据专业也并非一定要从事这些直接相关的行业,也可以根据自
【大数据教程】大数据挖掘分析工具集
大数据时代需要大数据挖掘,我习惯把大数据分成四个领域:数据科学、网络科学、空间地理科学和可视化技术。 最近的主要兴趣在空间地理领域,学习如何获取POI,Polygon,经纬度,空间匹配算法和可视化,一个全新领域有带来诸多大数据分析工具的思考和整合。 恰巧看到一篇国外博客列举了大…