获得徽章 0
8月9日打卡,今日学习《Presto在字节跳动的内部实践与优化》:本文介绍了Presto支撑了Ad-hoc查询、BI可视化分析、近实时查询分析等场景。从功能,性能,运维,稳定性方面进行了分析。
评论
8月5日打卡,今日学习《Spark的Shuffle总结分析》:Shuffle就是对数据进行重组,由于分布式计算的特性和要求,在实现细节上更加繁琐和复杂。
评论
8月5日打卡,今日学习《5小时推开Spark的大门》:本文详细介绍了搭建Spark开发环境。主要分两步,Spark的安装,Scala环境的搭建。最后还教大家给IDEA配置Scala插件。
评论
8月4日打卡,今日学习《SparkSQL 在企业级数仓建设的优势》:本文介绍Spark 提供的 Spark SQL 模块更是为使用 Spark 支撑企业数据仓库提供了一个良好的基础设施。
评论
8月3日打卡,今日学习《DolphinDB节点启动时的流计算自动订阅教程》:本文介绍了DolphinDB 内置的流数据框架,这个框架支持流数据的发布、订阅、预处理、实时内存计算、复杂指标的滚动窗口计算等,是一个运行高效、使用便捷的流数据处理框架。
评论
8月2日打卡,今日学习《火山引擎 A/B 测试的思考与实践》:本文讲解了A/B测试的好处以及方法。测试通过控制变量,然后观察点击率的高低来评估实验结果。这种方法具有风险可控,有因果逻辑,复利效应等优点。
评论
8月1日打卡,今日学习《我们为什么放弃 MongoDB 和 MySQL,选择 TiDB》:本文比较MongoDB 、MySQL和TiDB的优缺点,说明随着应用场景的变化,使用的数据库也发生变化。经过实践,最后得出分布式架构式大势所趋。
评论
7月31日打卡,今日学习《Flink实时引擎项目实战》:本文主要介绍了austin-stream模块接入流式处理平台(flink)的实战讲解。这用于实时计算清洗数据。详细介绍了使用流式处理的好处,以及austin代码入门。
评论
7月27日打卡,今日学习《百度BaikalDB在同程艺龙的成功应用实践剖析》:文章介绍了BaikalDB在艺龙的落地实践,总结了几个特性,分别是高可用,高性能,扩展性,低成本,HTAP特性。
评论
7月24日打卡,今日学习《基于代价的慢查询优化建议》:本文介绍了美团对于日均上亿条慢查询的数据量优化,主要使用了代价模型。这个模型从Server层和Engine(存储引擎)层进行操作,分别对应了CPU代价和IO代价。这个模型能在保证质量的情况下进行索引推荐。
评论
7月22日打卡,今天是大数据开班的第一天。第一次接触掘金社区,学习了掘金社区的使用方法文档:本文是对新人使用社区方法文档介绍。我们主要注意的有两部分,一个是浏览器的掘金插件的笔记功能,还有一个是关注社区的活动。
评论