用户9998652402756 的个人主页 - 动态

8月9日打卡，今日学习《Presto在字节跳动的内部实践与优化》：本文介绍了Presto支撑了Ad-hoc查询、BI可视化分析、近实时查询分析等场景。从功能，性能，运维，稳定性方面进行了分析。

8月5日打卡，今日学习《Spark的Shuffle总结分析》：Shuffle就是对数据进行重组，由于分布式计算的特性和要求，在实现细节上更加繁琐和复杂。

8月5日打卡，今日学习《5小时推开Spark的大门》：本文详细介绍了搭建Spark开发环境。主要分两步，Spark的安装，Scala环境的搭建。最后还教大家给IDEA配置Scala插件。

8月4日打卡，今日学习《SparkSQL 在企业级数仓建设的优势》：本文介绍Spark 提供的 Spark SQL 模块更是为使用 Spark 支撑企业数据仓库提供了一个良好的基础设施。

8月3日打卡，今日学习《DolphinDB节点启动时的流计算自动订阅教程》：本文介绍了DolphinDB 内置的流数据框架，这个框架支持流数据的发布、订阅、预处理、实时内存计算、复杂指标的滚动窗口计算等，是一个运行高效、使用便捷的流数据处理框架。

8月2日打卡，今日学习《火山引擎 A/B 测试的思考与实践》：本文讲解了A/B测试的好处以及方法。测试通过控制变量，然后观察点击率的高低来评估实验结果。这种方法具有风险可控，有因果逻辑，复利效应等优点。

8月1日打卡，今日学习《我们为什么放弃 MongoDB 和 MySQL，选择 TiDB》：本文比较MongoDB 、MySQL和TiDB的优缺点，说明随着应用场景的变化，使用的数据库也发生变化。经过实践，最后得出分布式架构式大势所趋。

7月31日打卡，今日学习《Flink实时引擎项目实战》：本文主要介绍了austin-stream模块接入流式处理平台（flink）的实战讲解。这用于实时计算清洗数据。详细介绍了使用流式处理的好处，以及austin代码入门。

7月27日打卡，今日学习《百度BaikalDB在同程艺龙的成功应用实践剖析》：文章介绍了BaikalDB在艺龙的落地实践，总结了几个特性，分别是高可用，高性能，扩展性，低成本，HTAP特性。

7月24日打卡，今日学习《基于代价的慢查询优化建议》：本文介绍了美团对于日均上亿条慢查询的数据量优化，主要使用了代价模型。这个模型从Server层和Engine（存储引擎）层进行操作，分别对应了CPU代价和IO代价。这个模型能在保证质量的情况下进行索引推荐。

7月22日打卡，今天是大数据开班的第一天。第一次接触掘金社区，学习了掘金社区的使用方法文档：本文是对新人使用社区方法文档介绍。我们主要注意的有两部分，一个是浏览器的掘金插件的笔记功能，还有一个是关注社区的活动。