大数据

大数据

大数据

收集大数据相关的资料

等 1 人订阅共60篇文章创建于2024-06-25

Java线程及线程池的相关的问题

线程池状态：5种（RUNNING/SHUTDOWN/STOP/TIDYING/TERMINATED），控制任务处理生命周期。线程状态：6种（NEW/RUNNABLE/BLOCKED/W

19天前
12
点赞
评论

Doris 报错及解决方案收集

一、doris 单节点的be报错误，启动不了了 fail to load tablet beca

1月前
59
点赞
评论

Doris 报错及解决方案收集

Doris Job的使用局限

问题来源企业需要根据经营情况将多个系统的数据同步到一处进行统计然后出报表，比如需要从ERP、CRM

1月前
27
点赞
评论

查看哪些IP在向kafka的broker生产消息

问题来源数据采集端正在调试，相关人员告知已经将所有的推送端服务都停止了，为何kafka上相关to

1月前
36
点赞
评论

使用StreamLoad向Doris-4.0.1版本的聚合表导数据超时问题

最近将Doris环境的版本从2.1.5升级到4.0.1，升级后验证功能是否都正常时发现使用strea

1月前
20
点赞
评论

使用StreamLoad向Doris-4.0.1版本的聚合表导数据超时问题

Milvus会存在SQL注入攻击吗？

Milvus 会存在 SQL 注入攻击吗？别慌，它压根不用 SQL！最近有朋友问我：“Milvu

1月前
25
点赞
评论

Java开发（数据方向）面试复盘｜踩坑实录

一、面试基本信息面试地点：杭州滨江星澜广场面试岗位：Java开发（数据方向）面试时间：昨日下午

1月前
32
点赞
评论

Kafka消费端周期性停顿，导致工厂设备甘特图失准

本文记录了一次因 HttpClient连接池耗尽引发的 Kafka 消费周期性停顿问题。该问题直接导致工厂设备状态数据计算错误，使得上层甘特图（Gantt Chart）显示的停机时间与实际严

2月前
36
点赞
评论

Kafka消费端周期性停顿，导致工厂设备甘特图失准

Doris FE内存占用持续上升直至无法使用

环境操作系统：CentOS Linux release 7.6.1810 (Core) Doris版本：doris-2.1.5-bin-x64 Java版本：jdk1.8.0_181 3台机器组成的

1年前
526
点赞
评论

MySQL和Doris开窗函数LAG执行时的区别

目标表的表结构在mysql8中执行报错的SQL 上述的SQL在MySQL执行时会报SQL错误[1292][22001] incorrect datetime value:''，而在Doris下不会有

1年前
167
点赞
评论

大数据面试题之Hudi(1)

Hudi的发展历史 Hudi（Hadoop Upserts and Deletes Incrementally）的发展历史可以追溯到2016年，最初由Uber的工程师团队开发，目的是为了解决大规模数据

1年前
445
点赞
评论

大数据面试题之数据湖

什么是数据湖数据湖（Data Lake）是一个大型数据存储和处理系统，它能够存储各种类型和格式的数据，包括结构化数据、半结构化数据和非结构化数据。以下是关于数据湖的详细解释：定义与特点数据存储

1年前
311
点赞
评论

大数据面试题之ElasticSearch(2)

ElasticSearch的单播、多播和广播在Elasticsearch集群中，节点间的发现和通信机制是确保集群稳定性和可扩展性的关键部分。Elasticsearch提供了三种不同的发现方式来帮助节

1年前
285
点赞
评论

大数据面试题之ElasticSearch(2)

大数据面试题之ElasticSearch(1)

ElasticSearch介绍 Elasticsearch 是一个开源的、分布式的搜索引擎和分析引擎，建立在Apache Lucene库之上。它被广泛用于全文检索、结构化搜索、数据分析以及实时应用中。

1年前
209
点赞
评论

大数据面试题之ElasticSearch(1)

大数据面试题之Presto[Trino](6)

如何诊断Presto查询慢的问题？诊断Presto查询慢的问题通常需要一个系统化的方法，结合监控、日志分析、查询优化策略和系统配置调整等多个方面。以下是一些具体的步骤和建议： 1、查看Presto

1年前
629
点赞
评论

大数据面试题之Presto[Trino](5)

Presto的扩展性如何？ Presto的设计特别强调了其扩展性，使其能够高效处理大规模数据集的查询。以下是Presto扩展性的几个关键方面：水平扩展：Presto采用分布式架构，可以轻松地通过增

1年前
279
点赞
评论

大数据面试题之Presto[Trino](5)

大数据面试题之Presto[Trino](4)

如何监控和调优Presto查询性能？监控和调优Presto查询性能是一个涉及多个层面的过程，包括数据存储优化、SQL查询优化、系统配置调整以及利用Presto内置的监控和管理工具。以下是一些关键的步

1年前
666
点赞
评论

大数据面试题之Presto[Trino](4)

大数据面试题之Presto[Trino](3)

Presto如何处理数据的聚合操作？ Presto处理数据聚合操作的方式遵循SQL标准，主要通过GROUP BY子句来实现对数据集的分组聚合。以下是Presto处理聚合操作的基本步骤和高级特性： 1、

1年前
437
点赞
评论

大数据面试题之Presto[Trino](2)

描述Presto中的Connector是什么？在Presto中，Connector是连接Presto查询引擎与外部数据存储系统的桥梁。它是一个插件化的组件，允许Presto与多种不同的数据源无缝集

1年前
339
点赞
评论

大数据面试题之Presto[Trino](1)

什么是Presto，它主要用于解决什么问题？ Presto是一款高性能、分布式的SQL查询引擎，专为大规模数据分析而设计。它最初由Facebook开发，并于2013年开源。Presto的主要目标是解决

1年前
356
点赞
评论