首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大数据
保持时刻反思与复盘
创建于2024-06-25
订阅专栏
收集大数据相关的资料
等 1 人订阅
共59篇文章
创建于2024-06-25
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Doris 报错及解决方案收集
一、doris 单节点的be报错误,启动不了了 fail to load tablet beca
Doris Job的使用局限
问题来源 企业需要根据经营情况将多个系统的数据同步到一处进行统计然后出报表,比如需要从ERP、CRM
查看哪些IP在向kafka的broker生产消息
问题来源 数据采集端正在调试,相关人员告知已经将所有的推送端服务都停止了,为何kafka上相关to
使用StreamLoad向Doris-4.0.1版本的聚合表导数据超时问题
最近将Doris环境的版本从2.1.5升级到4.0.1,升级后验证功能是否都正常时发现使用strea
Milvus会存在SQL注入攻击吗?
Milvus 会存在 SQL 注入攻击吗?别慌,它压根不用 SQL! 最近有朋友问我:“Milvu
Java开发(数据方向)面试复盘|踩坑实录
一、面试基本信息 面试地点:杭州滨江星澜广场 面试岗位:Java开发(数据方向) 面试时间:昨日下午
Kafka消费端周期性停顿,导致工厂设备甘特图失准
本文记录了一次因 HttpClient连接池耗尽 引发的 Kafka 消费周期性停顿问题。该问题直接导致工厂设备状态数据计算错误,使得上层 甘特图(Gantt Chart) 显示的停机时间与实际严
Doris FE内存占用持续上升直至无法使用
环境 操作系统:CentOS Linux release 7.6.1810 (Core) Doris版本:doris-2.1.5-bin-x64 Java版本:jdk1.8.0_181 3台机器组成的
MySQL和Doris开窗函数LAG执行时的区别
目标表的表结构 在mysql8中执行报错的SQL 上述的SQL在MySQL执行时会报SQL错误[1292][22001] incorrect datetime value:'',而在Doris下不会有
大数据面试题之Hudi(1)
Hudi的发展历史 Hudi(Hadoop Upserts and Deletes Incrementally)的发展历史可以追溯到2016年,最初由Uber的工程师团队开发,目的是为了解决大规模数据
大数据面试题之数据湖
什么是数据湖 数据湖(Data Lake)是一个大型数据存储和处理系统, 它能够存储各种类型和格式的数据,包括结构化数据、半结构化数据和非结构化数据。以下是关于数据湖的详细解释: 定义与特点 数据存储
大数据面试题之ElasticSearch(2)
ElasticSearch的单播、多播和广播 在Elasticsearch集群中,节点间的发现和通信机制是确保集群稳定性和可扩展性的关键部分。Elasticsearch提供了三种不同的发现方式来帮助节
大数据面试题之ElasticSearch(1)
ElasticSearch介绍 Elasticsearch 是一个开源的、分布式的搜索引擎和分析引擎,建立在Apache Lucene库之上。它被广泛用于全文检索、结构化搜索、数据分析以及实时应用中。
大数据面试题之Presto[Trino](6)
如何诊断Presto查询慢的问题? 诊断Presto查询慢的问题通常需要一个系统化的方法,结合监控、日志分析、查询优化策略和系统配置调整等多个方面。以下是一些具体的步骤和建议: 1、查看Presto
大数据面试题之Presto[Trino](5)
Presto的扩展性如何? Presto的设计特别强调了其扩展性,使其能够高效处理大规模数据集的查询。以下是Presto扩展性的几个关键方面: 水平扩展:Presto采用分布式架构,可以轻松地通过增
大数据面试题之Presto[Trino](4)
如何监控和调优Presto查询性能? 监控和调优Presto查询性能是一个涉及多个层面的过程,包括数据存储优化、SQL查询优化、系统配置调整以及利用Presto内置的监控和管理工具。以下是一些关键的步
大数据面试题之Presto[Trino](3)
Presto如何处理数据的聚合操作? Presto处理数据聚合操作的方式遵循SQL标准,主要通过GROUP BY子句来实现对数据集的分组聚合。以下是Presto处理聚合操作的基本步骤和高级特性: 1、
大数据面试题之Presto[Trino](2)
描述Presto中的Connector是什么? 在Presto中,Connector是连接Presto查询引擎与外部数据存储系统的桥梁。它是一个插件化的组件,允许Presto与多种不同的数据源无缝集
大数据面试题之Presto[Trino](1)
什么是Presto,它主要用于解决什么问题? Presto是一款高性能、分布式的SQL查询引擎,专为大规模数据分析而设计。它最初由Facebook开发,并于2013年开源。Presto的主要目标是解决
大数据面试题之数据库(3)
数据库有必要建索引吗? 数据库建立索引是非常必要的,但是否为每个表或每个列创建索引则需根据实际情况权衡。索引的存在可以带来诸多好处,同时也伴随着一些成本。以下是建立索引的主要原因及考虑因素: 建立索引
下一页