首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
banksy
更多收藏集
微信扫码分享
微信
新浪微博
QQ
28篇文章 · 0订阅
Flink背压问题:从原理到源码
Flink对于背压的处理是通过在任务传递之间设置有界容量的数据缓冲区, 当整个管道中有一个下游任务速度变慢,会导致缓存区数据变满,上游任务获取不到可用的缓冲区,自然而然地被阻塞和降速,这就实现了背压。
神策数据知识科普丨关于数据分析模型的十问十答
你想知道的,都在这里!本文是神策数据「十问十答」科普系列文章的第一期,围绕数据分析模型展开。 1 Q:常用的数据分析模型有哪些? A:神策数据总结了企业常用的数据分析模型,包括:事件分析、漏斗分析、留
大数据前端团队生存指南
本文会简单介绍大数据、大数据前端团队以及可落地的演进方向。 ps.针对数据前端团队10人及以内的中小厂。 开始前问几个问题: 你了解大数据技术吗? 为什么需要大数据前端团队(和大数据有什么关联)?
大数据Hadoop之——新一代流式数据湖平台 Apache Hudi
Hudi(Hadoop Upserts Deletes and Incrementals),简称Hudi,是一个流式数据湖平台,支持对海量数据快速更新,内置表格式,支持事务的存储层、 一系列表服务、数
完爆90%的性能毛病,数据库优化八大通用绝招!
毫不夸张的说咱们后端工程师,无论在哪家公司,呆在哪个团队,做哪个系统,遇到的第一个让人头疼的问题绝对是数据库性能问题。如果我们有一套成熟的方法论,能让大家快速、准确的去选择出合适的优化方案,我相信能够
Spark 大厂面试题
Spark解决什么问题 二 Spark为什么会有自己的资源调度器 三 Spark运行模式 四 Spark常用端口号 五 Spark提交作业参数 六 Spark的transformation算子
手把手教你 Spark 性能调优
上周四接到反馈,集群部分 spark 任务执行很慢,且经常出错,参数改来改去怎么都无法优化其性能和解决频繁随机报错的问题。看了下任务的历史运行情况,平均时间 3h 左右,而且极其不稳定,偶尔还会报错。
Spark学习1-入门必知
前言:spark学习个人总结 。主要参考已有的精品教程,部分加上自己的理解总结。引用未注明部分请联系更改。 spark是由伯克利于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序。2013年,Spark加入Apache孵化器项目。如…
Spark之SparkStreaming案例-kafka
package com.chb.spark.import java.io.import java.util.import java.util.import java.util.import java.util.import java.util.import kafka.seria...
Spark项目打包优化实践
问题描述 在使用Scala/Java进行Spark项目开发过程中,常涉及项目构建和打包上传,因项目依赖Spark基础相关类包一般较大,打包后若涉及远程开发调试,每次打包都消耗多很多时间,因此需对此过程