首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大数据
天翼云开发者社区
创建于2022-07-26
订阅专栏
主要介绍大数据类型的文章
暂无订阅
共26篇文章
创建于2022-07-26
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Flink 与Flink可视化平台StreamPark教程(开篇)
本文分享自天翼云开发者社区《Flink 与Flink可视化平台StreamPark教程(开篇)》,作者:l****n 介绍 Flink是一个大数据流处理引擎,可以为不同行业提供实时大数据处理解决方案。
数据治理之数据质量评估维度及方法
数据质量管理是指在数据创建、加工、使用和迁移等过程中,通过开展数据质量定义、过程控制、监测、问题分析和整改、评估与考核等一系列管理活动,提高数据质量以满足业务要求。
spark-sql优化简述
1、自适应中reduce参数控制 spark.sql.adaptive.shuffle.targetPostShuffleInputSize用于控制任务Shuffle后的目标输入大小(以字节为单位)。
flinkcdc中checkpoint不成功问题排查
使用flink-1.16和flinkcdc-3.0进行数据接入,采用standalone模式。运行一段时间后checkpoint开始失败,但日志中没有报错信息。
数据治理之数据资产健康度量
随着数据量的不断增加,数据治理已经成为了企业管理里不可或缺的一环。数据治理可以帮助我们更好地进行数据的管理和使用,从而提升数据的质量和价值,同时也能够保证数据的安全和合规。
数据治理之数据分类分级
为了更好地保护数据安全、提高数据管理效率、确保数据合规性,企业需要对数据进行分类分级,根据数据的密级和敏感程度制定不同的管理和使用策略,尽可能做到有差别和针对性的防护,避免敏感数据的防护不足,非敏感数
数据治理的长效机制
数据治理是一个复杂而又富有挑战性的工作,需要各级管理人员和业务部门的积极参与和协作。虽然数据治理的目标“协同、降本、提效、创新”看似简单明了,但在实际操作中却会遇到各种各样的问题。
Doris-HDFS LOAD常见问题汇总(二)
现象描述:导入显示状态为Canceled,URL错误详情显示:quality not good enough to cancel 可能原因: 1、导入的数据字段长度设置有问题,原始数据超长。 2、导入
Doris-HDFS LOAD常见问题汇总(一)
HDFS Load导入失败:no partition for this tuple. • 现象描述:导入显示状态为Canceled,URL错误详情显示 no partition for this tu
如何从ElasticSearch迁移到OpenSearch?
在云搜索产品的选择中,如果用户倾向于开源软件,并且更喜欢免费提供高级功能的工具,那么 OpenSearch 将更适合。
HDFS目录配额(quota)不足导致写文件失败
问题背景与现象 给某目录设置quota后,往目录中写文件失败,出现如下问题“The DiskSpace quota of /tmp/tquota2 is exceeded”。
HBase Sync功能导致HBase入库性能下降
问题背景与现象 HBase入库慢,regionserver日志中大量打印slow sync。 原因分析 1.对比正常写入时间段监控,检查HBase服务整体CPU、……
在使用Flink CDC时,源表没有主键如何处理
在Flink CDC中,当源表没有主键时,需要设置scan.incremental.snapshot.chunk.key-column参数来指定一个或多个列作为切分数据流的关键列。这些列用于在获取增量
用户标签属性流程处理方法
用户画像是一种勾画目标用户、联系用户诉求与设计方向的有效工具,目前用户画像算法普遍存在的问题是数据源较少、数据特征不明显、处理效率低下、分析维度单薄。
构建多维打标签算法
针对各类主题,通过对用户DPI访问数据深度解析,体现数据价值,丰富云产品形态与应用范围;建立行业的标签,能够对用户访问各类APP和网站的行为和内容有深入细致的刻画,为主题运营工作提供必要的数据支撑。
基于运营商数据的用户关系模型建立示例
从社交的角度来看,一种典型的用户关系网络即交往圈。一个用户的交往圈定义为“与用户在一段时间内存在双向联系的所有个体”。根据不同社会群体性质,交往圈又可以分为家庭圈、工作圈、密友圈等。
商场商圈潜客挖掘模型
本文分享自天翼云开发者社区《商场商圈潜客挖掘模型》,作者:石泽涛 超速数据清洗算法: 1)针对同一用户,顺次选取两条记录(第n条、第n+1条),根据第n条记录的停留时间TSn(两停留点时间差),以及与
基于SpringBoot实现单元测试的多种情境/方法(二)
我们是可以在IDEA中借用一些xshell来使用bash命令,但真正要跑测试,比较方便的还是自己搭一台虚拟机出来,如果有不熟悉的可以关注我的Linux专栏,有搭建虚拟机的经验分享。
共铸国云 智领未来 | 泰州,慢节奏跑出新速度
700多年前,马可·波罗游历泰州,称赞“这城不很大,但各种尘世的幸福极多”。幸福,源于泰州自古以来的慢节奏,“早上‘皮包水’,晚上‘水包皮’”这句话便很形象地描绘了老泰州人的惬意生活。 如今,泰州充分
下一页