首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
1
订阅
用户76504731982
更多收藏集
微信扫码分享
微信
新浪微博
QQ
85篇文章 · 0订阅
从0开始学大数据-数据仓库理论篇
数据仓库(DW)是一个 面向主题的、集成的、稳定的、随时间变化的数据的集合,以用于支持管理决策过程。 主题是指用户使用数据仓库进行决策时所关心的重点领域。数据仓库通过一个个主题将多个业务系统的数据加载到一起,为了各个主题(如:用户、订单、商品等)进行分析而建,操作型数据库是为了…
bin-data 大数据可视化平台
参考阿里DataV来实现的一套数据可视化配置系统,主要实现对百度地图的多拽生成和动态配置。 文档及预览,后续持续更新... 文档持续更新中...
基于大数据的用户行为预测
随着智能手机的普及和APP形态的愈发丰富,移动设备的应用安装量急剧上升。用户在每天使用这些APP的过程中,也会产生大量的线上和线下行为数据。这些数据反映了用户的兴趣与需求,如果能够被深入挖掘并且合理利用,可以指导用户的运营。若能提前预测用户下一步的行为,甚至提前得知用户卸载、流…
深入分析大数据时代中的数据仓库技术
众所周知,当前是一个数据爆炸的时代,大数据背景下的数据治理是每一个企业应该重点考虑的问题。例如金融机构、电信运营商这种“传统”行业每日需要处理的数据量都已经十分巨大了,中小型互联网公司都已经握着上千万日活了,就更不要说腾讯,阿里这样的互联网巨头。 以电信运营商为例,一个省级的电…
大数据概述:传统数据与大数据的区别
1、企业内部管理系统 ,如员工考勤(打卡)记录。 1、数据增长速度比较缓慢,种类单一。 2、数据量为GB级别,数据量较小。 1、数据保存在数据库中。处理时以处理器为中心,应用程序到数据库中检索数据再进行计算(移动数据到程序端) 1、数据量越来越大、数据处理的速度越来越慢。 2、…
大数据平台CDH搭建
1. CDH简介 CDH is Cloudera’s 100% open source platform distribution, including Apache Hadoop and built specifically to meet enterprise demand…
想学大数据?大数据处理的开源框架推荐
本文讨论大数据处理生态系统和相关的架构栈,包括对适应于不同任务的多种框架特性的调研。除此之外,文章还从多个层次对框架进行深入研究,如存储,资源管理,数据处理,查询和机器学习。 使用门槛的降低是互联网上数据最初增长的驱动力。随着智能手机和平板电脑等一系列新设备的出现,这一趋势得以…
大数据金融风控全流程解析
众所周知,金融是数据化程度最高的行业之一,也是人工智能和大数据技术重要的应用领域。随着大数据收集、存储、分析和模型技术日益成熟,大数据技术逐渐应用到金融风控的各个环节。个推作为专业的数据智能服务商,拥有海量数据资源,在智慧金融领域也推出了相应的数据解决方案,为金融客户提供智能反…
大数据稳定性体系建设
大数据稳定性建设 组件建设 业务赋能 数据治理 kylin、elasticsearch、clickhouse 数据稳定检查
安利一个Python大数据分析神器!
对于Pandas运行速度的提升方法,之前已经介绍过很多回了,里面经常提及Dask,很多朋友没接触过可能不太了解,今天就推荐一下这个神器。 Pandas和Numpy大家都不陌生了,代码运行后数据都加载到RAM中,如果数据集特别大,我们就会看到内存飙升。但有时要处理的数据并不适合R…