首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
《数据分析实战 45 讲》 学习笔记
Amaplan
创建于2023-01-16
订阅专栏
111
等 2 人订阅
共27篇文章
创建于2023-01-16
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
《数据分析实战 45 讲》 学习笔记 Day7
12 | 数据集成:这些大号一共20亿粉丝? 12 | 数据集成:这些大号一共20亿粉丝? (kettle视频操作链接) 我们采集的数据经常会有冗余重复的情况。 数据集成就是将多个数据源合并存放在一个
《数据分析实战 45 讲》 学习笔记 Day6
11 | 数据科学家80%时间都花费在了这些清洗任务上? 如何清洗以下数据呢? 缺少数据标注,一定要对数据做标注,数据表头很重要。比如这份数据表,就缺少列名的标注,这样一来我们就不知道每列数据所代表的
《数据分析实战 45 讲》 学习笔记 Day5
09丨数据采集:如何用八爪鱼采集微博上的“D&G”评论 09丨数据采集:如何用八爪鱼采集微博上的“D&G”评论 (视频;流程) 在开始操作前,我先来介绍下今天要讲的主角“八爪鱼”工具。 相比使用 Py
《数据分析实战 45 讲》 学习笔记 Day4
07 | 用户画像:标签化就是数据的抽象能力 用户画像的准则首先就是将自己企业的用户画像做个白描,告诉他这些用户“都是谁”“从哪来”“要去哪”。你可以这么和老板说:“老板啊,用户画像建模是个系统的工程
《数据分析实战 45 讲》 学习笔记 Day3
06 | 学数据分析要掌握哪些基本概念? 商业智能 BI、数据仓库 DW、数据挖掘 DM 三者之间的关系开头中的百货商店利用数据预测用户购物行为属于商业智能,他们积累的顾客的消费行为习惯会存储在数据仓
《数据分析实战 45 讲》 学习笔记 Day2
05丨Python科学计算:Pandas 数据结构:Series 和 DataFrame Series是个定长的字典序列。说是定长是因为在存储的时候,相当于两个 ndarray,这也是和字典结构最大的
《数据分析实战 45 讲》 学习笔记 Day1
04用numpy快速处理数据 使用 NumPy 让你的 Python 科学计算更高效 为什么要用 NumPy 数组结构而不是 Python 本身的列表 list?这是因为列表 list 的元素在系统内