首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
数据分析
订阅
郑小歪
更多收藏集
微信扫码分享
微信
新浪微博
QQ
11篇文章 · 0订阅
『 Spark 』7. 使用 Spark DataFrame 进行大数据分析
spark 系列第 7 篇,教你如何使用 apache spark dataframe 进行大数据分析
Python 正则表达式学习
re 模块使 Python 语言拥有全部的正则表达式功能。这篇文章主要介绍 Python 中常用的正则表达式处理函数。
漫谈数据仓库之基本概念总结(不断更新)
0x00 前言 整理一些数据仓库中的常用概念。大部分概念不是照搬书上的准确定义,会加入很多自己的理解。 0x01 概念 数据仓库(Data Warehouse) 数据仓库,英文名称为 Data Warehouse,可简写为 DW 或 DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
使用 Python 定制词云
本实验将使用 Python 的 wordcloud 扩展包制作词云,生成图片保存。并介绍如何改进 wordcloud 扩展包使其能显示中文字符,最后介绍如何使用自己喜欢的图片定制词云图片轮廓。
学习Python:做数据科学还是网站开发?
文章提到了Python作为网络开发技能的市场需求并不是很高,这点感觉并不是没有根据。作为一篇软文,它成功地激起了我学习数据科学的兴趣,而原因嘛,自然就是做数据科学工作的工资比一般开发工作,高很多。(按文章中信息图的数据,比一般岗位的年薪高5万美刀!!!)
漫谈数据仓库之维度建模
下面的内容,是笔者在学习和工作中的一些总结,其中概念性的内容大多来自书中,实践性的内容大多来自自己的工作和个人理解。由于资历尚浅,难免会有很多错误,望批评指正! 概述 数据仓库包含的内容很多,它可以包括架构、建模和方法论。对应到具体工作中的话,它可以包含下面的这些内容: 以 Hadoop、Spark、Hive 等组建为中心的数据架构体系。 各种数据建模方法,如维度建模。 调度系统、元数据系统、ETL 系统、可视化系统这类辅助系统。