首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
数据分析 ⛵ 面试宝典&实战项目
ShowMeAI
创建于2022-09-06
订阅专栏
数据分析是AI从业者的基本功!ShowMeAI在这里分享基础&最新的工具库教程,也展示趣味/时事数据分析的完整代码流程,还有面试场景下的SQL必学要点!有趣又有料!@ShowMeAI研究中心
等 93 人订阅
共38篇文章
创建于2022-09-06
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
交互式仪表板!Python轻松完成!⛵
本文使用 Kaggle 数据集创建了一个Demo,演示如何使用 Python 调用 ipywidget 模块,快速创建交互式仪表板。快用起来吧~
百倍加速IO读写!快使用Parquet和Feather格式!⛵
本文介绍了 Parquet 和 Feather 两种文件类型,可以提高本地存储数据时的读写速度,并压缩存储在磁盘上的数据大小。大型 CSV 文件的克星!用起来~
就离谱!使用机器学习预测2022世界杯:小组赛挺准,但冠亚季军都错了 ⛵
本文使用机器学习建模对 FIFA 2022世界杯结果进行了预测,赛后将其与真实结果进行比较,可以看出:小组赛到1/4决赛的预测准确率很高,半决赛和决赛的预测准确率为0,冠亚季军无一预测准确。
全自动化数据洞察!数据分布对比可视化!
本文介绍如何使用 Pandas Profiling 的比较报告功能,分析两个数据集的分布差异,完成数据探索分析 (EDA) 的完整流程,为后续分析做准备。
深度解析数据清理和特征工程!5本面向数据科学家的顶级书籍推荐(附下载) ⛵
本文对比筛选了『数据清理』和『特征工程』最值得推荐的5本书,帮助你有效地清理数据、获取干净核心的数据,这是后续建模分析等工作有更好结果的保证。
数据科学家赚多少?数据全分析与可视化 ⛵
本文揭秘全球数据科学岗位的薪资分布情况!以及分析岗位、国家、工作经验、雇佣形式、公司规模对薪资的影响,并贴心提供了求职建议和跳槽Tips!
『航班乘客满意度』场景数据分析建模与业务归因解释 ⛵
本文结合航空出行的场景,使用机器学习建模,详细分析了航班乘客满意度的影响因素:机上Wi-Fi服务、在线登机、机上娱乐质量、餐饮、座椅舒适度、机舱清洁度和腿部空间等。
一文读懂!异常检测全攻略!从统计方法到机器学习 ⛵
本文系统介绍了『单变量异常检测』和『多变量异常检测』识别技术,包括传统的统计方法(四分位距、标准差),以及前沿的机器学习模型(孤立森林、DBSCAN、LOF局部离群因子)。
高手系列!数据科学家私藏pandas高阶用法大全 ⛵
本文汇总介绍了21个 Pandas 进阶用法,能保持代码整洁优雅,更能提高代码效率!这篇是从数据科学家朋友那里搞到的私藏,快一起薅羊毛~
Pandas太慢?快使用Vaex DataFrame,每秒数亿数据算起来 ⛵
本文详细介绍了Vaex这个强大的工具库,能够每秒处理数亿甚至数十亿行数据,而无需将整个数据集加载到内存中。对于大型数据的分析任务,Vaex的效率更高,对硬件/环境的要求更少!pandas升级版!
Python中内置数据库!SQLite使用指南!
使用Python内置库SQLite,可以方便地完成建表、插入数据、查询数据等数据库操作,也可以配合pandas进行灵活使用!高效工具库get!
Pandas中你一定要掌握的时间序列相关高级功能
本文讲解Pandas工具库几个核心函数,能高效处理时间序列:resample、shift、rolling。帮你得心应手处理时间序列数据!
业务数据分析最佳案例!旅游业数据分析!⛵
本文使用『城市酒店和度假酒店的预订信息』,对旅游业的发展现状进行数据分析,包含了完整的数据分析流程:数据读取、数据初览、数据预处理、描述性统计、探索性数据分析、关联分析、相关性分析。
私藏!资深数据专家SQL效率优化技巧
同一个数据分析的需求,不同人的SQL代码效率上会差别很大!本文给大家梳理集中效率优化方法,这也是数据岗面试的高频问题哦!快学起来~
快为你的Jupyter添加这7个扩展,效率upup!
兵欲善其事,必先利其器。对于数据科学家和数据开发工程师们来说,拥有好的工具会大大加速开发效率,本篇ShowMeAI介绍数据科学领域常用IDE Jupyter Notebook的拓展插件。
还在用饼状图?来瞧瞧这些炫酷的百分比可视化新图形(附代码实现)
饼图是用于显示分类数据比例的典型图表,在数据可视化中经常使用,因为它直观且结果容易理解。但我们还有一些炫酷高级的图表可以表示比例或百分比,ShowMeAI在本篇进行介绍。
求职指南!给数据开发的SQL面试准备路径!
大量的数据科学职位需要精通 SQL,它也是数据分析师、数据科学家、数据建模岗最常考核的面试技能。在本篇内容中 ShowMeAI 将梳理汇总所有面试 SQL 问题,按照不同的主题构建练习专项块。
精准用户画像!商城用户分群2.0!
客户分群(客户细分)对于绘制用户画像、构建个性化推广、产品和服务策略,都非常重要。本文讲解此过程中,多种机器学习聚类算法的建模流程与评估模式。
异常值检测!最佳统计方法实践(代码实现)!
数据集中的异常值,对于数据分布、建模等都有影响。本文讲解两大类异常值的检测方法及其Python实现:可视化方法(箱线图&直方图)、统计方法(z分数&四分位距)。
大数据开发!Pandas转spark无痛指南!
Pandas灵活强大,是数据分析必备工具库!但处理大型数据集时,需过渡到PySpark才可以发挥并行计算的优势。本文总结了Pandas与PySpark的核心功能代码段,掌握即可丝滑切换。
下一页