首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大数据
佩棋wa
创建于2022-09-05
订阅专栏
该专栏记录的是大数据学习,包括数据开发,数据分析等
等 11 人订阅
共22篇文章
创建于2022-09-05
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
数据分析能力篇---业务理解
理解业务是做分析最重要的一点,最重要的一个背景知识。而理解业务的关键又在“收集信息”上,因为企业的业务形态千变万化,不可能有一个人、一门课或者一本书,把所有的业务形态归纳总结,做成现成的。
分箱
分箱是数据分析与数据挖掘中很常用的一种方法,分箱可以将特征的取值按照某种规则进行分类,将特征的取值精度由细变粗。
数据分析之APP用户活跃度预测
本文章是对项目源代码的讲解,APP用户活跃预测项目基于脱敏和采样后的数据信息,预测未来一段时间活跃的用户
数据分析之如何选择合适的模型
模型的选择也是需要一些技巧性和操作的,最重要的是我们所选择的模型最后的一个性能指标有提升,而且效果比较好的话,这个模型就是没有问题的。
数据分析之特征工程的重要性
特征工程除了构建特征和特征选择以外,还包含数据预处理 数据预处理。我们去做一些数据分析与挖掘实践的时候,我们也可以与严格按照这种方式来去进行。
数据分析之问题理解和评估指标
数据分析进阶离不开数据挖掘的融入,本篇文章作为数据分析进阶的开端,具体讲述了问题理解,评价指标和离线验证
数据分析之超强拟合能力的神经网络
本文章介绍的是拥有超强拟合能力的神经网络,介绍了神经网络的性质和能力,基本结构和分类。拓展讲述了其中的激活函数,介绍了有监督学习、无监督学习、半监督学习和强化学习。
数据分析之经典模型---支持向量机
本文章给大家介绍一个经典模型---支持向量机,具体介绍硬间隔SVM、软间隔SVM以及非线性SVM,利用scikit-learn实现该模型
数据分析之关联规则分析应用
Apriori关联规则概述 Apriori是一种常用的数据关联规则挖掘方法,它可以用于找出数据中频繁出现的数据集合。找出这样的一些频繁集合有利于决策,是常用的一种分析方法
数据分析实战---红楼梦文本聚类
本实战内容对四大名著之一的《红楼梦》进行文本聚合,预测剧情趋势和对人物词频进行分析,另外包括对章节聚类及可视化
数据分析算法应用之Kmeans无监督聚类的强大
“物以类聚,人以群分”,本篇文章给大家介绍数据的“群分”算法---K-Means,讲述K-Means的计算原理和调用方法。
数据分析算法应用之从决策树到GBDT的优化
本文介绍了多分类问题和回归问题的概念和应用,并以实例加概念的形式重点介绍了决策树模型以及GBDT模型
数据分析---用户画像:如何真正了解用户需求?
问:如何真正了解用户的需求,使我们分析出来的数据更有针对性? 答:使用用户画像。 本文章将为读者们详细介绍用户画像(包括用户画像的概念、应用场景等)
数据分析模型---AARRR模型和RFM模型
该文章以图文结合的形式向大家介绍了数据分析的两个经典模型---AARRR模型和RFM模型,加上模型的应用场景方便各位读者了解。
数据分析思维拓展之逻辑树分析、多维度拆解分析、多个变量间的相关性分析
本篇文章介绍了逻辑树分析、多维度拆解分析、多个变量间的相关性分析3种数据分析方法,以大量的图解和应用案例方便大家理解。
数据分析思维拓展之时间序列分析思路
该文章是对比分析和分类分析的补充,讲述了时间序列分析的思路,包括时间序列分析的用途,对时间序列数据进行详细讲解及处理方法
数据分析思维拓展之对比分析与分类分析
本文章对数据分析过程在常用到的对比分析和分类分析作了详细的介绍,讲述两种方法之间的关系,各自的应用场景及注意事项等
数据分析实战---墨西哥人肥胖程度
本文章重点体现python在数据分析领域的应用及数据分析报告的撰写,利用kaggle的数据集对墨西哥人肥胖程度数据做了可视化分析
数据分析之python进阶1.0(时间序列数据处理)
本文章是数据分析系列中python进阶学习的第一篇文章,介绍了在日常学习或工作中难免遇到的时间序列数据的处理方法。
数据分析之必备技能---数据分析报告
学习数据分析,必须要学习的内容就是撰写数据分析报告。本文章介绍的是数据分析报告的重要组成部分,并且通过实例让大家对数据分析报告用一个更深层次的认识。
下一页