首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
数据分析
订阅
xulao3
更多收藏集
微信扫码分享
微信
新浪微博
QQ
5篇文章 · 0订阅
Word2Vec随记
Word2vec是一个基于神经网络的语言模型,设计目标是用来计算概率P(w|context),即词w在其上下文context下的条件概率。这里的context是一个句子中词w周围紧连着的n个词。有了P(w|context),就可以用类似n-gram模型的方法计算出一个句子的概率…
Python 排序算法[一]:令你茅塞顿开,却又匪夷所思
算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,能够对一定规范的输入,在有限时间内获得所要求的输出。如果一个算法有缺陷,或不适合于某个问题,执行这个算法将不会解决这个问题。不同的算法可…
Python爬虫--- 1.5 爬虫实践: 获取百度贴吧内容
从网上爬下特定页码的网页。 对于爬下的页面内容进行简单的筛选分析。 找到每一篇帖子的 标题、发帖人、日期、楼层、以及跳转链接。 将结果保存到文本。 在编码之后就是: 西部世界。 链接的末尾处:&ie=utf-8 表示该连接采用的是utf-8编码。 Python3相对于Pytho…
Python分析信用卡反欺诈(下)——两种采样方法解决数据不平衡及效果分析、模型调参示例
关于信用卡反欺诈分析,之前已经写了一篇上,见下面超链接,最好先看下这片文章,了解下大致情况,再来看本文;本文主要是针对前面一篇文章中提到的数据不平衡,采取下采样和过采样的办法规避,并试着对比二者的效果
论道经营分析体系的建设 - 《用数据决策》读后感
公司内部的报表体系,前后经过了3批人员的3次重大改动,但是仍然处于很尴尬的处境。是我们不够努力吗,显然不是。我们开发了几百张各种各样的报表,但是令人满意的几乎没有。随着我们踩坑越来越多,我们也慢慢发现了,在报表体系方面,我们缺的不是技术。 从理论开始,到实际可以操作的步骤结束,…