首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
数据挖掘
订阅
半庭
更多收藏集
微信扫码分享
微信
新浪微博
QQ
8篇文章 · 0订阅
李鬼见李逵——我用翟天临的论文做了分析
昨天是元宵节,在南京,元宵节一到也意味着这个年过完了,我们也该回到自己的工作岗位上了。都说今年的瓜特别多(葫芦娃的那种),但是过年期间最甜的我想非翟天临的“知网是什么?”莫属了吧。 前段时间,微博上开始不断爆出翟天临学术不端,论文抄袭的消息,以至于牵扯到其导师、院长甚至整个北京…
音乐数据集汇总
接下来会研究一下音乐推荐系统,需要数据来进行算法及工程代码的演示,遂汇总一下网上开源的音乐数据集。 说到音乐数据集第一位肯定是MSD,它包含了100万首歌曲的信息,总量有280GB大小。由于数据量的确较大,它使用了h5的文件压缩格式,并提供了一些code用于读这种文件。 每首歌…
自学机器学习、数据挖掘的几点建议
背景:一直有朋友希望我能介绍下自学机器学习、数据挖掘的经历,然而当我认真回首研究生这两年半,发现浪掉的时间居多,学习的时间太少,积累还不够(虽然校招季收获比较多的数据挖掘相关offer,其实人脉、运气、面试经验等其他因素占了很大比重)。所以在此只能聊聊一些浅显的认识,各位姑妄听之。 本文受众:有兴趣自学机器学习、数据挖掘的学生或程序员(也欢迎科班研究生、业界大拿拍砖,多多提出批评建议,先行谢过)
六个极好的开源数据挖掘工具
随着向一个基于应用的领域过渡,数据则呈现出了指数级增长。然而,大部分数据是非结构化的,因此它需要一个程序和方法来从中提取有用信息,并且将其转换为可理解、可用的形式。而在数据挖掘任务中,有大量的工具可供使用,比如采用人工智能、机器学习,以及其他技术等来提取数据。
爬虫被封怎么办?用Node构建一个私人IP代理池
还记得刚学爬虫的时候,选了一个美女网站来练手,效率极高,看到什么都想爬下来。爬得正高兴呢,出现了一连串错误信息,查看后发现因为爬取太过频繁,被网站封了ip,那时起就有了构建代理ip池的念头。 网上搜索一下代理ip就会发现有很多网站提供,但是稳定好用的都要收费,免费倒也有一堆,但…
33个机器学习常用数据集
现如今构建人工智能或机器学习系统比以往的时候更加容易。普遍存在的尖端开源工具如 TensorFlow、Torch 和 Spark,再加上通过 AWS 的大规模计算力、Google Cloud 或其他供应商的云计算,这些都意味着你可以在下午休闲时间使用笔记本电脑去训练出最前沿的机…
当 Python 遇到了你的微信好友
临近毕业,慢慢的也感伤起来,回想大学这几年,除了技术的成长,最值得庆幸的就是结交了一帮志同道合的好友。后期自己做了公众号,微信好友的数量也越来越多,身边人所扮演的角色也越来越丰富,有早已结婚生子为人父母的同学,有沉迷科研学术的教师,当然也少不了一众还在996的程序猿。事实上,你…