首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
ihades
掘友等级
Data Mining
|
硕士在读
Stay Hungry, Stay Foolish
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
103
文章 68
沸点 35
赞
103
返回
|
搜索文章
赞
文章( 68 )
沸点( 35 )
致敬真神——SVM
对于Support Vector Machine(SVM)你是否停留在调用相关算法包的层面?是否每次想要加深对SVM的理解时却被枯燥的公式劝退?本文将以SVM发展历史时间线为文章组织结构,让您理解SVM基本原理、发展的内在需求以及其公式背后的意义。 SVM自1964年被Vapn…
2019最新k8s集群搭建教程 (centos k8s 搭建)
master、node节点都需要安装kubelet kubeadm kubectl。 安装kubernetes的时候,需要安装kubelet, kubeadm等包,但k8s官网给的yum源是packages.cloud.google.com,国内访问不了,此时我们可以使用阿里云…
现网上的FP-growth算法真的都复现对了吗?
摘要 韩家炜教授等人提出FP-growth(Frequent Pattern growth)算法是频繁模式(Frequent Pattern, FP)挖掘领域的经典算法,其高效性能的背后是强大的信息压缩树——频繁模式树(Frequent Pattern Tree, FPTree…
简明聚类分析入门
摘要 : 以“为什么需要聚类分析这一问题”作为引入,逐步阐述聚类分析领域是如何发展的。这篇文章主要阐述聚类分析的四类方法:划分方法、层次方法、基于密度的方法和基于网格的方法的基本原理以及它们中的代表算法和实现方式。将聚类算法的设计总结为两大核心:划分过程和相似度量的设计。 聚类…
「最全」实至名归,NumPy 官方早有中文教程,结合深度学习,还有防脱发指南
在 Github 上一度蝉联最流行的机器学习和数据科学包 NumPy,已经有了非常之系统的中文文档,回想起当初细啃 NumPy 之时,不少人不得不徘徊于各大搜索引擎及平台反复查找,找到的文档也许还很不系统。现在,如果有什么和 NumPy 的问题,只需要浏览这份官方中文文档就足够…
探索SMOTE算法
SMOTE是一种综合采样人工合成数据算法,用于解决数据类别不平衡问题(Imbalanced class problem),以Over-sampling少数类和Under-sampling多数类结合的方式来合成数据。本文将以Nitesh V. Chawla(2002)的论文为蓝本…
[译]浅析t-SNE原理及其应用
译者注: 本文言简意赅的阐述了数据降维( Dimensionality Reduction technique)技术中PCA以及t-Distributed Stochastic Neighbor Embedding(t-SNE)算法的相关实现原理以及利弊,并且使用Python基…
决策树中信息增益、ID3以及C4.5的实现与总结
决策树其核心是寻找在给定的特征条件下类(Labels or Category)的条件概率分布。构建一颗决策树通常都要经历以下三个步骤: 本文旨在以分类决策树为模型,总结决策树相关思想、实现特征提取、ID3以及C4.5这两个决策树生成算法。 本文数据集采用 李航——《统计学习方法…
KMeans原理、实现及分析
KMeans是一种简单的对给定数据集将其划分成k个簇的聚类算法,数据挖掘十大算法之一,其数学原理也是非常的朴素。本文将根据KMeans的原理将其实现,并对其性能进行分析,讨论其缺陷与探讨业界主流的改进方式。 KMeans 算法的思想是由许多跨学科领域的研究者们经过长时间不断的交…
7个Python特殊技巧,助力你的数据分析工作之路
选自TowardsDataScience,作者:Perter Nistrup,机器之心编译,参与:魔王。 1. Pandas Profiling 2. 使用 Cufflinks 和 Plotly 绘制 Pandas 数据 3. IPython 魔术命令 4. Jupyter 中…
下一页
个人成就
文章被点赞
56
文章被阅读
29,805
掘力值
598
关注了
5
关注者
1,253
收藏集
2
关注标签
11
加入于
2017-05-08