首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
FontTian
掘友等级
研发主管
|
高寻真源(山东)教育科技有限公司
Data Science
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
BigData预处理(完整步骤)
(4)数据规约 —— 主要方法包括:数据立方体聚集,维度归约,数据压缩,数值归约,离散化和概念分层等。数据清洗的路子:刚拿到的数据 —-> 和数据提供者讨论咨询 —–> 数...
2
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Maximal Information Coefficient (MIC)最大互信息系数详解与实现
MIC 即:Maximal Information Coefficient 最大互信息系数。 使用MIC来衡量两个基因之间的关联程度,线性或非线性关系,相较于Mutual ...
1
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Ubuntu16.04 安装R与RStudio
首先需要在/etc/apt/sources.deb https://<my.favorite.cran.deb https://<my.favorite.cran.deb ...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
TypeError: Can not convert a float32 into a Tensor or Operation.
TypeError: Can not convert a float32 into a Tensor or Operation.# 类型错误:不能将一个浮动32转换为一个张...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
虚拟机 centos 6.5 扩展根目录分区大小
要想扩充虚拟机centos 空间,必须先扩充虚拟机本身物理空间.本文只描述如何增加centos系统的根目录空间。以下内容,需要输入命令以红色标出,关键输出内容以蓝色标出。D...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Hive 快速上手
本人大数据专业学生,本文档最早是在学校上这门课时候的笔记。后来系统重装重装hive补充完善了这个笔记,今天偶然翻到,看格式应该是我当时打算发布来着,但是后来忘记了。特此补发...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
RDD浅谈
RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
jupyter notebook 删除指定kernel
之前在jupyter notebook上安装过spark magic,现在需要卸载他,一共有四个kernel需要卸载。刚好拿来做例子,步骤十分简单。其中sparkkerne...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Jupyter notebook 编写scala与spark
为了在jupyter notebook上编写scala与spark需要安装Jupyter-Spark与Jupyter-Scala两个jupyter核心(kernel) 本人...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Hadoop集群扩展子节点
上次发了部署八节点hadoop集群的博客,本来想把master也做为一个datanode,后来感觉不太合适,最后决定还是扩展一个子节点吧。安装jdkhttp://blog....
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Hadoop-2.7.4 八节点分布式集群安装
因为之前已经有安装经验了(虚拟机的三节点分布式,按过几次),再加上对Ubuntu还算比较熟悉中间也算少踩了不少坑。因为这次主要是老师要求所以,才打算再自己安装一次apche...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Python中单线程、多线程与多进程的效率对比实验
Python是运行在解释器中的语言,查找资料知道,python中有一个全局锁(GIL),在使用多进程(Thread)的情况下,不能发挥多核的优势。而使用多进程(Multip...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Python中斐波那契数列的四种写法
在这些时候,我可以附和着笑,项目经理是决不责备的。而且项目经理见了孔乙己,也每每这样问他,引人发笑。孔乙己自己知道不能和他们谈天,便只好向新人说话。有一回对我说道,“你学过...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
脚本:获取CSDN文章的访问量
首页:http://blog.csdn.net/fontthrone?viewmode=list 第二页:http://blog.csdn.net/FontThrone/a...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Python类库三两事 - 一次解决
关于类库找不到 问: 类库找不到怎么办? 答: 下载whl文件,安装.链接点这里 问:whl文件怎么安装 答一: cmd命令行安装,将文件放在命令行的路径下,pip ins...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
NLTK 词频统计(一) 词频统计,绘图,词性标注
# 邮箱:fonttian@Gmaill.# CSDN:http://blog.csdn.sys.sys.path.append("..mpl.rcParams[u'fon...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
使用NLPIR 进行中文分词并标注词性
# 邮箱:fonttian@Gmaill.# CSDN:http://blog.csdn.sys.path.append("..sys.cutstr = posseg.cu...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Pandas to_json() 中文乱码,转化为json数组
Pandas进行数据处理之后,假如想将其转化为json,会出现一个bug,就是中文文字是以乱码存储的,也就是\uXXXXXX的形式,首先要解决的就是中文乱码的问题:翻了翻官...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
如何快速掌握Pandas
pandas是python的一个出色的统计类库,同时也是python的科学计算与可视化生态系统中不可或缺的一环,但是如此出色的pandas却十分的简单易上手而且拥有出色的官...
0
评论
分享
FontTian
研发主管 @高寻真源(山东)教育科技有限公司
·
4年前
关注
Pandas matplotlib 无法显示中文
只需要在文件开始动态设置字体配置就可以了,但是要注意,字体设置可能需要尝试多次,比如我一开始设置的win10中的’SamKi’,但是运行结果仍然是中文显示方块,后来我换成了...
0
评论
分享
下一页
个人成就
文章被点赞
8
文章被阅读
72,741
掘力值
659
关注了
0
关注者
6
收藏集
0
关注标签
0
加入于
2021-04-22