初识大数据-CSDN博客

117 阅读1分钟
相关网址:
www.kaggle.com(大数据分析竞赛平台)
GitHub(可分享数据结果)
rpubs.com (发布产品)
shinyapps.io
cran.r-project.org(R的安装网址)
rstudio.com   (RStudio的获取与安装)

大数据分析:

R语言{
	1.什么是R: 数据分析及可视化的平台
	2.特点:支持多平台,开源
	3.可实现:数据获取--数据清理--数据分析--结果分析
	
	数据分析:
	①探索性数据分析(需要写readme文件,进行说明)
	
	统计推断:
	基于数据得出正式结论的过程
	--不确定性
	--结论+结论是错误的概率(出错的概率小于5%,即可认为其是正式的结论)
	
	回归分析:
	1)线性模型拟合数据
	2)预测(数据科学的目标)
	散点图
	
	机器学习:
	分类问题
	
	
	开发数据产品:
	GoogleVis 
	manipulate
	rCharts(制作交互式JavaScript可视化作品)
	Shiny(制作嵌入网页的交互式R程序的平台)
	slidify(很像PPT)
	
}

CDA{
	CDA level
	CDA level II
	CDA level III
	
}