💖💖作者:计算机编程小咖 💙💙个人简介:曾长期从事计算机专业培训教学,本人也热爱上课教学,语言擅长Java、微信小程序、Python、Golang、安卓Android等,开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。平常喜欢分享一些自己开发中遇到的问题的解决办法,也喜欢交流技术,大家有技术代码这一块的问题可以问我! 💛💛想说的话:感谢大家的关注与支持! 💜💜 网站实战项目 安卓/小程序实战项目 大数据实战项目 深度学习实战项目
@TOC
人类健康生活方式数据分析与可视化系统介绍
《基于大数据的人类健康生活方式数据分析与可视化系统》面向大四计算机专业毕业设计需求,以 Hadoop 分布式存储与 Spark 内存计算为核心引擎,对大规模人群的多维健康行为日志进行采集、清洗、建模与实时分析;系统提供 Python Django 与 Java Spring Boot 双后端实现,前端统一采用 Vue+ElementUI+Echarts 完成交互式图表渲染,数据层以 MySQL 持久化存储。功能模块覆盖系统首页、个人中心、密码与信息管理,同时在业务层面实现生理衰退关联分析、群体健康画像聚类、生活方式影响归因及特定人群风险预警四类深度洞察,并配套系统公告、简介与大屏可视化,支持从 HDFS 读取原始数据,经 Spark SQL 与 Pandas/NumPy 完成特征工程,最终以动态仪表盘和大屏方式呈现趋势、对比及异常检测结果,为毕业设计提供完整、可复现的大数据技术栈示范。
人类健康生活方式数据分析与可视化系统演示视频
人类健康生活方式数据分析与可视化系统演示图片
人类健康生活方式数据分析与可视化系统代码展示
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName("HealthLifestyle").getOrCreate()
df = spark.read.csv("hdfs://master:9000/health/raw/*.csv", header=True, inferSchema=True)
clean = df.dropna(subset=["age","bmi","sleep","steps","label"]).filter(df.age>0).filter(df.bmi>0).filter(df.sleep>0).filter(df.steps>0)
def correlation_analysis():
numeric = clean.select("age","bmi","sleep","steps","systolic")
corr_df = numeric.summary("mean","stddev").collect()
mean_dict = {r["summary"]:float(r["age"]) for r in corr_df}
std_dict = {r["summary"]:float(r["age"]) for r in corr_df}
normalized = numeric.select([(col(c)-mean_dict["mean"])/std_dict["stddev"] for c in numeric.columns])
corr_mat = normalized.stat.corr()
age_bmi = corr_mat[0][1]
age_sleep = corr_mat[0][2]
age_steps = corr_mat[0][3]
age_sys = corr_mat[0][4]
result = spark.createDataFrame([("age_bmi",age_bmi),("age_sleep",age_sleep),("age_steps",age_steps),("age_sys",age_sys)],["pair","value"])
result.write.mode("overwrite").csv("hdfs://master:9000/health/corr")
def group_portrait():
bucketizer = Bucketizer(splits=[0,25,35,45,55,65,100],inputCol="age",outputCol="age_group")
bucketed = bucketizer.transform(clean)
grouped = bucketed.groupBy("age_group","gender").agg(avg("bmi").alias("avg_bmi"),avg("sleep").alias("avg_sleep"),avg("steps").alias("avg_steps"),count("*").alias("cnt"))
portrait = grouped.withColumn("health_score",col("avg_steps")*0.4+(8-col("avg_sleep"))*10+col("avg_bmi")*(-1))
portrait.write.mode("overwrite").csv("hdfs://master:9000/health/portrait")
def risk_analysis():
assembler = VectorAssembler(inputCols=["age","bmi","sleep","steps"],outputCol="features")
vector = assembler.transform(clean)
splits = vector.randomSplit([0.7,0.3])
train = splits[0]
test = splits[1]
rf = RandomForestClassifier(labelCol="label",featuresCol="features",numTrees=20,maxDepth=5)
model = rf.fit(train)
preds = model.transform(test)
evaluator = MulticlassClassificationEvaluator(labelCol="label",predictionCol="prediction",metricName="accuracy")
acc = evaluator.evaluate(preds)
risk_df = preds.filter(col("prediction")==1).select("age","bmi","sleep","steps","probability")
risk_df.write.mode("overwrite").csv("hdfs://master:9000/health/risk")
correlation_analysis()
group_portrait()
risk_analysis()
人类健康生活方式数据分析与可视化系统文档展示
💖💖作者:计算机编程小咖 💙💙个人简介:曾长期从事计算机专业培训教学,本人也热爱上课教学,语言擅长Java、微信小程序、Python、Golang、安卓Android等,开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。平常喜欢分享一些自己开发中遇到的问题的解决办法,也喜欢交流技术,大家有技术代码这一块的问题可以问我! 💛💛想说的话:感谢大家的关注与支持! 💜💜 网站实战项目 安卓/小程序实战项目 大数据实战项目 深度学习实战项目