Ginger Cannot Cure Cancer: Battling Fake Health News with a Comprehensive Data R

199 阅读2分钟

小知识,大挑战!本文正在参与“   程序员必备小知识   ”创作活动

本文同时参与 「掘力星计划」   ,赢取创作大礼包,挑战创作激励金

介绍:

如今,互联网是获取健康信息的主要来源。 大量虚假健康新闻正在蔓延 互联网,已经成为对公众健康的严重威胁。 大量的研究和研究工作都是假的 新闻检测领域,然而,其中很少有人设计 以应对健康新闻中的挑战。 例如, 虚假健康新闻需要开发可解释性 检测。 为了缓解这些问题,我们构建了一个全面的存储库 FakeHealth,其中包括具有丰富功能的新闻内容、详细解释的新闻评论、社交参与和用户-用户社交网络。 此外,进行探索性分析以了解 数据集的特征,分析有用的模式和 验证用于健康假新闻检测的数据集的质量。 我们还讨论了新的和潜在的未来研究 健康假新闻检测的方向。

总结: 在本文中,我们发布了一个全面的数据存储库 FakeHealth,其中包含两个功能丰富的健康新闻 数据集,以促进假健康新闻领域的研究。 数据存储库包含大量新闻内容, 大规模的社交活动,大型用户-用户社交网络 以及对基本事实的全面解释。 我们进一步进行探索性分析以显示数据集的特征。 通过我们的分析,我们发现 假健康新闻中潜在的有用模式和挑战 检测。 不同类型的假新闻检测方法 也在 FakeHealth 上进行评估。 结果为进一步研究提供了基线,并证明了我们的质量 数据集。 FakeHealth 中的丰富信息使各种新颖和潜在的研究方向成为可能。