知识大陆风潮兴起,应用领域逐渐扩散

463 阅读3分钟

知识图谱是AI走向通用人工智能的依赖技术,由谷歌在 2012 年提出来,这种三元组的数据结构,能够被AI理解。用知识图谱训练的 AI,会具备基础的学习和决策能力。在过去很长的一段时间里,知识图谱的数据收集都在使用着相当传统的方式,而在过去的两个月时间,知识大陆向市场展示了什么叫WEB3.0时代的知识图谱。

知识大陆是知识图谱领域中的新尝试,特别是使用分布式的数据收集方式。知识大陆的第一个主题是唐诗宋词数据收集,在数据采集的过程中,知识大陆并不像过去那样传统头部企业大包大揽的方式,而是将整个主题的数据细分,使得各行各业的不同人群都能参与进来,只需一顿饭的时间便能完成一个简单的数据收集,而由于主题的特殊性,即使是小学生也能参与进来,在采集数据的同时还能同步学习,这令知识大陆真正做到不同群体的覆盖,高质量的数据收集也让大家看到了Epik社区高度的凝聚力。

上图为中国高校知识图谱框架

唐诗宋词数据的成功商用,使人工智能和知识图谱跨入了一个新时代,实现了分布式存储并不只是单纯的灌数据。领域专家和知识矿工的存在令大部分收集所得的数据都能贴合主题,而在见证了唐诗宋词的成功后,越来越多的新需求开始主动与知识大陆接洽。

上图选自EPIK官方PPT

比如说VKG11号【耳机接听挂断控制AI系统】的数据构建,需求主要是采集至少1000条Yes or no的语音数据,当前正在如火如荼的进行中,大家可以积极参与哦~~

截至6月22日为止,知识大陆的总答题数量已经来到了1834594题,整个平台的用户认证数接近11545人,参与平台的用户数不仅只有中国,还遍及了其他各大洲,包括巴西、加拿大、德国、印度尼西亚、日本、尼日利亚、韩国、英国、美国以及越南等十个国家。

上图选自EPIK官方6月24日数据报告

而知识大陆也在持续扩充自己的板块,据悉,除了已经完成的唐诗宋词和正在进行的耳机数据采集,知识大陆已经收到了多个领域多个公司的数据采集需求,包括科普类、体育类、游戏类、地理类、医药类、人文类等等。

这些不同的领域之所以不约而同的找到知识大陆,除了知识大陆的应用场景比较广,和各行各业都能完美契合,更能说明知识大陆的模式是或许是数据收集乃至知识图谱领域的未来,对于数据需求方来说,数据可信度高,储存成本低。对于数据采集方来说,在完成数据收集的同时还能获得价值无限的Token,知识大陆的模式能够真正的做到多方共赢。

知识大陆还有一层更深刻的意义,即知识是没有国界的,只是不应该被任意单独的巨头所垄断,利用区块链技术实现数据权利甚至是知识权利的再分配,将人类共建的知识还给全人类,让每个个个人在互联网协助中获益,这不仅是知识大陆的初心和知识图谱的进步,更是WEB3.0时代为社会赋予的新意义。