我在GitHub发现了一个不错的NLP开源社区

285 阅读3分钟

       GitHub 在开源世界的受欢迎程度自不必多言,疫情期天天宅家,有点百无聊赖,这几天上网逛GitHub时无意间发现了一个还不错的NLP社区(王纸在这github.com/intersystem…),应该是近期刚刚才开放的,着实眼前一亮,来跟大家分享一哈……

相关开源代码可以直接点进去了解

这个新社区是InterSystems iKnow提供的NLP技术,可以非常便捷的把这项技术内嵌到 基于InterSystems IRIS数据平台,并通过该平台实现搜索和查找用户案例的作用。当然了,在不基于IRIS数据平台的应用和业务流程的情况下我等普通开发人也是可以使用的,也就是说无论是不是InterSystems的现有客户都能使用,这点赞一个。另一方面,使用者还可以自行DIY定制技术、调优和扩展语言模型。相信这个在当下各种企业不断缩减预算的趋势下,对不断要求工作自动化的企业吸引力还是蛮大的。

关于InterSystems iKnow,咳咳,我想有必要进一步再解释一下,毕竟咱们使用还是要在了解的基础下不是~InterSystems iKnow其实是完全基于句子的句法结构来识别定义实体的短语边界,而不是依赖于预先设定好的词典或预先训练的模型,因此它还算比较适合于对新语料库的初步探索。iKnow实体在NER意义上不是命名实体,而是需要一起考虑的词组,它们代表文本作者整体所创造出的概念或关系。且多年来,iKnow引擎已作为InterSystems IRIS数据平台上的嵌入式服务提供,将其与数据库打包在一起有明显优势,可以将来自多个文档的索引结果存储在单个存储库中,从而通过实际的api支持整个存储库范围的分析(具体在此不做细聊,大家有空可研究IRIS 的iKnow文档文章哈)。

另外在建立iKnow上,iKnow引擎的源代码是用C ++编写的,包括用于与Microsoft Visual Studio 2019社区版一起构建的.sln文件和用于在Linux / Unix中进行构建的Makefile。如果有什么好的idea、引擎代码和语言模型也可以自行在上面编辑发布,咱们一起多学学习学习~~

想要了解更多有关InterSystems iKnow的信息可以在开源文件下方查看

所以,InterSystems iKnow的开源对实现智能应用还是有一定帮助的,目测这个NLP社区又是一个工具、资源的对外开放的宝地,有需要的伙伴们要利用好啊~

另外插播一些个怎么能把 GitHub 用的6的小方法,都是和朋友一起研究&自己琢磨&反复实践后的招儿~你在 GitHub 上搜代码儿时,都是怎么找的?是不是像这样,在搜索框里直接输入想找的内容,然后不断在列表里翻来翻去?如下图?

no,no,no!其实越详细、越明确的搜索方式将更有利于我们的精准获取,方法一:准确搜索仓库标题和详细描述及README;方法二:准确搜索 star & fork 值大于多少;方法三:准确搜索仓库得size……更多方法还在持续琢磨中~相信我,这样搜索使用起来会便捷很多的,起码比起直接搜一个关键词不停的翻页点开找效率高多了吧~

Ok,言归正传,有关InterSystems iKnow开源的事大家如果感兴趣可以登录开头网址发现更多,有新发现也别忘了上来跟大家伙分享分享啊hhh~