小 P 为你送上本周值得一看的信息~
有意见、建议与吐槽,欢迎直接给小 P 留言哦~
点击链接即可打开对应网页。
学术前沿
OpenAI 的 GSM8K 数据集是如何创建的
OpenAI 在 2021 年 10 月发表了一篇论文——Training Verifiers to Solve Math Word Problems。该论文讲述了 OpenAI 训练的一个系统,该系统解决小学数学应用题的准确率几乎是经过微调的 GPT-3 模型的两倍。它解决的问题约为真实孩子的 90%:一个 9-12 岁的小样本在 GSM8K 数据集(一个由 8.5K 高质量的、语言多样化的小学数学应用题数据集)的测试中得分 60%,而 OpenAI 的系统在这些相同的问题上得分 55%。许多其他实验室采用了这篇论文,包括 Google 的 PaLM 和 Chain of Thought。
显然,一个成功的实验需要一个好的数据集。SurgeAI 团队与 OpenAI 合作创建了 GSM8K 数据集,他们在 这篇博文 中讲述了该数据集是如何创建的。
技术基础
PAIP 的 Lisp 代码库
该 GitHub 仓库是 Peter Norvig 所著的 Paradigms of Artificial Intelligence Programming 的开源代码库。
由作者本人提供教材电子版及所有 Lisp 代码的下载。
Python 的 eval() 函数为什么很危险
Python 内置的 eval() 函数非常强大,但也会带来安全漏洞。本篇文章就 eval() 函数可能会带来的安全漏洞进行了一番探讨。
大数据分析项目合集
该 GitHub 仓库提供了作者实践过的大数据分析项目,每个项目都包含图文并茂的说明文档与代码,并且提供数据集下载。
工具推荐
lofi.co: 可设置白噪音的在线音乐电台
该网站是一个在线 lofi 音乐电台,可以设置雨声、敲键盘声、篝火声等多种白噪音,适合在学习、工作和阅读等需要专注的情境下使用。
DiceBear: 开源头像库
DiceBear 是一个开源的供设计师和开发人员使用的头像库。有多种风格可以选择,而且提供免费的 API。
感谢阅读,欢迎在评论区留言讨论哦~
P.S. 如果喜欢本篇文章,请多多 点赞,让更多的人看见我们 :D
关注 公众号「SenseParrots」,获取人工智能框架前沿业界动态与技术思考。