ShowMeAI日报系列全新升级！覆盖AI人工智能工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文等方向。点击查看 历史文章列表，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。

💡 AR 从业者注意了！罗老师带着『Thin Red Line』真的来了！

7月10日晚间，罗永浩在『交个朋友』直播间官宣新创业公司『Thin Red Line』，官网 www.thinredline.com.cn/ 配图为一条细红线。新公司名让人联想到罗永浩曾推出的坚果 Pro 2 细红线版。新公司正准备招人，主招产品经理和设计师。罗永浩此前表示，新的创业选择 AR，相信 AR 才是下一代计算平台。祝福老罗。也祝福AR行业。

AN OPPORTUNITY TO PARTICIPATE DIRECTLY IN THE PLATFORM-LEVEL REVOLUTION（直接参与平台级革命的机会）

工具&框架

🚧 『Mintlify Writer』AI 辅助代码文档生成工具

github.com/mintlify/wr…

用 AI 工具辅助代码文档生成，总共分几步？答：2步！第1步，高亮代码或者将光标放在你想写文档的行上；第2步，点击『Generate Docs(⌘+)』，然后见证奇迹。Mintlify 目前支持 Python、JavaScript、TypeScript、C / C++、PHP、Java等10多种语言，支持包括JSDoc、reST、NumPy、XML、Google等等在内的主流文件字符串格式。

🚧 『Lancer』Python 代码命名级混淆工具

github.com/LeviBoroden…

使用『Lancer』将 Python 代码变成一堆乱码（歌词、字符串）后，仍然可以运行程序。哇哦~

🚧 『bun』速度惊人的 JavaScript 运行时、打包、转译器和包管理器

github.com/oven-sh/bun

相比于 V8 等流行的引擎，『bun』的优点在于更快 & 更省内存（尽管有点难嵌入吧）。研发者的目标是『All in one fast & easy-to-use tool』，扔掉那 1000个 node_modules，用 1 个 bun 就够了。

🚧 『Thrust』C++ 并行算法库

github.com/NVIDIA/thru…

Thrust 建立在已有的并行编程框架（如CUDA、TBB和OpenMP）之上，同时实现了GPU和多核CPU之间的性能可移植性，可以大幅提升编程效率。

🚧 『Shapely』笛卡尔平面几何对象操作分析库

github.com/shapely/sha…

Shapely 是一个 BSD 授权的 Python 包，用于操作和分析平面几何对象。Shapely 使用 GEOS（PostGIS的引擎，以及JTS的移植）。对 GEOS（一个部署广泛的开源几何库）的几何体和操作进行了封装，为单数（标量）几何体提供功能丰富的 Geometry 接口，并为操作几何体阵列提供更高性能的 NumPy ufuncs。

博文&分享

📚 『数据科学数学技能』杜克大学课程

www.coursera.org/learn/datas…

数学又难又枯燥，但的确非常重要！《Data Science Math Skills | Coursera》这门课就讲解了数据科学所需要的几乎所有基础数学知识，对于『数学不耐受』的同学们可谓非常友好。如果你想快速搞定线性代数、微积分和概率论的基础知识，就来听这门课吧！

📚 『深度学习数学工程』免费书

deeplearningmath.org/

深度学习更容易通过数学语言来描述。作者 Benoit Liquet 在《The Mathematical Engineering of Deep Learning》一书中，就对深度学习的数学工程做了完整而简明的概述。本书内容覆盖深度学习基础、CNN、RNN、Transformers、生成对抗网络、强化学习和多种处理技巧。读者可以重点关注书中深度学习模型、算法和操作的数学描述。

数据&资源

🔥 『语言模型即服务(LMaaS)』相关文献列表

github.com/txsun1997/L…

研究&论文

公众号回复关键字日报，免费获取整理好的论文合辑。

科研进展

2022.06.30『计算机视觉』LaserMix for Semi-Supervised LiDAR Semantic Segmentation

2022.07.03『自然语言处理』DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech

2022.07.01『自动驾驶』MMFN: Multi-Modal-Fusion-Net for End-to-End Driving

2022.06.30『强化学习』On the Learning and Learnablity of Quasimetrics

⚡ 论文：LaserMix for Semi-Supervised LiDAR Semantic Segmentation

论文标题：LaserMix for Semi-Supervised LiDAR Semantic Segmentation

论文时间：30 Jun 2022

所属领域：计算机视觉

对应任务：LIDAR Semantic Segmentation，Semantic Segmentation，点云语义分割，语义分割

论文地址：arxiv.org/abs/2207.00…

代码实现：github.com/ldkong1205/…

论文作者：Lingdong Kong, Jiawei Ren, Liang Pan, Ziwei Liu

论文简介：Densely annotating LiDAR point clouds is costly, which restrains the scalability of fully-supervised learning methods./密集注释LiDAR点云的成本很高，这限制了完全监督学习方法的可扩展性。

论文摘要：密集地注释LiDAR点云是昂贵的，这限制了完全监督学习方法的可扩展性。在这项工作中，我们研究了LiDAR分割中未被充分开发的半监督学习（SSL）。我们的核心思想是利用LiDAR点云的强大空间线索来更好地利用未标记的数据。我们提出LaserMix来混合来自不同激光雷达扫描的激光束，然后鼓励模型在混合前后做出一致和自信的预测。我们的框架有三个吸引人的特性。1）通用性。LaserMix对LiDAR的表现形式（例如，范围视图和体素）是不可知的，因此我们的SSL框架可以普遍应用。2) 有统计学依据。我们提供了一个详细的分析，从理论上解释了所提出的框架的适用性。3）有效。对流行的LiDAR分割数据集（nuScenes、SemanticKITTI和ScribbleKITTI）的综合实验分析证明了我们的有效性和优越性。值得注意的是，我们在标签数量减少2到5倍的情况下，取得了比完全监督的同行更有竞争力的结果，并将仅有监督的基准线平均大幅提高10.8%。我们希望这个简明而高效的框架能够促进未来半监督LiDAR分割的研究。代码将被公开提供。

⚡ 论文：DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech

论文标题：DailyTalk: Spoken Dialogue Dataset for Conversational Text-to-Speech

论文时间：3 Jul 2022

所属领域：自然语言处理

对应任务：文本转语音

论文地址：arxiv.org/abs/2207.01…

代码实现：github.com/keonlee9420…

论文作者：Keon Lee, Kyumin Park, Daeyoung Kim

论文简介：We sampled, modified, and recorded 2, 541 dialogues from the open-domain dialogue dataset DailyDialog which are adequately long to represent context of each dialogue./我们从开放领域的对话数据集DailyDialog中抽取、修改并记录了2,541个对话，这些对话的长度足以代表每个对话的背景。

论文摘要：目前大多数的TTS数据集都是单个语料的集合，在风格和元数据方面几乎不包含对话的内容。在本文中，我们介绍了DailyTalk，一个为文本到语音而设计的高质量对话语音数据集。我们从开放领域的对话数据集DailyDialog中取样、修改并记录了2,541个对话，这些对话的长度足以代表每个对话的背景。在数据构建步骤中，我们保持了最初在DailyDialog中注释的属性分布，以支持DailyTalk中的多样化对话。在我们的数据集之上，我们扩展了先前的工作作为我们的基线，其中非自回归TTS是以对话中的历史信息为条件的。我们收集元数据，以便TTS模型能够学习历史对话信息，这是产生语境感知语音的关键。从基线实验结果来看，我们表明DailyTalk可以用来训练神经文本到语音模型，而且我们的基线可以代表上下文信息。DailyTalk数据集和基线代码在CC-BY-SA 4.0许可下可免费供学术界使用。

⚡ 论文：MMFN: Multi-Modal-Fusion-Net for End-to-End Driving

论文标题：MMFN: Multi-Modal-Fusion-Net for End-to-End Driving

论文时间：1 Jul 2022

所属领域：自动驾驶

论文地址：arxiv.org/abs/2207.00…

代码实现：github.com/Kin-Zhang/m…

论文作者：Qingwen Zhang, Mingkai Tang, Ruoyu Geng, Feiyi Chen, Ren Xin, Lujia Wang

论文简介：Inspired by the fact that humans use diverse sensory organs to perceive the world, sensors with different modalities are deployed in end-to-end driving to obtain the global context of the 3D scene./受人类使用不同的感觉器官来感知世界这一事实的启发，不同模式的传感器被部署在端到端驾驶中，以获得3D场景的全局环境。

论文摘要：受人类使用不同的感觉器官来感知世界这一事实的启发，在端到端驾驶中部署了不同模式的传感器来获得三维场景的全局环境。在以前的工作中，摄像头和LiDAR的输入通过transformer进行融合，以获得更好的驾驶性能。这些输入通常被进一步解释为高层次的地图信息以协助导航任务。然而，从复杂的地图输入中提取有用的信息是具有挑战性的，因为多余的信息可能会误导代理人并对驾驶性能产生负面影响。我们提出了一种新的方法，从矢量高清晰度（HD）地图中有效地提取特征，并在端到端驾驶任务中利用这些特征。此外，我们设计了一个新的专家，通过考虑多道路规则来进一步提高模型性能。实验结果证明，与其他方法相比，所提出的这两项改进使我们的代理取得了卓越的性能。

⚡ 论文：On the Learning and Learnablity of Quasimetrics

论文标题：On the Learning and Learnablity of Quasimetrics

论文时间：30 Jun 2022

所属领域：强化学习

对应任务：Q-Learning

论文地址：arxiv.org/abs/2206.15…

代码实现：github.com/ssnl/poisso…

论文作者：Tongzhou Wang, Phillip Isola

论文简介：In contrast, our proposed Poisson Quasimetric Embedding (PQE) is the first quasimetric learning formulation that both is learnable with gradient-based optimization and enjoys strong performance guarantees./相比之下，我们提出的Poisson Quasimetric Embedding（PQE）是第一个既可以用基于梯度的优化学习，又享有强大性能保证的quasimetric学习表述。

论文摘要：我们的世界充满了不对称性。重力和风等因素可以使去一个地方比回来更容易。诸如家谱图和引文图这样的社会人工记录本身就是有方向性的。在强化学习和控制中，最佳目标到达策略很少是可逆的（对称的）。在这些不对称的结构上支持的距离函数被称为准计量。尽管它们经常出现，但对准度量学习的研究却很少。我们的理论分析显示，一类常见的学习算法，包括无约束的多层感知器（MLPs），被证明无法学习到与训练数据一致的类度量。相比之下，我们提出的Poisson Quasimetric Embedding（PQE）是第一个既可以用基于梯度的优化学习，又享有强大性能保证的类比学习表述。在随机图、社会图和离线Q-learning上的实验证明了它比许多普通基线的有效性。

我们是 ShowMeAI，致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！点击查看 历史文章列表，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。

作者：韩信子@ShowMeAI
历史文章列表
专题合辑&电子月刊
欢迎回复，拜托点赞，留言推荐中有价值的文章、工具或建议，我们都会尽快回复哒~

罗永浩新公司准备招人，AI写一篇代码文档只需2步，如何优雅地乱搞Python代码、一大波数学资料来袭！AI前沿论文 | ShowMeAI资讯日报