我报名参加金石计划1期挑战——瓜分10万奖池,这是我的第X篇文章,点击查看活动详情
📢 好莱坞全明星版『华强买瓜』:你这 AI 保熟吗?
一起来看看 AI 最近又搞出了什么好玩意儿!哦,原来是华强去好莱坞买!西!瓜!
作者使用了 Deforum Stable Diffusion AI 支持的人工智能重绘视频功能。画面是加载原视频后,直接根据输入文字的变化生成的。一句话换演员,再也不怕明星塌房了←_← (微博作者:大谷Spitzer)
工具&框架
🚧 『XRLocalization』可视化定位工具包和服务器
XRLocalization 是一个基于 Python 的开源可视化本地化工具箱,它是 OpenXRLab 项目的一部分。它具备以下特点:
- 稳健高效的基于特征的大规模视觉定位
- 同时支持离线和在线的视觉定位
- 一个分层框架,可以很容易地整合新的特征和匹配方法
🚧 『Feature-engine』Scikit-Learn 风格的特征工程工具包
feature-engine.readthedocs.io/en/latest/i…
Feature-engine 是一个 Python 库,它有多个转化器,用于设计和选择用于机器学习模型的特征。 Feature-engine 的转化器遵循 Scikit-learn 的功能,采用fit()
和transform()
方法,从数据中学习转化参数,然后进行转化。
🚧 『compose』面向预测工程自动化的机器学习工具
compose.alteryx.com/en/stable/
Compose 是一个用于自动预测工程的机器学习工具。它使得你可以轻松构建预测问题并为监督学习生成标签。
终端用户通过定义标签函数来定义一个感兴趣的结果,然后运行搜索,从历史数据中自动提取训练实例,随后提供给 Featuretools 自动特征工程,再提供给 EvalML 用于自动机器学习,就构建成了一个完整的应用机器学习工作流程。
🚧 『ZLMediaKit』一个基于C++11的高性能运营级流媒体服务框架
ZLMediaKit 是一个基于 C++11 的高性能运营级流媒体服务框架,代码稳定可靠,性能优越。它支持多种协议(RTSP / RTMP / HLS / HTTP-FLV / WebSocket-FLV / GB28181 / HTTP-TS / WebSocket-TS / HTTP-fMP4 / WebSocket-fMP4 / MP4 / WebRTC),支持协议互转;使用多路复用 / 多线程 / 异步网络IO模式开发,并发性能优越,支持海量客户端连接;支持linux、macos、ios、android、windows全平台;支持画面秒开、极低延时,是非常不错的移动嵌入式跨平台流媒体解决方案。
🚧 『XRNerf』神经辐射场 (NeRF)工具包和基准测试
XRNeRF 是一个基于 PyTorch 的神经辐射场(NeRF)的开源代码库,也是 OpenXRLab 项目的一部分。支持的场景类神经渲染方法包括:NeRF、Mip-NeRF、KiloNeRF、Instant NGP;支持的人体类神经渲染方法包括:NeuralBody、AniNeRF、GNR。
博文&分享
👍 『How to create a dashboard in Python with Jupyter Notebook』用Jupyter 创建 dashboard 指南
dashboard-jupyter-notebook.herokuapp.com/app/1
只需要 9 行 Python 代码,就可以在 Jupyter Notebook 中创建仪表板!作者以股票数据表&图表为例,展示了使用 Jupyter Notebook 在 Python 中创建仪表板,并使用 Mercury 框架将 Notebook 转换为交互式 Web 应用程序的全流程。
点击上方第二个链接,体验在线交互版,查看TSLA、COIN、MSFT、PLTR、SNOW、NFLX等股票的数据与走势。
👍 『Enhance Your English Writing』英语写作强化宝典
阅读论文过程中收集整理的一些好的英语用法,可以大体做如下分类,希望能帮助到你的写作:
- General(通用型词汇&话术):好的英语词汇、按文章 Structure 细分话术(Abstract / Introduction / Related Work / Method / ...)、公式相关、数学符号
- Specific Domain(自己小方向的一些话术)
数据&资源
🔥 『Awesome Graph Transformer Papers』 Graph Transformer相关论文大合辑
🔥 『ACL Anthology Corpus』ACL文集语料库数据集
Repo 为 ACL 选集提供全文和元数据(截至 2022 年 9 月,共有 8 万篇文章/海报),还包括 .pdf 文件和 pdf 的 grobid 提取。
研究&论文
公众号后台回复关键字 日报,免费获取整理好的论文合辑。
科研进展
- 2022.09.02 『语言模型』 FOLIO: Natural Language Reasoning with First-Order Logic
- 2020.08.05 『自然语言处理』 Generalized Word Shift Graphs: A Method for Visualizing and Explaining Pairwise Comparisons Between Texts
- 2022.08.30 『无人驾驶』 MapTR: Structured Modeling and Learning for Online Vectorized HD Map Construction
⚡ 论文:FOLIO: Natural Language Reasoning with First-Order Logic
论文时间:2 Sep 2022
领域任务:Language Modelling, Translation,语言模型,机器翻译
论文作者:Simeng Han, Hailey Schoelkopf, Yilun Zhao, Zhenting Qi, Martin Riddell, Luke Benson, Lucy Sun, Ekaterina Zubova, Yujie Qiao, Matthew Burtell, David Peng, Jonathan Fan, Yixin Liu, Brian Wong, Malcolm Sailor, Ansong Ni, Linyong Nan, Jungo Kasai, Tao Yu, Rui Zhang, Shafiq Joty, Alexander R. Fabbri, Wojciech Kryscinski, Xi Victoria Lin, Caiming Xiong, Dragomir Radev
论文简介:We present FOLIO, a human-annotated, open-domain, and logically complex and diverse dataset for reasoning in natural language (NL), equipped with first order logic (FOL) annotations./我们提出了FOLIO,一个由人类注释的、开放领域的、逻辑上复杂多样的自然语言(NL)推理数据集,配备了一阶逻辑(FOL)注释。
论文摘要:我们提出了FOLIO,一个由人类注释的、开放领域的、逻辑上复杂多样的自然语言(NL)推理数据集,配备了一阶逻辑(FOL)注释。FOLIO由1435个例子(独特的结论)组成,每个例子都与487套前提之一配对,这些前提作为规则被用来对每个结论的正确性进行推理。前提和结论的逻辑正确性由其平行的FOL注释来保证,这些注释由我们的FOL推理引擎自动验证。除了主要的NL推理任务,FOLIO中的NL-FOL对自动构成一个新的NL-FOL翻译数据集,使用FOL作为逻辑形式。我们在FOLIO上的实验系统地评估了中型语言模型(BERT、RoBERTa)上的监督微调和大型语言模型(GPT-NeoX、OPT、GPT-3、Codex)上的少数提示的FOL推理能力。对于NL-FOL翻译,我们用GPT-3和Codex进行实验。我们的结果显示,公开的最有能力的大型语言模型(LLM)之一,GPT-3 davinci,在FOLIO的一个子集上使用几个prompt,只取得了略好于随机的结果,并且该模型在预测False和Unknown结论的正确真值方面特别糟糕。我们的数据集和代码可在 github.com/Yale-LILY/F… 获取。
⚡ 论文:Generalized Word Shift Graphs: A Method for Visualizing and Explaining Pairwise Comparisons Between Texts
论文时间:5 Aug 2020
领域任务:自然语言处理
代码实现:github.com/ryanjgallag… , github.com/JasonKessle… , github.com/john-guerra…
论文作者:Ryan J. Gallagher, Morgan R. Frank, Lewis Mitchell, Aaron J. Schwartz, Andrew J. Reagan, Christopher M. Danforth, Peter Sheridan Dodds
论文简介:A common task in computational text analyses is to quantify how two corpora differ according to a measurement like word frequency, sentiment, or information content./计算性文本分析中的一项常见任务是量化两个语料库在词频、情感或信息内容等测量方面的差异。
论文摘要:计算性文本分析中的一项常见任务是根据词频、情感或信息内容等测量方法来量化两个语料库的差异。然而,将文本的丰富故事折叠成一个单一的数字,在概念上往往是危险的,而且很难自信地解释有趣或意外的文本模式,而不担心数据伪装或测量的有效性。为了更好地捕捉文本之间的细微差别,我们引入了广义的词移图,它可以产生一个有意义的、可解释的总结,即对于任何可以被表述为加权平均的测量,单个词对两个文本之间的变化的贡献。我们表明,这个框架自然地包含了许多最常用的文本比较方法,包括相对频率、字典分数和基于熵的措施,如Kullback-Leibler和Jensen-Shannon分歧。通过几个案例研究,我们展示了广义词移图如何灵活地应用于各领域的诊断性调查、假设生成和实质性解释。通过提供对语料库之间文本转变的详细透视,广义词移图帮助计算社会科学家、数字人文学者和其他文本分析从业者形成更有力的科学叙述。
⚡ 论文:MapTR: Structured Modeling and Learning for Online Vectorized HD Map Construction
论文时间:30 Aug 2022
领域任务:Autonomous Driving,无人驾驶
论文作者:Bencheng Liao, Shaoyu Chen, Xinggang Wang, Tianheng Cheng, Qian Zhang, Wenyu Liu, Chang Huang
论文简介:We adopt a hierarchical query embedding scheme to flexibly encode structured map information and perform hierarchical bipartite matching for map element learning./我们采用分层查询嵌入方案来灵活编码结构化地图信息,并对地图元素学习进行分层双点匹配。
论文摘要:我们提出了MapTR,一个用于高效在线矢量高清地图构建的结构化端到端框架。我们提出了一种统一的基于包络的建模方法,即把地图元素建模为具有一组等价包络的点集,这就避免了地图元素定义的模糊性并简化了学习。我们采用分层查询嵌入方案来灵活编码结构化的地图信息,并对地图元素的学习进行分层双比特匹配。MapTR在nuScenes数据集上实现了现有矢量地图构建方法中最好的性能和效率。特别是,MapTR-nano在RTX 3090上以实时推理速度(25.1 FPS)运行,比现有最先进的基于摄像头的方法快8倍,同时实现了3.3倍的mAP。MapTR-tiny在速度较快的同时,明显优于现有的最先进的多模式方法,达到13.5 mAP。定性结果表明,MapTR在复杂的各种驾驶场景中保持了稳定和强大的地图构建质量。在 github.com/hustvl/MapT… 上有大量的演示,以证明其在真实世界场景中的有效性。MapTR在自动驾驶中具有很大的应用价值。我们将发布代码以促进进一步的研究和应用。
我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!
◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。
◉ 点击 电子月刊,快速浏览月度合辑。