鉴定完毕!这些歌手跨年晚会,假唱了…欧莱雅智能画眉设备;首个AI律师下月出庭;推特又裁员;GitHub今日热榜 | ShowMeAI资讯日报

3,127 阅读7分钟

🎡 『谁在假唱』技术手段分析跨年演唱会上的歌手们

各大卫视的跨年演唱会,你追了几场?看出来了谁在对口型?B站Up主 @码农高天 使用 🚧Spleeter 软件将人声与伴奏音乐进行分离,并使用 🚧parselmouth 库对歌手进行音准分析,添加“准确音”辅助线后就可以分析歌手唱得准不准了。

注意!在体育馆等的大型晚会场馆中,即便如邓紫棋、孙楠、周深、张杰这样的稳定性顶尖的歌手,音准也会有波动。那么,完美卡在音准线上的,基本就是提前修音的假唱了!下面这些,都是假唱。(来源:BV123411m77L)

🎡 『L'Oreal · Brow Magic』欧莱雅将于2023年推出智能画眉设备

欧莱雅(L'Oreal)和科技公司 Prinker 合作推出 Brow Magic,一款带有 2,400 个喷嘴的手持设备,可提供最高 1,200 dpi(每英寸墨滴数)的打印分辨率,只需几秒钟即可获得结果。产品使用到了欧莱雅的 Modiface 增强现实技术。

使用时,打开 L'Oreal Brow Magic 应用程序,使用 Modiface 眉毛阅读器扫描面部,并在程序中选择所需的形状、厚度和效果。然后,在眉毛上涂抹 L'Oreal 妆前乳,并将设备平移过眉毛位置。(来源:IT之家)

🎡 『Apple · AI narration』苹果推出多部采用AI朗读的有声读物

苹果使用语音合成技术开发 AI 机器人并朗读的多部有声读物,悄然上线了!在苹果 Books 应用中搜索“AI narration”关键词即可看到。苹果这一举动可能代表着科技大厂对有声读物态度的重大转变。

近年来,有声读物市场火爆,科技公司争先恐后地站稳脚跟。预计到 2030 年,全球市场价值可能超过 350 亿美元。(来源:IT之家)

🔥 『Twitter』开启第三轮裁员,目标是广告与数据科学团队

推特在第三轮裁员中,裁减了约40名从事广告业务的数据科学家和工程师。此番裁员的目标是推特管理层眼中的“失败领域”和不重要的业务范围,分别以广告产品和数据科学为首。

近几个月来,广告商不满马斯克新规定及推特公司的混乱局面,因此推特的广告收入急剧下降。知情人士表示,裁员后推特几乎没有工程师从事“用于广告优化的机器学习”。(来源:The Information)

🔥 『Mojo Vision』智能隐形眼镜初创企业裁员75%

初创公司 Mojo Vision 花费了几年时间研发智能隐形眼镜 Mojo Lens,眼镜内置了智能显示屏。在周五一篇博文里,公司表示近期的工作重点将转移到它开发的用于智能触点的微型LED显示技术上,并裁员 75%。

首席执行官 Drew Perkins 表示,即使我们在产品开发方面取得了重要进展,Mojo 在筹集资金方面也面临着重大挑战。全球经济不景气,资本市场极度紧张,先进的AR产品的市场潜力尚未得到证实,这些都造成了 Mojo Vision 无法找到额外的私人资金来继续开发 Mojo Lens 的局面。(来源:cnBeta)

🔥 『2023年1月编程语言排行榜』 2022年度最佳编程语言是 C++

Tiobe 公布了2023 年1月编程语言排行榜中,评选 C++ 为 2022 年度最佳编程语言,获得了最大的流行度增长值4.62%。C++ 受欢迎的原因是它出色的性能,以及近期不断发布具备有趣功能的新语言标准。

本月排行榜第1名的 Python 流行度增长了 2.78%,亚军 C 语言流行度增长了 3.82%。值得注意的是,Java 流行度增长了 1.55%,排名从第三位下滑到了第四位。软件测试公司 Tiobe 会跟踪软件开发人员所使用编程语言,并每月根据流行程度来发布榜单。(来源:IT之家)

🔥 『DoNotPay』全球首个 AI 律师即将出庭,为超速驾驶案被告做辩护

全球首个“AI 律师”将于下月出庭,在开庭审理的超速驾驶案件中为被告提供辩护。只不过这位律师没有实体,而是在手机端运行,帮助被告应对各种提问。

AI 律师的研发公司为 DoNotPay,负责人表示如果 AI 律师提供的建议不能帮助客户,DoNotPay 将会承担罚款。目前尚未公开案件被告的身份,也不清楚届时是否会向媒体开放。(来源:New Scientist)

🔥 『字节跳动』与摩根大通合作,或进军支付领域

据《福布斯》报道,摩根大通正在与字节跳动合作,帮助字节跳动开发支付技术,或为 TikTok 的支付渠道铺路。报道称,字节跳动将聘请摩根大通来简化交易,改善支付的发送和接收方式,并为字节跳动的十几种产品(包括 TikTok 和抖音)建立一个集中的银行账户。此外,字节跳动还聘请了几位摩根大通高管来领导其全球支付团队,推进金融业务。

根据数据分析公司Sensor Tower的数据,2022年全球用户在TikTok上的花费为34亿美元,高于前一年的20亿美元。仅在美国,这一数字就增长了两倍多,达到6.7亿美元。(来源:界面新闻)

🔥 『微软』计划投资自动驾驶卡车企业 Gatik

两位知情人士透露,微软计划在 Gatik 最新一轮融资中对其投资超过 1000万 美元。作为交易的一部分,Gatik 将使用微软的云计算和边缘计算平台 Azure 来开发卡车的自动驾驶送货技术。消息人士称双方的交易条款依然有可能发生变化。

公开信息显示,Gatik 成立于2017年,专注于零售业的中间环节以及B2B物流。2021年以来,Gatik 与沃尔玛和Loblaw Companies 合作推出了完全无人驾驶的商用送货服务。(来源:路透社)

🚧 『minGPT』使用 PyTorch 重新实现 GPT

github.com/karpathy/mi…

minGPT 项目使用 PyTorch 重新实现了 OpenAI GPT 的训练和推理功能,并试图变得小、干净、可解释,因为目前大多数可用的 GPT 模型都比较庞大。minGPT 库包含 mingpt/model.pymingpt/bpe.pymingpt/trainer.py三个文件。

🚧 『unilm』跨任务、语言和模式的大规模自监督预训练模型

github.com/microsoft/u…

微软开源的大规模自监督预训练模型,包括“人工智能基础知识”和“预训练模型”两部分。目前已经收获了 7,800 Star!将

人工智能基础知识

  • TorchScale:DeepNet、Foundation Transformers (Magneto)、Length-Extrapolatable、X-MoE

预训练模型

  • General-purpose Foundation Model:MetaLM
  • Language & Multilingual:UniLM、InfoXLM/XLM-E、DeltaLM/mT6、MiniLM、AdaLM、EdgeLM、SimLM、E5
  • Vision:BEiT/BEiT-2、DiT
  • Speech:WavLM、VALL-E
  • Multimodal (X + Language):LayoutLM/LayoutLMv2/LayoutLMv3、LayoutXLM、MarkupLM、XDoc、UniSpeech、UniSpeech-SAT、SpeechT5、SpeechLM、VLMo、VL-BEiT、BEiT-3
  • Toolkits:s2s-ft、Aggressive Decoding
  • Applications:TrOCR、LayoutReader、XLM-T

🚧 『ChatGPT Chrome Extension』ChatGPT 的浏览器插件

github.com/gragland/ch…

一个 Chrome 扩展程序,可以更好地使用 ChatGPT 完成撰写推文、修改电子邮件、完善编程错误或其他任何需求,将 ChatGPT 添加到互联网的每个文本框中!

◉ 点击 👀日报合辑,公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。

◉ 点击 🎡AI应用与工具大全,体验100+前沿AI产品带来的效率飞跃。