0821 早早聊 AGI 资讯|Meta、Bloomberg 和 EleutherAI 使用 17 万本盗版书籍训练模型...

1,005 阅读10分钟

Cyberpunk street, glass sense --ar 21.png 👉👉 AGI 早早聊知识库

「 行业动态 」

Meta 、Bloomberg 和 EleutherAI 正在用 17 万本盗版书籍训练模型 🔗 Twitter Link

Meta、Bloomberg 和 EleutherAI 利用包括 Stephen King、Zadie Smith、Margaret Atwood 等作者的超过 17 万本盗版书籍的数据集进行了生成式人工智能的训练,法律问题涉及复杂。

◇ YouPro:一个能够做任何事情多模态的 AI 聊天机器人上线 🔗 News

  • 生成图像,YouPro 集成了 Stable Diffusion XL 技术,只需输入提示,即可获得 4 张不同风格的图片。
  • 编码,使用 GPT-4,YouPro 可以在几秒钟内完成并生成代码。
  • 任意语言交流,以希望的任何语言进行聊天,YouChat 会以提问的语言回应。
  • 使用互联网,在聊天中使用最新的文章和新闻,使用 YouPro 的搜索功能。
  • 写作,YouWrite 功能能够进行研究、生成报告、起草论文、创建商业计划或提案等。
  • 官网:about.you.com/youpro/?utm…

◇ 1000 + AI 智能体 复活, OpenAI 版元宇宙上线? 🔗 News

YouTube 博主 Art from the Machine 发布了 Mantella,使《上古卷轴 5:天际》中的 1000+ 个 NPC 具有意识和自然语音对话能力。通过 ChatGPT、xVASynth 和 Whisper 等技术,NPC 可以真实对话、记住以前的内容,理解环境和玩家操作。xVASynth 和 Whisper 工具为游戏内语音转换和文字互动提供支持,使 Mantella 支持 20+ 种语言,增强 NPC 真实感,使玩家能够更深入地与游戏中的 NPC 交互,提升游戏的沉浸感和互动性。

2.gif

◇ 千亿美金产业背后,自动驾驶仍有边界问题 🔗 Link

无人驾驶汽车在常见情况下表现出色,但在复杂和边缘情况下存在挑战。机器学习算法难以处理这些问题,因为现实世界的复杂性和不确定性使得设计能够应对各种异常情况的无人驾驶汽车变得困难,虽然无人驾驶汽车在晴朗天气下表现良好,但面对雪、雨、不熟悉的地点等异常情况时会遇到困难。机器学习算法的挑战在于处理边缘情况和复杂性,训练集和测试集的相似性限制了预测能力,未来需要更可靠的技术来解决复杂的边缘情况,而不仅是简单地扩大应用范围。

AI 领域狂招高管,职位成谜!网友戏称:“会吹牛就行” 🔗 News

全球五百强公司迅速兴起的 AI 主管职位,近五年内增长三倍,年薪高达百万美元,从亚马逊到可口可乐,各行业都积极招聘 AI 主管,其中全球财富二千强公司中四分之一的领导层成员已担任此职。与整体招聘趋势相悖,AI 主管职位持续增长,涵盖科技、银行、快消和医药等多个领域,其职责因行业不同而异。虽然 Gartner 预测未来一年世界二千强公司中从事 AI 主管职务的人数将激增,但也强调该职位存在过度炒作的风险,有人认为 AI 主管只会“吹牛”,但专家指出,他们将成为未来热门职位之一。”

◇ 谷歌前首席执行 Eric Schmidt 正在建立一个巨大的非营利性 AI+ Science 初创公司 🔗 Twitter

科学研究,尤其是生物技术,正成为科技领域的焦点,吸引硅谷等领域的人才,深度学习等技术为应用于科学挑战带来新机遇,成本降低使得 AI 模型更易用。Eric Schmidt 提出人工智能改变科学工作方式的愿景,支持无明确商业模式的潜力项目,助推科技造福人类,夫妻创办的 Schmidt Futures 还资助 AI2050 等项目,展望 AI 改变科学。

◇ LinkedIn 指出人工智能有望在某些角色中进行“增强”或者取代工作 🔗 Twitter

具体而言,软件工程师所完成的 96%任务可能会通过 AI 进行扩展,在其他领域中,教师(45%),销售员(59%),客户支持人员(76%),收银员(59%),事件经理(39%)可能会受到影响。然而对于司机(9%),医生(7%),护士(6%),环境健康专家(3%),以及油田实操专家(1%)这些领域,技能的占比目前似乎最难被取代。

◇ 世界尚未为人工智能的下一个十年做好准备 🔗 Twitter Link

DeepMind 和 InflectionAI 的联合创始人 Mustafa Suleyman 在"Have a Nice Future"节目中,谈论了他的新书《即将到来的浪潮》以及人工智能的影响。Suleyman 指出,新书将探讨人工智能、合成生物学等技术的发展对社会和政府的影响,他认为聊天机器人可能在评估人工智能方面扮演重要角色,还表示个人智能将通过对话、教学和知识共享来实现特定任务,并认为对话将成为新的界面。关于 AGI,Suleyman 认为目前尚缺乏支持其具有显著递归自我改进能力的理论框架。

◇ 4 y/o:真正的零码创建游戏展示 🔗 Twitter

截屏2023-08-21 17.41.35.png

◇ Cursor 会比 Visual Studio Code 更好用吗 🔗 Twitter1 Twitter2

Cursor 是基于 Visual Studio Code 的分支版本,保留了 VSCode 的全部功能,包括 Copilot。但问题不应该是“Cursor 是否比 VSCode + Copilot 更好?”因为你可以在 Cursor 上使用 Copilot,还可以获得更多功能。

「 趣玩推荐 」

macOS “效率工具”DockX 正式发布! 🔗 Twitter

可以在 Dock 程序坞和菜单栏上显示任何内容,方便高效,无需打开。

截屏2023-08-21 17.42.31.png

◇ 使用 LLM 驱动的聊天机器人构建一个自定义端到端聊天 LLM 系统 🔗 Twitter

由人工智能驱动的聊天工具,可以执行从加载和转换数据和特征到部署模型和创建批量预测的所有任务,所有这些都不需要编写代码,这是充分发挥 LLM 强大能力的有效途径。

◇ OpenRouter AI :提供优秀大模型的 API 网站 🔗 Twitter

可以看到现在哪些 AI 网站、App 比较火,从网站可以直观的看到 Tokens 的使用量,支持 OpenAI(GPT3.5/4),Anthropic(Claude2、instant),LLama2,PaLM Bison 等。可控制每个生成的 API key 的消耗费用,也支持加密货币支付,支持灵活的身份验证。

「 技术阅读 」

◇ BFNs 简化数据建模,灵活应用于不同数据类型 🔗 Twitter

Alex Graves 近日发表了他五年来的首篇论文,作为“注意力”和“神经图灵机”等现代 Transformer 核心概念的创始人,他的新论文在 AlphaSignal 中介绍了 BFNs 的创新。BFNs 以简化的方式处理扩散建模,通过贝叶斯推断调整独立分布参数,创建相互依赖的分布,为不同数据类型提供灵活建模,类似 Codenames 游戏中的提示机制。这一研究方法逐步更新分布,使用不同损失函数和样本生成过程,并在图像和语言建模实验中表现出竞争力,为数据建模领域带来新的前景。

◇ 10B 量级开源中文对话 LLM ,谁最「懂」人话? 🔗 News

本文对多个开源的 10B 量级中文对话模型进行了实测,着重探究它们在语义理解能力方面的表现,在选择的模型中,BELLE-7B-1M 和 ChatGLM 系列表现优秀,而白泽系列则表现较差。实测任务包括文字续写、语法修正等多个语义理解任务,模型在某国内头部公有云厂商的云服务器上进行,硬件资源包括 12 核 CPU、92GB 内存和 NVIDIA V100 32GB GPU。BELLE-7B-1M 和 ChatGLM 系列在语义理解任务中能够在一半情况下正确回答问题,而白泽系列则无法完成任务,与其在数学题方面表现不同。

线性代数 深度学习 GPU 架构从根本上是相互关联的 🔗 Twitter

线性代数、深度学习和 GPU 架构密不可分,线性代数应用于深度学习,GPU 用于训练模型。张量和 GPU 完美结合,可以并行计算,GPU 最初设计用于图形处理,但对线性代数操作非常高效,张量表示多维数据,如文本、图像,支持各种操作。神经网络层可用张量操作描述,关键算法也基于张量操作,GPU 并行计算和张量的内存层次结构相得益彰,优化库如 cuBLAS、cuDNN 专为张量操作设计。深度学习模型常以批处理方式处理数据,与 GPU 并行性契合,多个库和框架使构建 AI 简单迅速,GPU 执行张量操作并提取数据模式。

「 课程推荐 」

◇ AI Podcast 工具 Snipd:优质英语学习素材,提供 AI 转写、片段裁切 🔗 Twitter

◇ 斯坦福大学开源课程 CS224U:《Natural Language Understanding》 🔗 Twitter

由斯坦福教授 Chris Potts 教授,除了通常的深度学习议程外,还有很多精华:

  • 信息检索的经典方法:TF-IDF、BM25 排名分数、Pyserini(python 工具)和 IR 指标,不要轻率地想到使用 GPT。
  • 文本扩散:扩散模拟了一个连贯的句子如何通过并行去噪“模糊的词语”来实现,虽然目前效果不佳,但它可能成为主导的自回归方法的一种替代方式。
  • NLU 系统评估的系统方法:探查、特征归因、干预。
  • slides: web.stanford.edu/class/cs224…
  • Github: github.com/cgpotts/cs2…

「 融资快讯 」

◇ 「 北极雄芯」完成超亿元融资,探索基于芯粒的专用计算 🔗 News

北极雄芯成立于 2021 年,创始于清华大学交叉信息研究院,孵化于西安交叉信息核心技术研究,专注于 Chiplet 技术,近日完成超过亿元的融资,投资方为丰年资本和正为资本,融资将用于下一代通用型和功能型芯片的开发,以及高速互联芯片接口的研发。公司主攻通用型芯片、功能型芯片和高速互联接口的研发,为市场提供高性能且灵活的解决方案。

◇ 「深势科技」完成新一轮超 7 亿元融资 🔗 News

深势科技创始人孙伟杰和张林峰是北大毕业生,共同专注于“AI+分子模拟”领域,近日完成新一轮超 7 亿人民币的融资,投资方包括众源资本、玉资本、正心谷资本,Evergreen Scitech Delta 等。资金将用于吸引人才、提升算法创新能力,推广技术在生物医药、新能源等领域。深势科技以"AI for Science"为核心,创建多尺度模拟仿真平台,已成 AI for Science 领域引领者,发布多项科学计算引擎和预训练模型。

「 招聘信息 」

HC 曝光,简历投递可联系小助手(wx:wongmicky)

「 讲师招募 」

2023 年 9 月 9 日,早早聊计划举办线上【前端工程化】专场

📃 讲师报名,可联系早早聊负责人 Micky (wx:wongmicky)

🎙️ 可以聊聊:工程管理、代码组织、模块化组件化、自动化工具链、质量工程、预处理等提高开发效率、代码质量和用户体验的方向。

🎁 讲师福利,一次分享,即可享受:

  • 永久免费与会前端早早聊大会
  • 免费参与早早聊举办的酒蒙子局,认识更多技术人、创业人、AI 同行者
  • 线上招聘,社区优先简历内推
  • 还有更多等你来解锁...