ShowMeAI | what?这些数据也被拿去训练大模型了?AI播客应用三万字创业复盘;英伟达GenAI学习路线图;GenAI时代需要的创业者特质

1,236 阅读14分钟

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!



1. 红杉联合Forbes、Meritech 共同发布「AI 50 2024」榜单

红杉资本 (Sequoia Capital) 是一家全球知名的风险投资公司。Meritech (Meritech Capital Partners) 是一家在高科技领域有重要影响力的美国的私募股权公司。

最近,红杉联合 Forbes (福布斯)、Meritech 共同发布了「AI 50 2024」榜单,选出了他们认为最有希望的50家AI公司。

🎨 Apps

  • Consumer Uses: Entertainment, Productivity
  • Enterprise Stack: General Productivity, Learning & Development, Customer Experience, Developer & Data Teams
  • Industry Verticals: Creative, Defense, Health & Bio, Industrial, Professional Services

🎨 Infrastructure

  • Inference Providers
  • App Dev Frameworks
  • Model Hubs
  • Foundation Model Providers
  • Store & Compute: Label / Process Data, Cloud Data Providers, Cloud Service Providers
  • Hardware


2.科技巨头正在贪婪地吞食互联网数据,为训练大模型可谓不择手段

大模型训练过程中,数据至关重要,尤其是经过专业人士精心撰写和编辑的高质量数据。所以,科技大厂纷纷把目光投向 Wiki 维基百科、Reddit 论坛等等。但这些数据喂不饱越来越大的大模型,于是各家公司为了搞到更多数据开始走「旁门左道」

之前只是在新闻里看到零星的报道,比如 OpenAI 又吃版权官司了,出版商和艺术家又在声讨科技公司侵权等等。直到 《纽约时报》这篇长文 敲开冰山一角,才发现了科技巨头们费尽心思吞食数据,并渐渐演变成一场让人绝望的狩猎数据

🎨 OpenAI

  • 2021 年末,OpenAI 耗尽了互联网上所有可信赖的英文文本资源。为了解决数据供应问题,研究人员专门创建转录工具把 YouTube 视频中的音频转录成文本,并参与 GPT-4 大模型的训练。
  • 据透露,OpenAI 团队最终转录了超过 100万 小时的视频,甚至 OpenAI 总裁 Greg Brockman 也亲自参与其中。
  • OpenAI CEO Sam Altman 提出了合成数据的新解决方案,但目前仍不成熟。(合成数据是由AI模型生成数据,再将其继续用于训练,来提升AI系统的性能)

🎨 Google

  • 知情人士指出,Google 在获取数据时也采取了一些边缘行为,例如自己也违规转录了 YouTube 视频,这应该也是 Google 默认 OpenAI 行为的原因之一
  • 23年6月,Google 扩大了其服务条款,允许 Google 利用公开的 Google Docs、Google Maps餐厅评论等在线信息开发更多的AI产品。Google 隐私团队则趁独立日假期时悄悄发布了这些新条款,希望借助假期转移公众对此的关注和讨论。
  • Google 高层知道并默许了诸多行为,虽然发言人表示「在没有用户明确许可的情况下,不会使用 Google Docs 或相关应用的信息来训练语言模型」。

🎨 Meta

  • 据说 ChatGPT 发布后,小扎亚历山大,不分白天黑夜地给高管和工程师打电话,催他们开发同等能力的聊天机器人。
  • Meta 副总裁 Nick Grudin 在一次会议中指出,与 ChatGPT 相比,Meta 最核心的瓶颈就是数据量不足
  • MeTa 守着 Facebook 和 Instagram 两座数据金山还束手束脚,是由于2018年的一次数据丑闻;Meta 那次修改了隐私政策,也限制了自己使用用户数据的自由度。
  • 不过,扎克伯格和高管在不同场合提到了 Facebook 和 Instagram 上数十亿公开共享的视频和照片,并表示 OpenAI 一直在使用受版权保护的材料,Meta 完全可以遵循这个市场先例
  • 为了解决数据问题,Meta 没少花钱,也想了很多躲避的办法,比如收购大型出版集团,或者在非洲雇用承包商来收集敏感数据 (emmm


3. 50位艺术家接力创作,全球首部90分钟AI长篇电影诞生细节大揭秘

3月6号,全球首部完全由AI制作的长篇电影《Our T2 Remake》 在好莱坞举行了首映礼。⋙ 官网

电影由50位AIGC创作者历时数月分段合作完成,全片最终达到了近90分钟的常规商业电影放映长度。制作人之一的Junie 近期在接受采访时分享了这部电影幕后制作的种种细节⋙ 阅读 Junie 访谈原文

  1. 电影被拆解成50个部分,每个创作者负责一个或几个特定内容。这些内容涵盖了编剧、音乐、宣传物料、海报设计等多个方面。
  2. 项目启动前,**制片人明确规定,制作过程中只能使用原创的视频、音效和音乐。**团队还配备了法律顾问,以确保项目不会侵犯原片版权。
  1. 《Our T2 Remake》团队搭建了官网,便于参与者认领自己感兴趣的片段,并使用 Discord 频道和 Notion 文档来规范和把控制作进度
  2. 协作流程:在 Discord 平台上进行创作,依据 Notion 里详细的制作安排、细分章节的剧本,各自推进自己的片段。为了整合起来更方便,每个人都要把 VO 人声、音效和音乐都按标准分轨。与传统影视工作流一样,每个细分章节都有 Shot List (分镜头表),并且为了保持角色一致性,会进行特定的 Lora 训练。”

  1. 每个创作者、每个章节都会用到不同的技术,除了AI工具,也会用到3D技术、AE (After Effects) 以及实拍等传统影视制作中常见的制片手段,以达成创作者最终想要实现的影片效果。

  2. Junie本人用到了AI工具 WorkFlow:

    • AI图像生成:Stable Diffusion / Midjourney v5.2/DALL·E
    • AI动画:Pika / Runway / Deforum
    • 口型同步:D-ID AI
    • 旁白:ElevenLabs
    • 剪辑:Premiere
    • 文字翻译:ChatGPT


4. AI 播客应用 Podwise 三万字复盘:两个月 1.2 万美元 ARR 之路

Podwise 是一款专为播客听友设计的 AI 知识管理应用,可以对播客节目进行转录、提取、总结、分析等操作,而且准确率「一骑绝尘」。此外,Podwise 打通了 Notion、Obsidian、Logseq 和 Readwise 等平台,丝滑嵌入已有的知识管理工作流。

Podwise 创业团队近期撰文 3 万多字,分享了他们 〖两个月 $12000 ARR 实践之路〗,以及探索 PMF (Product-Market Fit) 过程中的灵感、思考、经验和教训,非常细致且真诚。

以下是内容要点目录,感兴趣可以阅读原文~

00 前言

  • 0.1 Podwise 是什么?
  • 0.2 我们为什么要做 Podwise?

01 灵感

  • 1.1 从社区出发
  • 1.2 百万美金的利基市场
  • 1.3 MVP MVP MVP

02 构建

  • 2.1 设计与开发一体

    • ① 设计开发一体
    • ② 如何设计功能性界面?
    • ③ 如何设计 Landing Page?
    • ④ 用 Keynote / PowerPoint 设计营销图片
  • 2.2 用方便且擅长的技术栈

    • ① Web 前后端为什么选择 JS/TS 技术栈?
    • ② 为什么选择 TS 而非开发速度更快的 JS?
    • ③ 为什么选择 NextJS 作为 Web framework?
    • ④ 纯后端服务为什么选择 Golang 技术栈?
    • ⑤ 为什么不是 langchain
    • ⑥ 这个技术选型下遇到的问题
    • ⑦ 在经历这一切之后重新选择技术栈的话,我们会怎么选?
    • ⑧ 我们的技术选型建议
  • 2.3 关于大模型必须知道的事

    • ① 内容生成类 AI 产品的后台服务大有不同
    • ② 理解 AI 模型的能力边界
    • ③ 模型选择
    • ④ AI 工作流
    • ⑤ Prompt
  • 2.4 省下的都是赚的

  • 2.5 能用的服务千万别自己做

03 发布

  • 3.1 最初的 200 个用户
  • 3.2 永远跟用户站在一起
  • 3.3 定价要关注成本

04 增长

  • 4.1 到杠杆高的地方去做宣传
  • 4.2 互动、回复、关注长尾
  • 4.3 意料之外的爆发

05 复盘

  • 5.1 对远景的一些规划

  • 5.2 最不应该犯的错误

  • 5.3 还会坚持干的几件事

    • ① 从社区出发
    • ② 快速发布
    • ③ 大胆谈钱


5. 7 个月从 0 到 100 万美元收入,HeyGen 的 AI 创业传奇

HeyGen 是一家拥有数百万用户的AI公司,是短视频内容AI口型匹配和翻译领域最大的参与者之一。

凭借泰勒·斯威夫特说中文、郭德纲讲英语这类AI视频一炮走红,最新消息是总部已经搬到洛杉矶,正在筹集 6000 万美元,按照投资前估值 4.4 亿美元进行融资。


文章作者 ,是HeygGen CEO &联合创始人 Joshua Xu (徐卓) 撰文〖0 - 1M ARR in 7 months〗,分享自己团队在7个月内实现了 100 万美元的 ARR (年度经常性收) 的经验与心得。

以下是内容要点目录,原文将近一万字,感兴趣可以阅读原文!

00 背景

01 产品市场契合度 → AI 市场契合度

  • 1.1 以最小的成本验证我们寻找的 AI 市场契合度
  • 1.2 经验教训:

02 产品迭代

  • 2.1 7 月 29 日上线
  • 2.2 发明 TalkingPhoto
  • 2.3 增加流量——免费版+水印,导致一个月内出现 3 次宕机
  • 2.4 增强病毒传播引擎——Gen AI 全景图的助力
  • 2.5 改善用户体验

03 如何构建产品?

  • 3.1 每周发布的更新节奏
  • 3.2 只在问题出现时修复
  • 3.3 适应分布式团队合作
  • 3.4 尽早建立数据仪表板
  • 3.5 A/B 测试是一个陷阱
  • 3.6 我们用的工具

04 客户

  • 4.1 最大化与客户的沟通
  • 4.2 建立团队透明度
  • 4.3 避免定制化
  • 4.4 如何做不可拓展的事情

05 我们是如何学习的



6. 研究:什么样的 AGI 创业者更容易获得资本青睐?

这篇研究很有意思,是国内6位投资人对当下 AI 浪潮的判断,以及各自心中的 AGI 创业者的能力画像。 ⋙ 阅读原文


王啸 - 九合创投 创始人

  • 重视项目是否拥有高技术壁垒、解决核心问题的能力、团队创造真实价值的能力,以及市场天花板的高度。
  • 项目短期内无法自造血时,团队需要具备强大的融资能力
  • 格局大的创始人能够聚集不同背景的人才,弥补团队不足,并妥善处理利益分配

刘博 - 清流资本合伙人

  • 关注项目应用场景的市场空间、CEO的能力/性格/项目之间的适配性,以及项目融资后半年内的规划合理性。
  • CEO的韧性对项目成功至关重要
  • 特别关注AI在驾驶领域的应用,认为驾驶领域智能状态的提升是AI应用效果的一个重要观察点

张津剑 - 绿洲资本创始合伙人

  • AI带来的是社会层面的变革,而不仅仅是技术层面的革新。
  • AI是整个科技变革的一个切面,而非独立存在的技术

杨孟彤 (Melissa) - Atom Capital 创始合伙人

  • AI落地应用的新趋势,是从大模型向复合人工智能系统迁移。
  • 当前AI的PMF多在大厂内部落地,,而非公开市场
  • 2024年可能是「多模态大模型之年」

白则人 - 线性资本 投资副总裁

  • 看重AI如何将智能转化为可流动和可规模化的资产,从而革新传统商业模式
  • AI的存在使得交互形式有新变化的可能,可以加速场景的创新和重构。
  • 创始团队从一开始就应该具备全球视野。

炊文伟 - BV 百度风投高级投资经理

  • 在B端,AI的目标是应该是增加收入,而不仅仅是降本增效。
  • 一些AI+的机会更适合行业内的老厂商,而不是新的创业者
  • 距离人越近的领域,AI带来的增量价值就越难讲清楚。

李远远 - 小苗朗程高级投资经理

  • 在C端,AI应用只有大成或不成两种可能,成功的关键在于深刻理解人性和市场。
  • 在B端,AI应用更多应以 SaaS+AI 的模式发展,而非 AI+SaaS。
  • 当前商务环境下,获得大额订单、保持良好现金流和拥有强大技术壁垒,是一个不可能三角


7. Hugging Face 新课开放免费预约:Machine Learning for 3D (用于3D的机器学习课程)

HuggingFace 新推出了一门 3D 相关AI课程,专注于最前沿的生成式3D研究基础知识。预告将于5月15日正式更新,目前可以 免费订阅 啦~

课程要点:

  • 🏗️ 生成式3D研究的基本概念和构建模块
  • 🎨 高斯喷溅 (Gaussian Splatting) 的工作机制,可能包含相关的实践环节
  • 🔎 创建生成式3D演示的指导教程,促进学习者的动手实践能力
  • 📚 课程适合对3D生成研究感兴趣的研究者和学生,以及希望在这一领域拓展知识的专业人士


8. NVIDIA 英伟达官方发布 GenAI 学习路线图,开放8门视频课程

NVIDIA 英伟达也出免费视频课程了!一共8门,官网注册即可开始学习~ 让我们一起来看看都有哪些内容~

  1. Generative AI Explained / GenAI 解释:这门课程无需编程,目标是学习 GenAI 的概念和应用,以及这个激动人心领域中的挑战和机遇。⋙ 学习链接

  2. Getting Started with AI on Jetson Nano / 在 NVIDIA Jetson Nano 上启航AI之旅:利用 NVIDIA Jetson Nano 构建并训练一个用于分类的数据集和模型。⋙ 学习链接

  3. Building A Brain in 10 Minutes / 探索神经网络的生物学灵感:本课程将深入探讨早期神经网络设计背后的生物学原理。⋙ 学习链接

  4. Building Video AI Applications at the Edge on Jetson Nano / 在 Jetson Nano 上打造边缘视频AI应用:掌握如何利用 DeepStream 开发套件创建应用,通过目标检测与分类网络对视频流进行智能注释。⋙ 学习链接

  5. Augment your LLM Using Retrieval Augmented Generation / 利用检索增强生成技术增强您的大语言模型 (LLM) :本课程将引导您快速入门,展示一种高效的工作流程,帮助您节省在向量数据库、嵌入模型和大语言模型 (LLM) 选择上的时间和精力。我们将提供NVIDIA内部采用的起点,结合了流行的开源软件框架。⋙ 学习链接

  6. Building RAG Agents with LLMs / 与大语言模型 (LLM) 一起构建RAG代理:由大语言模型 (LLM) 驱动的代理在工具使用、文档查阅和策略规划方面展现了卓越的检索能力。本课程将指导您如何在实际应用中部署灵活的代理系统,并根据用户和客户的需求进行系统扩展。 ⋙ 学习链接

  7. Accelerate Data Science Workflows with Zero Code Changes / 零代码改动,快速提升数据科学工作流程:本课程将向您展示如何运用RAPIDS工具集,以极小的代价,显著提升您基于CPU的数据科学任务效率。⋙ 学习链接

  8. Introduction to AI in the Data Center / 数据中心AI简介:在 Coursera 上的这门课程中,你将学习有关AI、机器学习、深度学习、GPU架 构、深度学习框架以及在数据中心部署AI工作负载的知识。⋙ 学习链接

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ > 前往 🎡ShowMeAI,获取结构化成长路径和全套资料库,用知识加速每一次技术进步!