👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦！

1. 红杉联合Forbes、Meritech 共同发布「AI 50 2024」榜单

红杉资本 (Sequoia Capital) 是一家全球知名的风险投资公司。Meritech (Meritech Capital Partners) 是一家在高科技领域有重要影响力的美国的私募股权公司。

最近，红杉联合 Forbes (福布斯)、Meritech 共同发布了「AI 50 2024」榜单，选出了他们认为最有希望的50家AI公司。

🎨 Apps

Consumer Uses: Entertainment, Productivity

Enterprise Stack: General Productivity, Learning & Development, Customer Experience, Developer & Data Teams

Industry Verticals: Creative, Defense, Health & Bio, Industrial, Professional Services

🎨 Infrastructure

Inference Providers

App Dev Frameworks

Model Hubs

Foundation Model Providers

Store & Compute: Label / Process Data, Cloud Data Providers, Cloud Service Providers

Hardware

2.科技巨头正在贪婪地吞食互联网数据，为训练大模型可谓不择手段

大模型训练过程中，数据至关重要，尤其是经过专业人士精心撰写和编辑的高质量数据。所以，科技大厂纷纷把目光投向 Wiki 维基百科、Reddit 论坛等等。但这些数据喂不饱越来越大的大模型，于是各家公司为了搞到更多数据开始走「旁门左道」。

之前只是在新闻里看到零星的报道，比如 OpenAI 又吃版权官司了，出版商和艺术家又在声讨科技公司侵权等等。直到《纽约时报》这篇长文敲开冰山一角，才发现了科技巨头们费尽心思吞食数据，并渐渐演变成一场让人绝望的狩猎数据。

🎨 OpenAI

2021 年末，OpenAI 耗尽了互联网上所有可信赖的英文文本资源。为了解决数据供应问题，研究人员专门创建转录工具把 YouTube 视频中的音频转录成文本，并参与 GPT-4 大模型的训练。
据透露，OpenAI 团队最终转录了超过 100万小时的视频，甚至 OpenAI 总裁 Greg Brockman 也亲自参与其中。
OpenAI CEO Sam Altman 提出了合成数据的新解决方案，但目前仍不成熟。(合成数据是由AI模型生成数据，再将其继续用于训练，来提升AI系统的性能)

🎨 Google

知情人士指出，Google 在获取数据时也采取了一些边缘行为，例如自己也违规转录了 YouTube 视频，这应该也是 Google 默认 OpenAI 行为的原因之一。
23年6月，Google 扩大了其服务条款，允许 Google 利用公开的 Google Docs、Google Maps餐厅评论等在线信息开发更多的AI产品。Google 隐私团队则趁独立日假期时悄悄发布了这些新条款，希望借助假期转移公众对此的关注和讨论。
Google 高层知道并默许了诸多行为，虽然发言人表示「在没有用户明确许可的情况下，不会使用 Google Docs 或相关应用的信息来训练语言模型」。

🎨 Meta

据说 ChatGPT 发布后，小扎亚历山大，不分白天黑夜地给高管和工程师打电话，催他们开发同等能力的聊天机器人。
Meta 副总裁 Nick Grudin 在一次会议中指出，与 ChatGPT 相比，Meta 最核心的瓶颈就是数据量不足。
MeTa 守着 Facebook 和 Instagram 两座数据金山还束手束脚，是由于2018年的一次数据丑闻；Meta 那次修改了隐私政策，也限制了自己使用用户数据的自由度。
不过，扎克伯格和高管在不同场合提到了 Facebook 和 Instagram 上数十亿公开共享的视频和照片，并表示 OpenAI 一直在使用受版权保护的材料，Meta 完全可以遵循这个市场先例。
为了解决数据问题，Meta 没少花钱，也想了很多躲避的办法，比如收购大型出版集团，或者在非洲雇用承包商来收集敏感数据 (emmm

3. 50位艺术家接力创作，全球首部90分钟AI长篇电影诞生细节大揭秘

3月6号，全球首部完全由AI制作的长篇电影《Our T2 Remake》 在好莱坞举行了首映礼。⋙ 官网

电影由50位AIGC创作者历时数月分段合作完成，全片最终达到了近90分钟的常规商业电影放映长度。制作人之一的Junie 近期在接受采访时分享了这部电影幕后制作的种种细节。⋙ 阅读 Junie 访谈原文

电影被拆解成50个部分，每个创作者负责一个或几个特定内容。这些内容涵盖了编剧、音乐、宣传物料、海报设计等多个方面。
项目启动前，**制片人明确规定，制作过程中只能使用原创的视频、音效和音乐。**团队还配备了法律顾问，以确保项目不会侵犯原片版权。

《Our T2 Remake》团队搭建了官网，便于参与者认领自己感兴趣的片段，并使用 Discord 频道和 Notion 文档来规范和把控制作进度。
协作流程：在 Discord 平台上进行创作，依据 Notion 里详细的制作安排、细分章节的剧本，各自推进自己的片段。为了整合起来更方便，每个人都要把 VO 人声、音效和音乐都按标准分轨。与传统影视工作流一样，每个细分章节都有 Shot List (分镜头表)，并且为了保持角色一致性，会进行特定的 Lora 训练。”

每个创作者、每个章节都会用到不同的技术，除了AI工具，也会用到3D技术、AE (After Effects) 以及实拍等传统影视制作中常见的制片手段，以达成创作者最终想要实现的影片效果。
Junie本人用到了AI工具 WorkFlow：
- AI图像生成：Stable Diffusion / Midjourney v5.2/DALL·E
- AI动画：Pika / Runway / Deforum
- 口型同步：D-ID AI
- 旁白：ElevenLabs
- 剪辑：Premiere
- 文字翻译：ChatGPT

4. AI 播客应用 Podwise 三万字复盘：两个月 1.2 万美元 ARR 之路

Podwise 是一款专为播客听友设计的 AI 知识管理应用，可以对播客节目进行转录、提取、总结、分析等操作，而且准确率「一骑绝尘」。此外，Podwise 打通了 Notion、Obsidian、Logseq 和 Readwise 等平台，丝滑嵌入已有的知识管理工作流。

Podwise 创业团队近期撰文 3 万多字，分享了他们〖两个月 $12000 ARR 实践之路〗，以及探索 PMF (Product-Market Fit) 过程中的灵感、思考、经验和教训，非常细致且真诚。

以下是内容要点目录，感兴趣可以阅读原文~

00 前言

0.1 Podwise 是什么？

0.2 我们为什么要做 Podwise？

01 灵感

1.1 从社区出发

1.2 百万美金的利基市场

1.3 MVP MVP MVP

02 构建

2.1 设计与开发一体

① 设计开发一体

② 如何设计功能性界面？

③ 如何设计 Landing Page？

④ 用 Keynote / PowerPoint 设计营销图片

2.2 用方便且擅长的技术栈

① Web 前后端为什么选择 JS/TS 技术栈？

② 为什么选择 TS 而非开发速度更快的 JS？

③ 为什么选择 NextJS 作为 Web framework？

④ 纯后端服务为什么选择 Golang 技术栈？

⑤ 为什么不是 langchain

⑥ 这个技术选型下遇到的问题

⑦ 在经历这一切之后重新选择技术栈的话，我们会怎么选？

⑧ 我们的技术选型建议

2.3 关于大模型必须知道的事

① 内容生成类 AI 产品的后台服务大有不同

② 理解 AI 模型的能力边界

③ 模型选择

④ AI 工作流

⑤ Prompt

2.4 省下的都是赚的

2.5 能用的服务千万别自己做

03 发布

3.1 最初的 200 个用户

3.2 永远跟用户站在一起

3.3 定价要关注成本

04 增长

4.1 到杠杆高的地方去做宣传

4.2 互动、回复、关注长尾

4.3 意料之外的爆发

05 复盘

5.1 对远景的一些规划

5.2 最不应该犯的错误

5.3 还会坚持干的几件事

① 从社区出发

② 快速发布

③ 大胆谈钱

5. 7 个月从 0 到 100 万美元收入，HeyGen 的 AI 创业传奇

HeyGen 是一家拥有数百万用户的AI公司，是短视频内容AI口型匹配和翻译领域最大的参与者之一。

凭借泰勒·斯威夫特说中文、郭德纲讲英语这类AI视频一炮走红，最新消息是总部已经搬到洛杉矶，正在筹集 6000 万美元，按照投资前估值 4.4 亿美元进行融资。

文章作者，是HeygGen CEO &联合创始人 Joshua Xu (徐卓) 撰文〖0 - 1M ARR in 7 months〗，分享自己团队在7个月内实现了 100 万美元的 ARR (年度经常性收) 的经验与心得。

以下是内容要点目录，原文将近一万字，感兴趣可以阅读原文！

00 背景

01 产品市场契合度 → AI 市场契合度

1.1 以最小的成本验证我们寻找的 AI 市场契合度

1.2 经验教训：

02 产品迭代

2.1 7 月 29 日上线

2.2 发明 TalkingPhoto

2.3 增加流量——免费版+水印，导致一个月内出现 3 次宕机

2.4 增强病毒传播引擎——Gen AI 全景图的助力

2.5 改善用户体验

03 如何构建产品？

3.1 每周发布的更新节奏

3.2 只在问题出现时修复

3.3 适应分布式团队合作

3.4 尽早建立数据仪表板

3.5 A/B 测试是一个陷阱

3.6 我们用的工具

04 客户

4.1 最大化与客户的沟通

4.2 建立团队透明度

4.3 避免定制化

4.4 如何做不可拓展的事情

05 我们是如何学习的

6. 研究：什么样的 AGI 创业者更容易获得资本青睐？

这篇研究很有意思，是国内6位投资人对当下 AI 浪潮的判断，以及各自心中的 AGI 创业者的能力画像。 ⋙ 阅读原文

王啸 - 九合创投创始人

重视项目是否拥有高技术壁垒、解决核心问题的能力、团队创造真实价值的能力，以及市场天花板的高度。
项目短期内无法自造血时，团队需要具备强大的融资能力。
格局大的创始人能够聚集不同背景的人才，弥补团队不足，并妥善处理利益分配。

刘博 - 清流资本合伙人

关注项目应用场景的市场空间、CEO的能力/性格/项目之间的适配性，以及项目融资后半年内的规划合理性。
CEO的韧性对项目成功至关重要。
特别关注AI在驾驶领域的应用，认为驾驶领域智能状态的提升是AI应用效果的一个重要观察点。

张津剑 - 绿洲资本创始合伙人

AI带来的是社会层面的变革，而不仅仅是技术层面的革新。
AI是整个科技变革的一个切面，而非独立存在的技术。

杨孟彤 (Melissa) - Atom Capital 创始合伙人

AI落地应用的新趋势，是从大模型向复合人工智能系统迁移。
当前AI的PMF多在大厂内部落地，，而非公开市场。
2024年可能是「多模态大模型之年」。

白则人 - 线性资本投资副总裁

看重AI如何将智能转化为可流动和可规模化的资产，从而革新传统商业模式。
AI的存在使得交互形式有新变化的可能，可以加速场景的创新和重构。
创始团队从一开始就应该具备全球视野。

炊文伟 - BV 百度风投高级投资经理

在B端，AI的目标是应该是增加收入，而不仅仅是降本增效。
一些AI+的机会更适合行业内的老厂商，而不是新的创业者。
距离人越近的领域，AI带来的增量价值就越难讲清楚。

李远远 - 小苗朗程高级投资经理

在C端，AI应用只有大成或不成两种可能，成功的关键在于深刻理解人性和市场。
在B端，AI应用更多应以 SaaS+AI 的模式发展，而非 AI+SaaS。
当前商务环境下，获得大额订单、保持良好现金流和拥有强大技术壁垒，是一个不可能三角。

7. Hugging Face 新课开放免费预约：Machine Learning for 3D (用于3D的机器学习课程)

HuggingFace 新推出了一门 3D 相关AI课程，专注于最前沿的生成式3D研究基础知识。预告将于5月15日正式更新，目前可以 免费订阅 啦~

课程要点：

🏗️ 生成式3D研究的基本概念和构建模块
🎨 高斯喷溅 (Gaussian Splatting) 的工作机制，可能包含相关的实践环节
🔎 创建生成式3D演示的指导教程，促进学习者的动手实践能力
📚 课程适合对3D生成研究感兴趣的研究者和学生，以及希望在这一领域拓展知识的专业人士

8. NVIDIA 英伟达官方发布 GenAI 学习路线图，开放8门视频课程

NVIDIA 英伟达也出免费视频课程了！一共8门，官网注册即可开始学习~ 让我们一起来看看都有哪些内容~

Generative AI Explained / GenAI 解释：这门课程无需编程，目标是学习 GenAI 的概念和应用，以及这个激动人心领域中的挑战和机遇。⋙ 学习链接
Getting Started with AI on Jetson Nano / 在 NVIDIA Jetson Nano 上启航AI之旅：利用 NVIDIA Jetson Nano 构建并训练一个用于分类的数据集和模型。⋙ 学习链接
Building A Brain in 10 Minutes / 探索神经网络的生物学灵感：本课程将深入探讨早期神经网络设计背后的生物学原理。⋙ 学习链接
Building Video AI Applications at the Edge on Jetson Nano / 在 Jetson Nano 上打造边缘视频AI应用：掌握如何利用 DeepStream 开发套件创建应用，通过目标检测与分类网络对视频流进行智能注释。⋙ 学习链接
Augment your LLM Using Retrieval Augmented Generation / 利用检索增强生成技术增强您的大语言模型 (LLM) ：本课程将引导您快速入门，展示一种高效的工作流程，帮助您节省在向量数据库、嵌入模型和大语言模型 (LLM) 选择上的时间和精力。我们将提供NVIDIA内部采用的起点，结合了流行的开源软件框架。⋙ 学习链接
Building RAG Agents with LLMs / 与大语言模型 (LLM) 一起构建RAG代理：由大语言模型 (LLM) 驱动的代理在工具使用、文档查阅和策略规划方面展现了卓越的检索能力。本课程将指导您如何在实际应用中部署灵活的代理系统，并根据用户和客户的需求进行系统扩展。 ⋙ 学习链接
Accelerate Data Science Workflows with Zero Code Changes / 零代码改动，快速提升数据科学工作流程：本课程将向您展示如何运用RAPIDS工具集，以极小的代价，显著提升您基于CPU的数据科学任务效率。⋙ 学习链接
Introduction to AI in the Data Center / 数据中心AI简介：在 Coursera 上的这门课程中，你将学习有关AI、机器学习、深度学习、GPU架构、深度学习框架以及在数据中心部署AI工作负载的知识。⋙ 学习链接

◉ 点击 👀日报&周刊合集，订阅话题 #ShowMeAI日报，一览AI领域发展前沿，抓住最新发展机会！

◉ > 前往 🎡ShowMeAI，获取结构化成长路径和全套资料库，用知识加速每一次技术进步！

ShowMeAI | what？这些数据也被拿去训练大模型了？AI播客应用三万字创业复盘；英伟达GenAI学习路线图；GenAI时代需要的创业者特质