👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
1. 红杉联合Forbes、Meritech 共同发布「AI 50 2024」榜单
红杉资本 (Sequoia Capital) 是一家全球知名的风险投资公司。Meritech (Meritech Capital Partners) 是一家在高科技领域有重要影响力的美国的私募股权公司。
最近,红杉联合 Forbes (福布斯)、Meritech 共同发布了「AI 50 2024」榜单,选出了他们认为最有希望的50家AI公司。
🎨 Apps
- Consumer Uses: Entertainment, Productivity
- Enterprise Stack: General Productivity, Learning & Development, Customer Experience, Developer & Data Teams
- Industry Verticals: Creative, Defense, Health & Bio, Industrial, Professional Services
🎨 Infrastructure
- Inference Providers
- App Dev Frameworks
- Model Hubs
- Foundation Model Providers
- Store & Compute: Label / Process Data, Cloud Data Providers, Cloud Service Providers
- Hardware
2.科技巨头正在贪婪地吞食互联网数据,为训练大模型可谓不择手段
大模型训练过程中,数据至关重要,尤其是经过专业人士精心撰写和编辑的高质量数据。所以,科技大厂纷纷把目光投向 Wiki 维基百科、Reddit 论坛等等。但这些数据喂不饱越来越大的大模型,于是各家公司为了搞到更多数据开始走「旁门左道」。
之前只是在新闻里看到零星的报道,比如 OpenAI 又吃版权官司了,出版商和艺术家又在声讨科技公司侵权等等。直到 《纽约时报》这篇长文 敲开冰山一角,才发现了科技巨头们费尽心思吞食数据,并渐渐演变成一场让人绝望的狩猎数据。
🎨 OpenAI
- 2021 年末,OpenAI 耗尽了互联网上所有可信赖的英文文本资源。为了解决数据供应问题,研究人员专门创建转录工具把 YouTube 视频中的音频转录成文本,并参与 GPT-4 大模型的训练。
- 据透露,OpenAI 团队最终转录了超过 100万 小时的视频,甚至 OpenAI 总裁 Greg Brockman 也亲自参与其中。
- OpenAI CEO Sam Altman 提出了合成数据的新解决方案,但目前仍不成熟。(合成数据是由AI模型生成数据,再将其继续用于训练,来提升AI系统的性能)
- 知情人士指出,Google 在获取数据时也采取了一些边缘行为,例如自己也违规转录了 YouTube 视频,这应该也是 Google 默认 OpenAI 行为的原因之一。
- 23年6月,Google 扩大了其服务条款,允许 Google 利用公开的 Google Docs、Google Maps餐厅评论等在线信息开发更多的AI产品。Google 隐私团队则趁独立日假期时悄悄发布了这些新条款,希望借助假期转移公众对此的关注和讨论。
- Google 高层知道并默许了诸多行为,虽然发言人表示「在没有用户明确许可的情况下,不会使用 Google Docs 或相关应用的信息来训练语言模型」。
🎨 Meta
- 据说 ChatGPT 发布后,小扎亚历山大,不分白天黑夜地给高管和工程师打电话,催他们开发同等能力的聊天机器人。
- Meta 副总裁 Nick Grudin 在一次会议中指出,与 ChatGPT 相比,Meta 最核心的瓶颈就是数据量不足。
- MeTa 守着 Facebook 和 Instagram 两座数据金山还束手束脚,是由于2018年的一次数据丑闻;Meta 那次修改了隐私政策,也限制了自己使用用户数据的自由度。
- 不过,扎克伯格和高管在不同场合提到了 Facebook 和 Instagram 上数十亿公开共享的视频和照片,并表示 OpenAI 一直在使用受版权保护的材料,Meta 完全可以遵循这个市场先例。
- 为了解决数据问题,Meta 没少花钱,也想了很多躲避的办法,比如收购大型出版集团,或者在非洲雇用承包商来收集敏感数据 (emmm
3. 50位艺术家接力创作,全球首部90分钟AI长篇电影诞生细节大揭秘
3月6号,全球首部完全由AI制作的长篇电影《Our T2 Remake》 在好莱坞举行了首映礼。⋙ 官网
电影由50位AIGC创作者历时数月分段合作完成,全片最终达到了近90分钟的常规商业电影放映长度。制作人之一的Junie 近期在接受采访时分享了这部电影幕后制作的种种细节。⋙ 阅读 Junie 访谈原文
- 电影被拆解成50个部分,每个创作者负责一个或几个特定内容。这些内容涵盖了编剧、音乐、宣传物料、海报设计等多个方面。
- 项目启动前,**制片人明确规定,制作过程中只能使用原创的视频、音效和音乐。**团队还配备了法律顾问,以确保项目不会侵犯原片版权。
- 《Our T2 Remake》团队搭建了官网,便于参与者认领自己感兴趣的片段,并使用 Discord 频道和 Notion 文档来规范和把控制作进度。
- 协作流程:在 Discord 平台上进行创作,依据 Notion 里详细的制作安排、细分章节的剧本,各自推进自己的片段。为了整合起来更方便,每个人都要把 VO 人声、音效和音乐都按标准分轨。与传统影视工作流一样,每个细分章节都有 Shot List (分镜头表),并且为了保持角色一致性,会进行特定的 Lora 训练。”
-
每个创作者、每个章节都会用到不同的技术,除了AI工具,也会用到3D技术、AE (After Effects) 以及实拍等传统影视制作中常见的制片手段,以达成创作者最终想要实现的影片效果。
-
Junie本人用到了AI工具 WorkFlow:
- AI图像生成:Stable Diffusion / Midjourney v5.2/DALL·E
- AI动画:Pika / Runway / Deforum
- 口型同步:D-ID AI
- 旁白:ElevenLabs
- 剪辑:Premiere
- 文字翻译:ChatGPT
4. AI 播客应用 Podwise 三万字复盘:两个月 1.2 万美元 ARR 之路
Podwise 是一款专为播客听友设计的 AI 知识管理应用,可以对播客节目进行转录、提取、总结、分析等操作,而且准确率「一骑绝尘」。此外,Podwise 打通了 Notion、Obsidian、Logseq 和 Readwise 等平台,丝滑嵌入已有的知识管理工作流。
Podwise 创业团队近期撰文 3 万多字,分享了他们 〖两个月 $12000 ARR 实践之路〗,以及探索 PMF (Product-Market Fit) 过程中的灵感、思考、经验和教训,非常细致且真诚。
以下是内容要点目录,感兴趣可以阅读原文~
00 前言
- 0.1 Podwise 是什么?
- 0.2 我们为什么要做 Podwise?
01 灵感
- 1.1 从社区出发
- 1.2 百万美金的利基市场
- 1.3 MVP MVP MVP
02 构建
2.1 设计与开发一体
- ① 设计开发一体
- ② 如何设计功能性界面?
- ③ 如何设计 Landing Page?
- ④ 用 Keynote / PowerPoint 设计营销图片
2.2 用方便且擅长的技术栈
- ① Web 前后端为什么选择 JS/TS 技术栈?
- ② 为什么选择 TS 而非开发速度更快的 JS?
- ③ 为什么选择 NextJS 作为 Web framework?
- ④ 纯后端服务为什么选择 Golang 技术栈?
- ⑤ 为什么不是 langchain
- ⑥ 这个技术选型下遇到的问题
- ⑦ 在经历这一切之后重新选择技术栈的话,我们会怎么选?
- ⑧ 我们的技术选型建议
2.3 关于大模型必须知道的事
- ① 内容生成类 AI 产品的后台服务大有不同
- ② 理解 AI 模型的能力边界
- ③ 模型选择
- ④ AI 工作流
- ⑤ Prompt
2.4 省下的都是赚的
2.5 能用的服务千万别自己做
03 发布
- 3.1 最初的 200 个用户
- 3.2 永远跟用户站在一起
- 3.3 定价要关注成本
04 增长
- 4.1 到杠杆高的地方去做宣传
- 4.2 互动、回复、关注长尾
- 4.3 意料之外的爆发
05 复盘
5.1 对远景的一些规划
5.2 最不应该犯的错误
5.3 还会坚持干的几件事
- ① 从社区出发
- ② 快速发布
- ③ 大胆谈钱
5. 7 个月从 0 到 100 万美元收入,HeyGen 的 AI 创业传奇
HeyGen 是一家拥有数百万用户的AI公司,是短视频内容AI口型匹配和翻译领域最大的参与者之一。
凭借泰勒·斯威夫特说中文、郭德纲讲英语这类AI视频一炮走红,最新消息是总部已经搬到洛杉矶,正在筹集 6000 万美元,按照投资前估值 4.4 亿美元进行融资。
文章作者 ,是HeygGen CEO &联合创始人 Joshua Xu (徐卓) 撰文〖0 - 1M ARR in 7 months〗,分享自己团队在7个月内实现了 100 万美元的 ARR (年度经常性收) 的经验与心得。
以下是内容要点目录,原文将近一万字,感兴趣可以阅读原文!
00 背景
01 产品市场契合度 → AI 市场契合度
- 1.1 以最小的成本验证我们寻找的 AI 市场契合度
- 1.2 经验教训:
02 产品迭代
- 2.1 7 月 29 日上线
- 2.2 发明 TalkingPhoto
- 2.3 增加流量——免费版+水印,导致一个月内出现 3 次宕机
- 2.4 增强病毒传播引擎——Gen AI 全景图的助力
- 2.5 改善用户体验
03 如何构建产品?
- 3.1 每周发布的更新节奏
- 3.2 只在问题出现时修复
- 3.3 适应分布式团队合作
- 3.4 尽早建立数据仪表板
- 3.5 A/B 测试是一个陷阱
- 3.6 我们用的工具
04 客户
- 4.1 最大化与客户的沟通
- 4.2 建立团队透明度
- 4.3 避免定制化
- 4.4 如何做不可拓展的事情
05 我们是如何学习的
6. 研究:什么样的 AGI 创业者更容易获得资本青睐?
这篇研究很有意思,是国内6位投资人对当下 AI 浪潮的判断,以及各自心中的 AGI 创业者的能力画像。 ⋙ 阅读原文
王啸 - 九合创投 创始人
- 重视项目是否拥有高技术壁垒、解决核心问题的能力、团队创造真实价值的能力,以及市场天花板的高度。
- 项目短期内无法自造血时,团队需要具备强大的融资能力。
- 格局大的创始人能够聚集不同背景的人才,弥补团队不足,并妥善处理利益分配。
刘博 - 清流资本合伙人
- 关注项目应用场景的市场空间、CEO的能力/性格/项目之间的适配性,以及项目融资后半年内的规划合理性。
- CEO的韧性对项目成功至关重要。
- 特别关注AI在驾驶领域的应用,认为驾驶领域智能状态的提升是AI应用效果的一个重要观察点。
张津剑 - 绿洲资本创始合伙人
- AI带来的是社会层面的变革,而不仅仅是技术层面的革新。
- AI是整个科技变革的一个切面,而非独立存在的技术。
杨孟彤 (Melissa) - Atom Capital 创始合伙人
- AI落地应用的新趋势,是从大模型向复合人工智能系统迁移。
- 当前AI的PMF多在大厂内部落地,,而非公开市场。
- 2024年可能是「多模态大模型之年」。
白则人 - 线性资本 投资副总裁
- 看重AI如何将智能转化为可流动和可规模化的资产,从而革新传统商业模式。
- AI的存在使得交互形式有新变化的可能,可以加速场景的创新和重构。
- 创始团队从一开始就应该具备全球视野。
炊文伟 - BV 百度风投高级投资经理
- 在B端,AI的目标是应该是增加收入,而不仅仅是降本增效。
- 一些AI+的机会更适合行业内的老厂商,而不是新的创业者。
- 距离人越近的领域,AI带来的增量价值就越难讲清楚。
李远远 - 小苗朗程高级投资经理
- 在C端,AI应用只有大成或不成两种可能,成功的关键在于深刻理解人性和市场。
- 在B端,AI应用更多应以 SaaS+AI 的模式发展,而非 AI+SaaS。
- 当前商务环境下,获得大额订单、保持良好现金流和拥有强大技术壁垒,是一个不可能三角。
7. Hugging Face 新课开放免费预约:Machine Learning for 3D (用于3D的机器学习课程)
HuggingFace 新推出了一门 3D 相关AI课程,专注于最前沿的生成式3D研究基础知识。预告将于5月15日正式更新,目前可以 免费订阅 啦~
课程要点:
- 🏗️ 生成式3D研究的基本概念和构建模块
- 🎨 高斯喷溅 (Gaussian Splatting) 的工作机制,可能包含相关的实践环节
- 🔎 创建生成式3D演示的指导教程,促进学习者的动手实践能力
- 📚 课程适合对3D生成研究感兴趣的研究者和学生,以及希望在这一领域拓展知识的专业人士
8. NVIDIA 英伟达官方发布 GenAI 学习路线图,开放8门视频课程
NVIDIA 英伟达也出免费视频课程了!一共8门,官网注册即可开始学习~ 让我们一起来看看都有哪些内容~
-
Generative AI Explained / GenAI 解释:这门课程无需编程,目标是学习 GenAI 的概念和应用,以及这个激动人心领域中的挑战和机遇。⋙ 学习链接
-
Getting Started with AI on Jetson Nano / 在 NVIDIA Jetson Nano 上启航AI之旅:利用 NVIDIA Jetson Nano 构建并训练一个用于分类的数据集和模型。⋙ 学习链接
-
Building A Brain in 10 Minutes / 探索神经网络的生物学灵感:本课程将深入探讨早期神经网络设计背后的生物学原理。⋙ 学习链接
-
Building Video AI Applications at the Edge on Jetson Nano / 在 Jetson Nano 上打造边缘视频AI应用:掌握如何利用 DeepStream 开发套件创建应用,通过目标检测与分类网络对视频流进行智能注释。⋙ 学习链接
-
Augment your LLM Using Retrieval Augmented Generation / 利用检索增强生成技术增强您的大语言模型 (LLM) :本课程将引导您快速入门,展示一种高效的工作流程,帮助您节省在向量数据库、嵌入模型和大语言模型 (LLM) 选择上的时间和精力。我们将提供NVIDIA内部采用的起点,结合了流行的开源软件框架。⋙ 学习链接
-
Building RAG Agents with LLMs / 与大语言模型 (LLM) 一起构建RAG代理:由大语言模型 (LLM) 驱动的代理在工具使用、文档查阅和策略规划方面展现了卓越的检索能力。本课程将指导您如何在实际应用中部署灵活的代理系统,并根据用户和客户的需求进行系统扩展。 ⋙ 学习链接
-
Accelerate Data Science Workflows with Zero Code Changes / 零代码改动,快速提升数据科学工作流程:本课程将向您展示如何运用RAPIDS工具集,以极小的代价,显著提升您基于CPU的数据科学任务效率。⋙ 学习链接
-
Introduction to AI in the Data Center / 数据中心AI简介:在 Coursera 上的这门课程中,你将学习有关AI、机器学习、深度学习、GPU架 构、深度学习框架以及在数据中心部署AI工作负载的知识。⋙ 学习链接
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ > 前往 🎡ShowMeAI,获取结构化成长路径和全套资料库,用知识加速每一次技术进步!