获得徽章 7
Midjourney 最近组建了一个硬件团队,专注于3D数据的收集工作,未来可能会进入个人计算领域。他们提到了一种名为「Orb」设备,这种设备可以让任何人组织和管理成千上万的虚拟3D空间。

这表明 Midjourney 正在探索3D数据和虚拟空间相关的硬件解决方案。3D数据收集是创建高质量虚拟环境的关键步骤,这可能涉及到图形渲染、空间建模等技术。而提到的“Orb”设备,听起来像是一个创新的设备,用于更高效地处理和管理复杂的3D空间。附图是链家VR看房用到的3D拍摄设备:
展开
江昪于2024-01-12 11:12发布的图片
评论
如果你有一定的代码基础,希望深入了解一下 transformer 的实现,这个教程包含多种基于 Transformer 架构的 PyTorch 实现和扩展,包括从原始论文《Attention Is All You Need》到各种衍生和增强模型的详细说明。
评论
Meta首席AI科学家杨立昆最近接受连线杂志的专访,他在专访中强烈反对关于AI的灾难论调,认为 AI 不应该被少数公司控制,并强调开源 AI 的重要性。

🌟 AI领域先锋: 作为现代 AI 的先驱和 Meta 的首席AI科学家,杨立坤是 AI 技术的积极捍卫者。
🚫 反对灾难论调: 他反对同行对 AI 的末日场景的预言,例如强人工智能会增加错误信息和导致人类灭绝。
✉️ 公开信支持开源 AI: 向美国总统拜登的一封公开信中,他支持开源 AI,反对让 AI 控制权集中在少数公司手中。
🏆 图灵奖得主: 他与 Geoffrey Hinton 和 Yoshua Bengio 共同开创深度学习方法,获得了计算领域最高荣誉图灵奖。
🌐 Meta的AI贡献: 帮助马克·扎克伯格将 Meta 的一些 AI 技术开源,如发布 Llama 2 大型语言模型。
🤖 对聊天机器人的看法: 认为它们虽有巨大进步,但产生的内容可能枯燥且不准确。
🔍 对机器学习的批判: 认为单纯扩大现有技术不足以实现人类级别的AI。
🌍 全球影响: 强调开源 AI 对于全球多元化和安全的重要性,特别是在文化和语言多样性方面。
📈 AI 发展的未来: 预测未来所有与数字世界的互动都将由 AI 系统介导。
🎷 关于AI和艺术: 虽然AI最终可以创造出技术上与人类相当甚至超越的艺术作品,但他认为AI作品缺乏人类音乐的情感沟通和灵魂。
展开
2
鼓励师 @掘金
一不小心刷董宇辉到现在,这剧情我太熟悉了。
周五下午,董宇辉被东方甄选大字报宣布开除,顿顿作为临时金牌主播。互联网一片哗然,大家议论纷纷是东方小孙在使坏。
第二天周六,董宇辉发抖音表示还爱公司,爱公司所有人。东方甄选员工在评论区刷❤️。顿顿居然也刷了❤️。不上班的吃瓜网友沸腾了。
第三天,京东向董宇辉抛出橄榄枝,表示愿意支持董宇辉负责京东直播新业务,同时接收离职的东方甄选员工,一时间互联网议论纷纷东方甄选员工的天价离职补偿金。
与此同时,东方甄选立即罢免了倒戈的顿顿,联系罗永浩来顶上临时CEO,罗永浩老师临危受命,在微博上写下小作文愿意帮东方甄选走出困境。
董宇辉从陕西紧急飞往首都机场,前往中关村的新东方大楼与董事会谈判。在前台等待签到的时候,董宇辉还不忘在抖音晒临时工牌的自拍🤳
第四天,东方甄选内部的威胁董事会离职的联名信泄露出来,令人大跌眼镜的是,前十名签名的员工居然出现了东方小孙的名字,怎么回事,小孙你难道不是始作俑者?互联网又炸开了花。
(待续)
展开
5
OpenAI 推出价值1000万美元的“超级对齐快速补助”项目,旨在支持技术研究,确保未来超人工智能系统的对齐与安全。

🎯 目标:支持对超人工智能系统的对齐与安全研究。
🌍 背景:认为超级智能可能在未来10年内到来,存在巨大潜力与风险。
🚀 现有技术:目前通过人类反馈的强化学习(RLHF)来对齐AI系统。
🤖 挑战:超人工智能将展现复杂且创造性的行为,超出人类理解能力。
🧠 基本问题:如何引导和信任比人类更智能的AI系统?
💡 研究方向:包括弱到强的泛化、可解释性、可扩展的监督等。
💰 资金支持:提供一千万美元的补助,支持学术实验室、非营利组织和个人研究者。
🎓 学生资助:为研究生提供一年期的15万美元OpenAI超级对齐奖学金。
📆 申请截止日期:2月18日。
展开
评论
a16z 博客公布参与 Mistral 的 A 轮融资,投资金额 4.15亿美元。

* 这家著名的风险投资公司12年前曾宣称“软件正在吞噬世界”,如今则转向“AI将拯救世界”的口号。
* 他们投资了20多个领域的创业公司,包括医疗健康、生物科学、代码自动化以及大型语言模型和其基础设施。
* A16z 还参与了 OpenAI 在四月的3亿美元投资轮。
* Mistral AI 的投资强调了对开源大型语言模型创造者的支持,这是 A16z 在此领域的首次投资。
展开
10
最终章:Sam Altman 和 Greg Brockman 加入微软
江昪于2023-11-20 16:01发布的图片
2
OpenAI DevDay 上发布的 tts 接口已经有线上 demo 可以试用,来选一下你最喜欢的声音:
huggingface.co
5
xAI团队开发了一款名为Grok的AI,其模仿《银河系漫游指南》的风格,旨在以幽默的方式回答各种问题,该AI通过𝕏平台实时了解世界,可以回答一些其他AI系统无法回答的问题,目前Grok还处于早期测试阶段,团队希望通过用户反馈进行不断改进。


🤖 Grok是一个模仿《银河系漫游指南》的AI,旨在以幽默的方式回答各种问题。
🌍 Grok通过𝕏平台实时了解世界,能回答一些其他AI系统无法回答的问题。
🧪 Grok目前还处于早期测试阶段,团队希望通过用户反馈进行不断改进。
🛠️ xAI团队的目标是创建AI工具,帮助人类在寻求理解和知识的过程中得到帮助。
🚀 他们开发了Grok-1引擎,经过多次迭代,取得了令人满意的结果。
💡 xAI团队致力于研究和创新,希望Grok能成为一个强大的研究助手,帮助人们快速获取相关信息,处理数据,并提出新的想法。
🏫 他们使用一系列标准的机器学习基准来衡量Grok-1的数学和推理能力,结果显示Grok-1在其计算类别中表现出色,超过了所有其他模型,包括ChatGPT-3.5和Inflection-1,仅次于使用了大量训练数据和计算资源的模型,如GPT-4。
📚 xAI团队在深度学习研究的前沿,构建了一套基于Kubernetes、Rust和JAX的自定义培训和推理堆栈。
📝 xAI团队正在进行一系列有前景的研究,包括可扩展的人工监督、与正式验证的集成、长文本理解和检索、对抗性鲁棒性和多模态能力。
🇺🇸 xAI团队正在向美国的一部分用户提供试用Grok原型的机会,并希望通过他们的反馈来改进Grok的能力。

介绍内容:x.ai
内测申请:grok.x.ai
展开
评论
赞了这篇沸点
𝗖𝗵𝗮𝘁𝗚𝗣𝗧 𝗧𝗲𝗮𝗺 𝗣𝗹𝗮𝗻 团队计划即将到来!
- Create workspace
- 30 USD / U / M(单人月付费计划)
- 90 USD / 3U / M(三人月付费计划)
- 25 USD / U / M / Y(单人年付费计划)
- 75 USD / U / M / Y (三人年付费计划)
展开
7
24小时内,大语言模型圈子的大事情:
1. OpenAI DevDay 将在11小时后开始,直播预约地址:youtube.com
2. twitter 发布了大模型产品 grok,产品亮点:获取最新的资讯信息,更长的上下文,支持分支聊天等
评论
如果你用的是 M1 或者 M2 芯片的 Macbook,现在可以4秒钟左右出一张图。这是清华大学 Simian Luo 基于 Stable Diffusion 优化的潜在一致性模型(LCM),LCM 可以更快地生成图像,只需4到8个步骤就能得到一张好的图像(相比于25到50个步骤)。

在线:replicate.com
论文:arxiv.org
hf:huggingface.co
展开
江昪于2023-10-30 19:00发布的图片
11
试了一下 llama.cpp 最新支持的多模态大模型 LLaVA。能准确识别驾照上的信息,并输出为 json 格式。
借助图片识别能力的革新,后续估计会影响到 OCR 产品的识别准确度,以及无障碍应用,例如帮视障人士描述图片上的内容;还有 CMS 工具,上传一张图片后,能描述内容并写道 alt 标签内,获取图片搜索的流量。你还能想到哪些应用场景呢?
江昪于2023-10-24 16:53发布的图片
评论
Siri 可能在 iOS 18 版本有重大更新,新增类似 ChatGPT 能力。根据来自海通国际证券的分析师Jeff Pu的供应链消息,据称苹果计划在最早于2024年底开始在iPhone和iPad上实施生成式AI技术。
6
因为开发者转到 ChatGPT 咨询技术问题,StackOverflow 流量受到很大影响,最近被迫裁员 28%
评论
TensorFlow 是如何在大语言模型潮流中逐步掉队的?
4
杨立昆预测大语言模型生态的未来将包括以下几个部分:

- 少量的开源推理代码,
- 免费的预训练基础模型,
- 众包的微调模型,

在这些基础上,将构建定制的(可能是闭源的)产品。
我们可以预见,未来的模式将更侧重于开源和群体参与。少量的开源推理代码意味着我们共享和优化已有的关于 AI 决策推理的代码。预设的模型可以被免费使用,且已经经过预训练以适应各种场景。而众包的模型则依赖于大众的参与和贡献,以精细调整和优化这些模型,让它们更好地适应特定需求。最后,这些免费、开源的工具和资源将被用来构建定制的产品,这些产品可能会是闭源的,取决于开发者的策略和商业模式。
展开
江昪于2023-10-16 11:49发布的图片
评论
llama.cpp 最近收到一个支持多模态的 PR,接入 LLaVA-v1.5-13B-4bit-hf 模型后,可以识别图片上的内容。最让我印象深刻的是可以识别美国驾照,并按照 prompt 的要求,将驾照上的内容输出结构化的 json

PR地址:github.com
展开
江昪于2023-10-12 17:39发布的图片
评论
教程:用黑客的视角来学习大语言模型
www.youtube.com
评论
下一页
个人成就
优秀创作者
文章被点赞 14,917
文章被阅读 946,883
掘力值 31,747
收藏集
7
关注标签
83
加入于