获得徽章 0
活动预告!
🚀 加入我们,在【大模型创业的趋势:走向与Infra的技术边界】研讨会,揭秘GPU边缘技术和HBM存储。深入交流AI创新与实践,与行业领袖一起探索未来!
🌟 时间:3/30上午,地点:线上。扫码报名,锁定未来科技的脉动!
AI椰青于2024-03-25 18:07发布的图片
评论
Sora最近活动挺多的,奇绩的周末的活动希望从模型架构、数据、芯片Infra、产品、开源多个角度预测,分析留给产品和创业的机会
嘉宾背景:
对于模型 Saining Xie的大弟子;
英伟达视频生成的核心作者;
交互式游戏叙事鬼才;
华为芯片的天才少年从芯片角度分析Sora的成本变化;
HuggingFace开源生态

名额有限,欢迎扫码报名~
展开
AI椰青于2024-02-26 13:37发布的图片
评论
#大模型日报#
大模型日报春节特刊来袭(目录节选):
一.资讯
1️⃣陈丹琦团队新作:数据量砍95%,大模型性能更强了!Less is More
2️⃣斯坦福最强家务机器人ALOHA 2来了,成本不到20万,联手谷歌DeepMind,完全开源
3️⃣MIT、IBM 团队巧妙的 AI 方法来解决「蛮力」数学问题
4️⃣RAG还是微调?微软出了一份特定领域大模型应用建设流程指南
5️⃣春节大礼包!OpenAI首个视频生成模型发布,60秒高清大作,网友已叹服
6️⃣谷歌Gemini1.5火速上线:MoE架构,100万上下文
7️⃣突发!AI大牛Andrej Karpathy离开OpenAI
二.推特
1️⃣Akshay分享Thread:LLM如何工作,从条件概率开始
2️⃣微软Copilot上线开售:对任何人、任何地方、任何设备都可用
3️⃣1X机器人上线:全神经网络。全自动。全部1X速度
4️⃣Whisper API现在支持词汇和片段级的时间戳
5️⃣Lilian Weng分享文章《思考高质量人类数据》:高质量数据是现代数据深度学习模型训练的燃料
6️⃣谷歌深度学习Chollet:人们对LLM的观点现在总是走向两个极端
7️⃣LeCun被评TIME100影响力奖的三位获奖者之一
8️⃣DeepLearning 新课程:Amazon Bedrock无服务器应用的新短期课程
9️⃣Altman:Openai现在每天生成约1000亿个单词,评论区嘲讽7 trillion芯片计划
🔟Elvis分享LLM代理概述:关于构建基于LLM的代理的关键发展、洞察和实用技巧
三.论文
1️⃣百万长度视频和语言上的世界模型与RingAttention
2️⃣数据工程:将语言模型扩展到128K上下文
3️⃣刺猬与豪猪:带有Softmax模仿的表达性线性注意力
4️⃣3D高斯新视觉时代:综述
5️⃣无需搜索达到国际象棋大师级水平
6️⃣OpenMathInstruct-1: 180万条数学指令微调数据集
7️⃣StableMask: 为仅有解码器的Transformer优化因果掩码
8️⃣Lumos:赋能多模态大语言模型与场景文本识别
9️⃣屏幕智能体:用于用户界面和信息图解析的视觉语言模型




展开
AI椰青于2024-02-18 14:41发布的图片
3
#大模型日报#
今日大模型日报:
1️⃣研究
1.CMU&ETH实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!
2.罕见!苹果开源图片编辑神器MGIE,要上iPhone?
2️⃣产业
1.王长虎:PixVerse 实测效果已超过 Pika,抖音经验让我们有足够优势
2.来生成式 AI 黑客马拉松赢取丰厚奖励,向世界展示你的才华!
3.华泰 | 海外科技:四巨头以云、广告、AI为主战场
3️⃣推特
1.奥特曼:GPT-4 在新年决心上起步缓慢,但现在应该会变得不那么懒惰了!
2.LlamaBot开源Discord 机器人:能够听取你的对话,记住它们,并在一个 Discord 服务器中回答你的问题
3.Natural-SQL-7B:新的、非常强大的 Text to SQL 模型
4️⃣论文
1.PokéLLMon: A Human-Parity Agent for Pokémon Battles with Large Language Models
2.Improving Reinforcement Learning from Human Feedback with Efficient Reward Model Ensemble
5️⃣产品
1.samwell.AI-通过 AI 改变学术写作的解决方案
2.Reducto AI-将复杂的非结构化文档转换为结构化输出
6️⃣HuggingFace&Github
1.SVD 1.1版本-模型本体缩小到4GB左右,同时提高了推理速度
2.IOPaint-图像修复工具
7️⃣投融资
1.2023年江苏省投融资报告丨一级市场发生融资事件1462个,智能制造行业最热;65家企业完成IPO,比去年下降20%
2.创投周报(1.29-2.4)
8️⃣学习
1.C++如何避免float误差?
2.AI Infra论文阅读之将流水线并行气泡几乎降到零
展开
AI椰青于2024-02-05 21:09发布的图片
评论
#大模型日报#

2024年2月4日大模型日报:
1️⃣研究
1.击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了
2.浙大团队发布 75 页科学 LLM 调查,重点关注生物和化学领域,指出七个未来发展方向
2️⃣产业
1.大的要来了:谷歌Bard被曝将更名为Gemini,Ultra 1.0更强但收费、安卓App也会来
2.即使“杀不死”英伟达,OpenAI等数十家 AI 公司也要全力“围剿”它
3.2024年AI算力行业上市公司全方位对比(附业务布局汇总、业绩对比、业务规划等)
3️⃣推特
1.Rawdog:创造自然语言命令行界面,生成Python脚本来回答你的问题,在当前工作目录中自动执行它们
2.Hugging Chat Assistant:在Hugging Face Chat中仅需两次点击就能构建你自己的个人助手,创造定制版本的Huggingface Chat
3.Anaconda联创调侃:当人类真的创造出人工通用智能(AGI)时,它将被命名为Untitled14.ipynb
4️⃣产品
1.PROCESIO-面向企业的自动化平台
2.PICTORY-将博客文章转化为视频的工具
5️⃣HuggingFace&Github
1.MiniCPM-开源的系列端侧大模型
2.OLMo-开放语言模型的存储库
6️⃣投融资
1.从2019到2023年,ToB资本发生了哪些变化?
2.百页PPT,回顾VC/PE的2023
7️⃣学习
1.AI领域精选文章(2024年汇总版)!
2.2023年大语言模型智能体规划技术(LLM Agent Planning)研究进展汇总
最新综述更多信息,请查看飞书文档👉🏻:miracleplus.feishu.cn
展开
AI椰青于2024-02-05 13:22发布的图片
评论
#大模型日报#

今日大模型日报:
1️⃣研究
1.大模型也有小偷?为保护你的参数,上交大给大模型制作「人类可读指纹」
2.阿里全新Agent玩转手机:刷短视频自主点赞评论,还学会了跨应用操作
2️⃣产业
1.A16Z 最新 AI 洞察|2023 年是 AI 视频元年,2024 年还有这些难题需要解决
2.2B参数性能超Mistral-7B:面壁智能多模态端侧模型开源
3.亚马逊推出人工智能购物助手 TRufusJ
3️⃣推特
1.OpenBMB发布一系列边缘模型,包括接近Mistral 7B的2.4B基础模型
2.Nomic Embed:第一个完全开放的长文本嵌入器,超越OpenAI
3.Stutz分享在谷歌DeepMind的经历和反思:人工智能领域的发展速度令人难以置信
4️⃣论文
1.OLMo:加速语言模型科学研究
2.Dolma:用于语言模型预训练研究的三万亿 token 的开放语料库
3.FormalLLM:将正式语言和自然语言集成为可控的基于大语言模型的智能体
5️⃣产品
1.GPTGuard-保护数据隐私和安全的 AI 工具
2.Flipner AI - AI 写作工具
6️⃣HuggingFace&Github
1.MoE-LLaVA-新颖的 LVLM 训练策略
2.如何借助 AI 制作红包封面
7️⃣投融资
1.Generative AI Startups funded by Y Combinator (YC) 2024
2.2023年上海市投融资报告丨一级市场融资事件1197个,浦东新区占21%;46家企业IPO,共募资589亿元
8️⃣学习
1.大模型推理框架RTP-LLM对LoRA的支持
2.Richard Sutton ||智能决策器通用模型的探索
最新综述更多信息,请查看飞书文档👉🏻:miracleplus.feishu.cn
展开
AI椰青于2024-02-03 00:27发布的图片
评论
下一页
个人成就
文章被阅读 1,707
掘力值 97
收藏集
0
关注标签
0
加入于