获得徽章 24
- #挑战每日一条沸点# OpenAI 罕见地分享了他们关于统一 GPT-5 模型的路线图。主要要点如下:
- GPT-4.5 将在“数周内”推出,这是他们最后一个非推理类模型(类似 GPT-4o)。
- o3 不会作为独立模型发布。
- 取而代之的是,他们将在“数月内”推出 GPT-5,它将融合 o3 和 GPT-4.5。
- GPT-5 将成为一个能够使用所有工具(如语音、搜索、Canvas、深度研究等)的系统——它可以自动决定该使用什么工具以及使用多高程度的推理。
- 这将同时适用于 ChatGPT 和 API。
- 在 ChatGPT 中,免费用户将获得 GPT-5 的无限使用权限。
- Plus 用户将获得更高水平的智能,Pro 用户则会更高。展开评论点赞 - #挑战每日一条沸点# Perplexity 推出 Deep Research 功能
可以生成一份详尽且全面的报告 并导出为PDF
Perplexity 深度研究具备搜索和编码能力,可以反复搜索、阅读文档,并根据新获取的信息不断完善研究计划,类似于人类专家的研究过程。展开评论点赞 - #挑战每日一条沸点# 看到篇讲大模型 temperature和top_p设置的文章,好奇
为什么默认是0.7 和 (0.5-0.8)的设置,Gemini Flash thinking给的解释:
## 1. 为什么 0.7 常常作为 temperature 的默认值?
temperature = 0.7 通常被认为是 在创造性和可靠性之间取得较好平衡 的一个值。
在这个温度下,模型在各常见任务 (例如:对话、文本生成、摘要等) 中,都能产生相对令人满意的、质量和多样性兼顾的输出。
## 2. 为什么 top_p 的常用建议范围是 0.5 - 0.8?
top_p 的主要作用是控制采样范围,降低 top_p 可以约束模型的生成方向,使其更聚焦、更可控。
0.5 - 0.8 这个范围,被认为是既能有效控制发散程度,又能保留一定的多样性和创新性的一个平衡区间。
top_p 过高 (例如 0.9 - 1.0),采样范围过大,可能导致模型生成内容过于发散、主题不明确、跑题等。
在高 temperature 的情况下,这种 “失控” 的风险更高。
top_p 过低 (例如 0.3 或更低): 采样范围过窄,会导致生成内容过于保守、重复、缺乏新意,甚至出现 “卡壳” 或循环的情况。
对于需要较高准确性和可靠性的任务 ,例如:事实性问答、代码生成,top_p 可以适当调低一些,例如 0.3 - 0.6
对于需要较高创造性和多样性的任务 ,例如:故事创作、头脑风暴。 top_p 可以适当调高一些,例如 0.7 - 0.9
top_p 值越低,要考虑的词语数量越少,计算效率相对越高。
在某些对延迟敏感应用场景下,适当降低 top_p 也有一定的性能优化作用。展开赞过评论2 - 『知识墙:什么是AI智能体』
AI Agent(智能体)被定义为能够感知环境、做出决策并采取行动的人工智能实体。受美国汽车工程师学会SAE提出的自动驾驶六个级别启发,在论文《Levels of AI Agents: from Rules to Large Language Models》中,作者把人工智能智能体也基于效用和强度分为以下级别:
1、L0:无人工智能,只有工具(具备感知能力)加上行动
2、L1:使用基于规则的人工智能
3、L2:用基于模仿学习(IL)/ 强化学习(RL)的人工智能替代基于规则的人工智能,并增加推理和决策功能
4、L3:用基于大型语言模型(LLM)的人工智能替代基于 IL/RL 的人工智能,另外设置记忆和反思模块
5、L4:在 L3 的基础上,促进自主学习和泛化
6、L5: 在 L4 的基础上,添加个性(情感 + 性格)和协作行为(多智能体)
#挑战每日一条沸点#展开评论点赞 - 『Omdia:发布中国大模型厂商竞争力排名报告』
近日,Omdia发布首份《中国大模型厂商竞争力排名报告》,阿里云、百度云、质谱AI等入选领导者象限。但值得关注的是,华为并没有参与本次评选。
根据Omdia发布的《亚洲和大洋洲人工智能软件市场预测》报告,亚太地区的生成式人工智能GenAI市场规模在2023年估计为16亿美元,并预测从2024到2030年,生成式人工智能在亚太市场规模的复合年增长率CAGR预计将达到53%,大部分的增长来源于中国。
Omdia报告中指出,中国是开发AI最为积极的市场,截至2024年1月,中国基础模型总数已超230个。基于模型通用能力、专业领域能力、厂商执行能力、解决方案丰富度、战略与创新、市场影响力等多个维度,Omdia对最领先的12家中国模型厂商进行综合评估,按照得分划分为领导者、挑战者、潜力者三大象限。展开评论点赞 - 『名人名言:朱啸虎表示AI应用明年肯定爆发,每轮周期最后,应用赚的钱是前面的10倍』
5月8日,在投中网举办的第18届中国投资年会·年度峰会上,金沙江创投朱啸虎和猎豹移动董事长傅盛围绕“智辩未来-大模型的终极形态及价值发掘”进行了一场超级对话。我们整理了朱啸虎的核心观点,分享给家人们:
1、中国VC和美国VC很大差别似乎是美国VC过去几十年很明确,基本是十年一个周期,中国的VC过去20年都习惯短周期——每三年一个周期......(将来)中国的VC可能要习惯十年的长周期期限。
2、我们一直在关注AI的应用,且只关注能够商业化、实现PMF的AIGC应用,而且明年这个时间点上AI应用肯定会大爆发。
3、确实每一个周期一开始都是硬件和基础设施赚的钱多一点,但到后面就是应用,应用赚的钱是前面的十倍以上。
4、边缘端的开源小模型必然是未来方向,这里面商业机会特别多。
5、Sam Altman在吹牛逼,GPT-5肯定没那么惊艳,或者惊艳与否不重要了。GPT-4已经满足了绝大部分的商业需求了。
此前4月份,朱啸虎的一个采访报道引发热议,朱啸虎直言别下牌桌,他表示,今年二级市场看高分红,一级同样看分红,且5年靠分红拿回本金,关于“5年靠分红拿回本金”的说法,经纬创投张颖意见不同,他认为美元LP未必认可。对于“五年回本靠分红”的说法,朱啸虎对此也有了进一步的解释,明确说的是「消费项目」。展开等人赞过14
为什么默认是0.7 和 (0.5-0.8)的设置,Gemini Flash thinking给的解释: