“AI将取代许多重复性、规律性强的工作,但同时也会创造新的工作机会,人类需要与AI协作,提升自己的创造力和情商,以适应新时代的发展。”— — 李开复
LIST | 本周(11.11 ~ 11.15)快讯:
- ChatGPT Windows版全面上线;
- 谷歌DeepMind开源诺奖级AI AlphaFold 3;
- 即梦AI视频生成模型重磅更新;
- 通义代码模式正式上线;
- 大公司对AI的无知与科创公司的巨大机遇;
- 小米计划推出新一代AI眼镜;
- 腾讯元宝2.0版本正式上线;
- 钉钉AI升级;
- 生数科技Vidu 1.5引领AI视频生成新纪元;
- MiniMax海螺AI海外版月访问量达1173万,同比增长2772.92%;
- 免费高清抠图软件RMBG 2.0强力升级;
- 百度世界 2024 大会发布两项新技术;
1、ChatGPT Windows版全面上线!
11月15日,OpenAI发布联想更新:旨在提升 ChatGPT 在 Windows 和 Mac 系统上的实用性。
对于Windows 用户,桌面版ChatGPT全面推出。支持拍照识别,用户可以使用电脑自带的摄像头进行拍照,然后让ChatGPT进行解读或提问。OpenAI之前发布的GPT-4o的高级语音模式,也可以在桌面版ChatGPT使用。而对于 macOS 用户,新版 ChatGPT 桌面应用则进一步增强了开发者的使用体验。新的 “与应用协作” 功能让 ChatGPT 能够访问并读取其他应用的内容,但前提是用户需授予权限。
引自:opai官网 openai.com/chatgpt/des…
2、谷歌DeepMind开源诺奖级AI AlphaFold 3,开启药物发现和分子生物学新时代
谷歌DeepMind团队开源了AlphaFold 3的源代码和模型权重,供学术使用,这可能加速科学发现和药物开发。AlphaFold 3不仅能预测蛋白质结构,还能模拟蛋白质、DNA、RNA和小分子之间的复杂相互作用,这对于现代药物发现和疾病治疗至关重要,因为传统方法研究这些相互作用往往耗时且成本高昂。
3、即梦AI视频生成模型重磅更新,推出S2.0 Pro和P2.0 Pro两大模型
即梦AI视频生成模型11月15日更新,推出S2.0 Pro和P2.0 Pro两大模型。S2.0 Pro以首帧一致性和细节还原著称,能精确描绘原作并融入创意。P2.0 Pro则以高提示词遵循能力,能将复杂创意转化为视频内容。用户可通过即梦App或官网选择模型,实现灵感即刻成片,享受AI视频创作新体验。
引自:即梦ai官网 jimeng.jianying.com/ai-tool/vid…
4、通义代码模式正式上线,一句话帮你生成应用
通义千问的代码模式正式上线,新功能支持用户无需编程知识即可生成应用,支持前端页面、设计素材、生日贺卡、数据图表、小游戏和精美简历等。代码模式背后的技术基于Qwen2.5-Coder(在多项基准评测中表现优异的开源代码模型)。用户现在可以通过通义官网体验这一创新功能。
通义代码模式是阿里旗下的通义推出的创新功能,支持用户通过简单的指令(Prompt)生成代码,实时预览代码生成的页面或应用。适用于快速开发动态网页和交互式应用,如太阳系模型动画。用户只需提供详细的需求描述,AI就能自动编写HTML和JavaScript代码,实现复杂的动画效果。通义代码模式支持多种编程语言,能将代码渲染成小游戏、网页和数据图表等,降低了应用开发的门槛,非专业程序员也能轻松创建应用。
引自:通义千问官网 tongyi.aliyun.com/qianwen
5、OpenAI山姆·奥尔特曼最新专访:大公司对AI的无知与科创公司的巨大机遇
奥尔特曼强调,当前AI技术仍处于快速提升的初期阶段,未来的发展空间巨大,他鼓励创业者紧抓这一科技浪潮,在早期阶段利用AI实现飞跃式增长。他认为,大公司受限于复杂的规划周期,初创公司则可以凭借速度、专注度和适应力脱颖而出,创造出更具竞争力的产品和服务。
在谈及AGI的发展路径时,奥尔特曼描绘了从“聊天机器人”到“智能代理”再到“创新者”的各个阶段发展。他预测,AI未来将逐步具备持续探索未知现象的能力,并可能在科学创新方面取得重大突破。
此外,奥尔特曼鼓励创业公司通过AI赋能,形成小规模、高效率的团队运作模式,甚至可能会涌现出由少数人甚至1人加上大算力驱动的公司,实现资源的极致利用。
引自:36kr 36kr.com/p/303728278…
6、小米计划推出新一代AI眼镜
小米正计划推出新一代AI眼镜,该产品预计于2025年第二季度发布。雷军对该产品的出货量预期在三十万台以上。小米AI眼镜将搭载AI功能、音频耳机模块、摄像头模块,并以小米自有品牌形式发布。
7、腾讯元宝2.0版本正式上线,界面全面升级,新增AI应用专属板块
界面方面的升级包括更新对话列表,支持历史使用资产沉淀,用户可更轻松地查找历史对话和用过的智能体;新增 AI 应用专属板块,精选 AI 搜索、AI 阅读、创意绘画、灵感图库、AI 美照五大应用,以及“应用广场”可提供类型丰富多样的智能体。此外,AI 搜索功能除微信公众号外,还升级整合微信视频号、QQ 音乐等信息资源,提供更加智能、便捷的搜索服务。
8、钉钉AI升级
钉钉宣布AI再升级,深入企业业务场景,推出六大“精选AI助理”,包括工单助理、行政助理、Excel助理、法务助理、审批助理和口碑助理。同时,钉钉还联合生态伙伴发布了行业AI解决方案中心,覆盖多个行业。
引自:腾讯新闻 news.qq.com/rain/a/2024…
9、生数科技Vidu 1.5引领AI视频生成新纪元
2024年11月13日,生数科技宣布震撼发布Vidu 1.5版本,标志着全球首个多主体一致性多模态大模型的诞生。Vidu 1.5的问世,为AI视频制作领域带来了革命性的技术突破。
Vidu 1.5的核心亮点在于其多主体一致性生成能力,能够理解和整合人物、物体、环境等多个概念,并在30秒内根据用户指令生成多个主体融合的视频结果,实现视频创作中的多主体一致性。此外,Vidu 1.5还提供了全球首个支持“主体参照”能力的AI视频大模型,确保视频生成中的一致性和可控性,不局限于单一对象,而是面向“任意主体”。
10、MiniMax海螺AI海外版月访问量达1173万,同比增长2772.92%
Hailuo AI是由MiniMax精心打造的海螺AI海外版AI视频工具,它作为MiniMax研发的一款创新AI视频生成平台,采用了尖端的Mixture of Experts (MoE)模型技术,致力于为用户提供卓越的短视频创作体验,确保每一次视频生成的质量都达到高标准。在过去的一个月里,海螺AI网页版的访问量激增超过800%,不仅荣获9月全球AI产品榜(Web)增速榜的冠军,也在国内增速榜上名列第一。
全球超过180个国家和地区的AI创作者、影视导演和编剧,正在利用海螺AI的强大功能,不断挑战和拓宽创作的界限。在VBench(视频生成模型评测框架)的第三方独立测试中,MiniMax视频模型在画面质量、连贯性、流畅性等多个维度上均获得第一,显示出其卓越的性能。
11、免费高清抠图软件RMBG 2.0强力升级,复杂背景也能抠干净
虽然现在人工智能正在飞速发展中,图像处理技术也在不断升级。但背景去除一直都是图像处理任务中最具挑战性的难题之一。
目前在抠图这块,真正做的比较好的还是remove.bg,抠的又快又好。
而现在,终于有一个抠图能力和remove不相上下的开源软件了。Bria团队最近发布的RMBG2.0抠图效果惊人。
相比前代产品RMBG1.4,新版本在多个核心领域都实现了显著提升。RMBG2.0整合了高级语义分割、改进的边缘检测技术,并在处理相似图像时保持了更强的一致性,特别是在应对复杂背景时表现出色。
这款基于BiRefNet架构的新一代开源背景去除工具,在总体成功率方面达到了90.14%的惊人表现。特别是在处理逼真图像时,其准确率更是高达92%。
即便面对复杂背景的场景,该工具仍能保持87%的优秀表现,展现出强大的技术实力。
12、百度世界 2024 大会发布两项新技术
11月12日,百度创始人李彦宏发布了两项新的AI技术:检索增强的文生图技术iRAG和无代码工具“秒哒”。
文心 iRAG 技术解决了大模型生成图像的幻觉问题,提升了实用性;无代码工具 “秒哒” 允许用户通过自然语言实现复杂的应用开发,降低了技术门槛,总结这款工具的三个特性:无代码编程、多智能体协作、多工具调用。
李彦宏还提到:智能体将成为未来AI应用的主要形式,即将迎来它的爆发点,推动企业营销和服务的效率提升。
小天有话说:
在这个快速演变的技术领域,人工智能AI正以其前所未有的速度和规模,重塑着我们的世界。让我们更好的了解、熟悉、拥抱AI来适应新时代的发展。
文中提到的三个视频生成工具(即梦、Vidu、海螺AI)均已试过,使用同一段AI生成的视频脚本,个人打分 即梦 > 海螺AI > Vidu,具体生成视频的截图在文中均有,即梦使用中文即可,另两款需要翻译使用,这点上即梦再加一分;
高清抠图软件RMBG 2.0 栗子看上去不错,实际使用效果一般,先留着备用;
针对通义代码和无代码工具“秒哒”在后续使用后再来测评。
说明:部分图片及内容引用自网络、AI生成和其他新闻平台
版权归原作者所有
如涉及版权问题,请作者与我联系,将在第一时间处理