【AI资讯】11.11 ~ 11.15 科技领域 AI 发展动态

242 阅读10分钟

“AI将取代许多重复性、规律性强的工作,但同时也会创造新的工作机会,人类需要与AI协作,提升自己的创造力和情商,以适应新时代的发展。”— — 李开复

LIST | 本周(11.11 ~ 11.15)快讯:

  • ChatGPT Windows版全面上线;
  • 谷歌DeepMind开源诺奖级AI AlphaFold 3;
  • 即梦AI视频生成模型重磅更新;
  • 通义代码模式正式上线;
  • 大公司对AI的无知与科创公司的巨大机遇;
  • 小米计划推出新一代AI眼镜;
  • 腾讯元宝2.0版本正式上线;
  • 钉钉AI升级;
  • 生数科技Vidu 1.5引领AI视频生成新纪元;
  • MiniMax海螺AI海外版月访问量达1173万,同比增长2772.92%;
  • 免费高清抠图软件RMBG 2.0强力升级;
  • 百度世界 2024 大会发布两项新技术;

1、ChatGPT Windows版全面上线!

11月15日,OpenAI发布联想更新:旨在提升 ChatGPT 在 Windows 和 Mac 系统上的实用性。

对于Windows 用户,桌面版ChatGPT全面推出。支持拍照识别,用户可以使用电脑自带的摄像头进行拍照,然后让ChatGPT进行解读或提问。OpenAI之前发布的GPT-4o的高级语音模式,也可以在桌面版ChatGPT使用。而对于 macOS 用户,新版 ChatGPT 桌面应用则进一步增强了开发者的使用体验。新的 “与应用协作” 功能让 ChatGPT 能够访问并读取其他应用的内容,但前提是用户需授予权限。

引自:opai官网 openai.com/chatgpt/des…

2、谷歌DeepMind开源诺奖级AI AlphaFold 3,开启药物发现和分子生物学新时代

谷歌DeepMind团队开源了AlphaFold 3的源代码和模型权重,供学术使用,这可能加速科学发现和药物开发。AlphaFold 3不仅能预测蛋白质结构,还能模拟蛋白质、DNA、RNA和小分子之间的复杂相互作用,这对于现代药物发现和疾病治疗至关重要,因为传统方法研究这些相互作用往往耗时且成本高昂。

github.com/google-deep…

nature.com/articles/d4…

3、即梦AI视频生成模型重磅更新,推出S2.0 Pro和P2.0 Pro两大模型

即梦AI视频生成模型11月15日更新,推出S2.0 Pro和P2.0 Pro两大模型。S2.0 Pro以首帧一致性和细节还原著称,能精确描绘原作并融入创意。P2.0 Pro则以高提示词遵循能力,能将复杂创意转化为视频内容。用户可通过即梦App或官网选择模型,实现灵感即刻成片,享受AI视频创作新体验。

引自:即梦ai官网 jimeng.jianying.com/ai-tool/vid…

4、通义代码模式正式上线,一句话帮你生成应用

通义千问的代码模式正式上线,新功能支持用户无需编程知识即可生成应用,支持前端页面、设计素材、生日贺卡、数据图表、小游戏和精美简历等。代码模式背后的技术基于Qwen2.5-Coder(在多项基准评测中表现优异的开源代码模型)。用户现在可以通过通义官网体验这一创新功能。

通义代码模式是阿里旗下的通义推出的创新功能,支持用户通过简单的指令(Prompt)生成代码,实时预览代码生成的页面或应用。适用于快速开发动态网页和交互式应用,如太阳系模型动画。用户只需提供详细的需求描述,AI就能自动编写HTML和JavaScript代码,实现复杂的动画效果。通义代码模式支持多种编程语言,能将代码渲染成小游戏、网页和数据图表等,降低了应用开发的门槛,非专业程序员也能轻松创建应用。

引自:通义千问官网 tongyi.aliyun.com/qianwen

5、OpenAI山姆·奥尔特曼最新专访:大公司对AI的无知与科创公司的巨大机遇

奥尔特曼强调,当前AI技术仍处于快速提升的初期阶段,未来的发展空间巨大,他鼓励创业者紧抓这一科技浪潮,在早期阶段利用AI实现飞跃式增长。他认为,大公司受限于复杂的规划周期,初创公司则可以凭借速度、专注度和适应力脱颖而出,创造出更具竞争力的产品和服务。

在谈及AGI的发展路径时,奥尔特曼描绘了从“聊天机器人”到“智能代理”再到“创新者”的各个阶段发展。他预测,AI未来将逐步具备持续探索未知现象的能力,并可能在科学创新方面取得重大突破。

此外,奥尔特曼鼓励创业公司通过AI赋能,形成小规模、高效率的团队运作模式,甚至可能会涌现出由少数人甚至1人加上大算力驱动的公司,实现资源的极致利用。

引自:36kr 36kr.com/p/303728278…

6、小米计划推出新一代AI眼镜

小米正计划推出新一代AI眼镜,该产品预计于2025年第二季度发布。雷军对该产品的出货量预期在三十万台以上。小米AI眼镜将搭载AI功能、音频耳机模块、摄像头模块,并以小米自有品牌形式发布。

7、腾讯元宝2.0版本正式上线,界面全面升级,新增AI应用专属板块

界面方面的升级包括更新对话列表,支持历史使用资产沉淀,用户可更轻松地查找历史对话和用过的智能体;新增 AI 应用专属板块,精选 AI 搜索、AI 阅读、创意绘画、灵感图库、AI 美照五大应用,以及“应用广场”可提供类型丰富多样的智能体。此外,AI 搜索功能除微信公众号外,还升级整合微信视频号、QQ 音乐等信息资源,提供更加智能、便捷的搜索服务。

yuanbao.tencent.com/

8、钉钉AI升级

钉钉宣布AI再升级,深入企业业务场景,推出六大“精选AI助理”,包括工单助理、行政助理、Excel助理、法务助理、审批助理和口碑助理。同时,钉钉还联合生态伙伴发布了行业AI解决方案中心,覆盖多个行业。

引自:腾讯新闻 news.qq.com/rain/a/2024…

9、生数科技Vidu 1.5引领AI视频生成新纪元

2024年11月13日,生数科技宣布震撼发布Vidu 1.5版本,标志着全球首个多主体一致性多模态大模型的诞生。Vidu 1.5的问世,为AI视频制作领域带来了革命性的技术突破。

Vidu 1.5的核心亮点在于其多主体一致性生成能力,能够理解和整合人物、物体、环境等多个概念,并在30秒内根据用户指令生成多个主体融合的视频结果,实现视频创作中的多主体一致性。此外,Vidu 1.5还提供了全球首个支持“主体参照”能力的AI视频大模型,确保视频生成中的一致性和可控性,不局限于单一对象,而是面向“任意主体”。

www.vidu.studio/

10、MiniMax海螺AI海外版月访问量达1173万,同比增长2772.92%

Hailuo AI是由MiniMax精心打造的海螺AI海外版AI视频工具,它作为MiniMax研发的一款创新AI视频生成平台,采用了尖端的Mixture of Experts (MoE)模型技术,致力于为用户提供卓越的短视频创作体验,确保每一次视频生成的质量都达到高标准。在过去的一个月里,海螺AI网页版的访问量激增超过800%,不仅荣获9月全球AI产品榜(Web)增速榜的冠军,也在国内增速榜上名列第一。

全球超过180个国家和地区的AI创作者、影视导演和编剧,正在利用海螺AI的强大功能,不断挑战和拓宽创作的界限。在VBench(视频生成模型评测框架)的第三方独立测试中,MiniMax视频模型在画面质量、连贯性、流畅性等多个维度上均获得第一,显示出其卓越的性能。

hailuoai.video/

11、免费高清抠图软件RMBG 2.0强力升级,复杂背景也能抠干净

虽然现在人工智能正在飞速发展中,图像处理技术也在不断升级。但背景去除一直都是图像处理任务中最具挑战性的难题之一。

目前在抠图这块,真正做的比较好的还是remove.bg,抠的又快又好。

而现在,终于有一个抠图能力和remove不相上下的开源软件了。Bria团队最近发布的RMBG2.0抠图效果惊人。

相比前代产品RMBG1.4,新版本在多个核心领域都实现了显著提升。RMBG2.0整合了高级语义分割、改进的边缘检测技术,并在处理相似图像时保持了更强的一致性,特别是在应对复杂背景时表现出色。

这款基于BiRefNet架构的新一代开源背景去除工具,在总体成功率方面达到了90.14%的惊人表现。特别是在处理逼真图像时,其准确率更是高达92%。

即便面对复杂背景的场景,该工具仍能保持87%的优秀表现,展现出强大的技术实力。

huggingface.co/spaces/bria…

12、百度世界 2024 大会发布两项新技术

11月12日,百度创始人李彦宏发布了两项新的AI技术:检索增强的文生图技术iRAG和无代码工具“秒哒”。

文心 iRAG 技术解决了大模型生成图像的幻觉问题,提升了实用性;无代码工具 “秒哒” 允许用户通过自然语言实现复杂的应用开发,降低了技术门槛,总结这款工具的三个特性:无代码编程、多智能体协作、多工具调用。

李彦宏还提到:智能体将成为未来AI应用的主要形式,即将迎来它的爆发点,推动企业营销和服务的效率提升。

小天有话说:

在这个快速演变的技术领域,人工智能AI正以其前所未有的速度和规模,重塑着我们的世界。让我们更好的了解、熟悉、拥抱AI来适应新时代的发展。

文中提到的三个视频生成工具(即梦、Vidu、海螺AI)均已试过,使用同一段AI生成的视频脚本,个人打分 即梦 > 海螺AI > Vidu,具体生成视频的截图在文中均有,即梦使用中文即可,另两款需要翻译使用,这点上即梦再加一分;

高清抠图软件RMBG 2.0 栗子看上去不错,实际使用效果一般,先留着备用;

针对通义代码和无代码工具“秒哒”在后续使用后再来测评。


说明:部分图片及内容引用自网络、AI生成和其他新闻平台

版权归原作者所有

如涉及版权问题,请作者与我联系,将在第一时间处理