每日AI资讯08-16

182 阅读10分钟

每日AI资讯08-16

新闻摘要

1.我国自主研发的视频大模型Vidu面向全球开放

2.幻方量化旗下DeepSeek大模型拥抱硬盘缓存技术

3.OpenAI研制下一代AI GPT-5,CEO称其可能具有超人类智能

4.苹果 CEO 确认 ChatGPT 将于今年底集成 iOS 18 和 macOS

5.大众智能化进阶,引领品牌竞争新格局

6.周鸿祎看大模型合力,场景才是关键

7.罗宾AI携亚马逊云服务,助法律助理应用生成式AI

8.GitHub 推出全新 AI 模型平台

9.XTransfer自主研发外贸金融大模型TradePilot正式上线

10.持续投入强化能力,中科院半导体所打造中国首个具有自主知识产权的通用AI平台

11.xAI推介Grok-2及Grok-2 mini模型:性能超越GPT-4

扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)

123

1.我国自主研发的视频大模型Vidu面向全球开放

近日,中国自主开发的通用视频大模型Vidu正式面向全球开放。这款大模型的核心功能是文生视频和图生视频,支持两种时长选择(4秒和8秒),最高分辨率达到1080P,生成速度快,4秒视频仅需30秒即可完成。Vidu由清华大学和北京生数科技联合研发,其特点是长时长、高一致性、高动态性。

Vidu能根据文字和图片生成高清视频,并保持高质量、流畅的画面效果,支持生成最长32秒的视频。它可以模拟真实物理世界,生成符合物理规律的场景和画面,例如光影效果、人物表情等,还能创造出超现实主义内容。Vidu还支持生成多种风格的画面片段,如科幻、西部、浪漫、动画等,以及影视级特效画面,如烟雾、炫光等。

在动态性方面,Vidu可以生成复杂动态镜头,支持精准的动作生成,并实现不同镜头的切换,如远景、近景、中景、特写等,也能直接生成长镜头、追焦、转场等效果。除了基础功能之外,Vidu还上线了“动漫风格”和“角色一致性”新功能,

使用“角色一致性”功能,用户可以上传人像图或自定义的角色图,通过文字描述指定角色在任意场景中进行任意动作,简单易用,提升了创作自由度。

Vidu的操作不需要申请,用户可直接使用邮箱注册即可上手体验。其技术突破源于研发团队在机器学习和多模态大模型方面的长期积累。

2.幻方量化旗下DeepSeek大模型拥抱硬盘缓存技术

幻方量化旗下探索通用人工智能的组织 “深度求索(DeepSeek)”,已采用新的上下文硬盘缓存技术。该技术将在大模型 API 使用场景中发挥作用。 当输入内容重复时,DeepSeek可以从硬盘缓存读取重复部分,无需重新计算,显著降低成本。缓存命中的部分,DeepSeek费用仅为0.1元每百万 tokens。

3.OpenAI研制下一代AI GPT-5,CEO称其可能具有超人类智能

OpenAI正在积极开发其强大的人工智能模型GPT-5的下一代。该公司首席执行官萨姆·艾特曼在接受BBC采访时表示,GPT-5有可能超越人类智能,达到“超智能”的水平。 艾特曼透露了这一点,同时强调了在人工智能研发和部署方面的责任,并指出OpenAI正在谨慎地行事,以确保GPT-5的能力被负责任地利用。

4.苹果 CEO 确认 ChatGPT 将于今年底集成 iOS 18 和 macOS

苹果首席执行官蒂姆·库克(Tim Cook)在公司最近的财报电话会议上证实,ChatGPT 将会在今年底被集成到 iOS 18、 iPadOS 18 和 macOS Sequoia 中。

苹果早在六月 WWDC 大会上就宣布了将 ChatGPT 集成到iPhone、iPad和Mac本年度发布时间,库克的最新声明表明,该计划仍按计划进行。根据苹果的说法,用户允许的情况下,Siri 将能够直接显示 ChatGPT 的回答,并能直接使用 ChatGPT 用于 Apple 的系统级 “写作工具” 功能,让用户生成文本和图像。苹果表示,ChatGPT 将在他们的平台上由 OpenAI 最新发布的 GPT-4o 模型提供支持。

iPhone、iPad 和 Mac 用户可以免费使用 ChatGPT,无需创建帐户,而 ChatGPT Plus 订阅用户则可以连接其帐户以访问付费功能。 苹果还表示,OpenAI 不会存储通过其设备提交的 ChatGPT 请求,并且将隐藏用户的 IP 地址。

5.大众智能化进阶,引领品牌竞争新格局

大众汽车近年来致力于智能化转型,不断加大投入,提升技术水平。该策略以其丰富的品牌经验和强大的产品实力,使其在智能汽车领域占据重要地位。大众的智能化技术涵盖了自动驾驶、车辆互联和软件定义汽车等多个方面,并取得了显著进步。

大众的“IQ.DRIVE”智能驾驭系统例如,已具备L2级自动驾驶能力,能够辅助驾驶员完成多种驾驶任务。而其“CAR.NET”平台,则构建了涵盖车辆信息、导航、娱乐和服务的智能车生活生态。

大众的智能化发展势头强劲,其不断出色的产品和技术将挑战其他汽车品牌的现有优势,为智能汽车市场带来新的竞争格局。

6.周鸿祎看大模型合力,场景才是关键

周鸿祎认为,大模型不是产品,而是能力,需要结合具体场景才能产生价值。他指出2024年是大模型的“场景之年”,并以电动机为例子说明,大模型就像电动机,需要与其相匹配的场景才能发挥效益。

360公司正在探索AI搜索、AI浏览器和儿童手表等场景,并发现明星场景可以提高十倍的体验。 在搜索场景,周鸿祎认为,“搜索+AI”能更好地提升用户体验。OpenAI发布的SearchGPT也证明了AI搜索的重要性。

此外,360开放了安全卫士、安全浏览器、搜索、智能硬件等产品场景,打造新一代AI产品“AI助手”,并与多家大模型厂商合作,将他们的能力整合到360AI助手中。周鸿祎表示,这类似于钉钉的做法,形成一个AI能力的“最强战队”。

周鸿祎还分享了360对AI商业化的探索,包括通过会员订阅收费模式。他认为,AI给了互联网公司一个直接向用户收费的机会,未来AI商业模式将呈现多样化趋势。

7.罗宾AI携亚马逊云服务,助法律助理应用生成式AI

罗宾AI,一家专业的法律人工智能助理公司,与亚马逊云服务(AWS) 合作,将生成式AI技术的强大功能融入其法律助理产品中。为了实现这一目标,罗宾AI 正在全面采用AWS Bedrock 和 Amazon SageMaker 来构建和运行其AI模型,并将其产品部署在AWS Marketplace 上。这使得法律部门更轻松地访问、测试、购买和部署罗宾AI 的时间和成本节省的AI工具。通过亚马逊 Bedrock,罗宾AI能够安全地构建和扩展其生成式AI应用程序,并使用Anthropic 的Claude 模型在保护客户数据私密的条件下。同时,使用 Amazon SageMaker,罗宾AI可以加速其机器学习模型的构建、训练和部署流程。listing其产品在 AWS Marketplace 上使得内部法律团队和律师事务所更容易部署罗宾AI 的时间和成本节省的AI工具,并为只依靠人类才能完成的任务腾出高级律师的时间。

8.GitHub 推出全新 AI 模型平台

GitHub 推出了全新的 AI 模型平台 “GitHub Models”,让超过 1 亿开发者能够成为AI工程师,使用行业领先的 AI 模型。平台上集成了Llama 3.1、GPT-4o 和 GPT-4o mini 等知名模型,开发者可以在内置的互动平台中免费测试不同的提示和模型参数。

GitHub Models 与 GitHub 和 Microsoft 对隐私和安全的承诺保持一致,用户与模型交互的所有提纲和输出都不会被共享,也 won’t 被用于训练或改进模型。

GitHub 首席执行官 Thomas Dohmke 认为,GitHub Models 将使更多开发者能够在熟悉的 GitHub 环境中接入和实验 AI 模型,加速印度在 AI 领域的竞争优势。未来,GitHub 将继续扩展平台,为全球数十亿开发者提供 AI 技术的接入,帮助他们构建创新应用,推动人类进步。

9.XTransfer自主研发外贸金融大模型TradePilot正式上线

同花顺旗下外贸金融综合服务平台XTransfer,日前宣布其自主研发的专业外贸金融大模型TradePilot正式上线。TradePilot致力于通过深度学习和知识图谱技术,为跨境贸易企业提供全流程金融服务解决方案。该模型已整合海量贸易数据,具备精准风险预判、智能化融资决策、自动化文书处理等能力,显著提升了外贸企业融资便利性、降低了交易成本。

XTransfer表示,TradePilot的上线将进一步推动外贸金融模式创新,助力外贸企业顺应数字浪潮,实现高质量发展。

10.持续投入强化能力,中科院半导体所打造中国首个具有自主知识产权的通用AI平台

中国科学院半导体研究所持续投入资源于算法创新、数据工程、高效算力平台等关键领域,努力打造中国首个具备自主知识产权的通用人工智能(AI)平台。目前,该研究所已经在2B领域拥有80B的参数规模,并且在平台构建、算力资源等方面取得了突破性进展。未来的发展方向是继续扩大平台规模,增强算法能力,并推向更多领域,以助力国家科技创新和产业发展。

该研究所正在积极探索AI技术的落地应用,并与其他研究机构和企业展开合作,致力于推动中国AI技术的自主研发和产业化发展,打造具有全球竞争力的优势。 他们利用包括 Mixture of Experts(MoE) 等技术,开发出具有自主知识产权的AI平台。 该平台具有强大的计算能力和灵活的算法架构,可以应用于各个领域,包括自然语言处理、计算机视觉、机器人控制等, 目前平台已经应用到多个应用场景, 并取得了显著的成果。

11.xAI推介Grok-2及Grok-2 mini模型:性能超越GPT-4

xAI近日宣布推出全新的Grok-2大型语言模型及其小型版本Grok-2 mini。 与GPT-4相比,Grok-2在多种标准测试中取得了优异的性能表现,被认为是当前最强大的人工智能模型之一。Grok-2旨在提供更广泛的应用场景,包括代码生成、文本摘要、多语言处理等。 xAI表示,Grok-2的开源特性将促使研究者和开发者进一步探索人工智能的潜力。

关注「阿杰与AI」公众号

与AI时代更靠近一点