新闻摘要
1.阿里云打造AI算力超级基建
2.美图奇想大模型荣登AIGC创新TOP30榜单
3.OpenAI o1:思考能力突破,但也存在局限性
4.中国首个多模态地理科学大模型“坤元”问世
5.阿里云大模型降价,一百万tokens仅需0.3元
6.讯飞星火大模型赋能千行百业
7.合合信息助力AI安全发展
8.亚马逊发布AI助手Amelia,助力第三方卖家
9.klarna利用OpenAI增强AI助ants功能
10.大型语言模型感知时间方向
11.苹果开发的 Ferret-UI AI 可以理解和操作移动界面
12.苏州建设“人工智能+”创新发展试验区
13.软通动力将加码机器人研发业务
14.微软Copilot 助力企业提高工作效率
新的
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)

1.阿里云打造AI算力超级基建
阿里云CTO周靖人表示,阿里云正在全面升级AI基础设施,从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,构建数据中心成为超级计算机。旨在为AI和应用提供高性能、高效的算力服务。阿里云通过硬件、计算、存储、网络、数据库和大数据等方面全面重构底层架构,将AI场景与基础设施有机融合,加速模型开发和应用。
周靖人强调,阿里云拥有全栈技术储备,并通过基础设施升级,让AI训练、推理、部署和应用整个生命周期变得更高效。会上,阿里云展示了全新AI驱动的产品家族升级,涵盖AI服务器,GPU容器算力,高性能网络架构,AI设计的高性能文件存储以及人工智能平台等。阿里云通义大模型也迎来重大进展,发布了最强开源模型Qwen2.5系列,并大幅降低通义千问三款主力模型的价格。阿里云的目标是让每个企业和开发者都能以低成本使用最先进的大模型,持续推动AI技术走向千行百业。
2.美图奇想大模型荣登AIGC创新TOP30榜单
据证券日报报道,DBC德本日前咨询发布了《2024AIGC创新TOP30》榜单,美图公司及旗下美图奇想大模型(MiracleVision)成功入选。榜单涵盖了百度、华为、字节跳动、腾讯、阿里巴巴等知名企业以及它们的旗下大模型。
互联网分析师表示,榜单入选企业都拥有实际应用价值和成功落地案例。 2024年,大模型正在加速垂直领域应用,厂商们纷纷开发专用垂直细分赛道产品。美图公司在科技创新方面持续投入,美图奇想大模型(MiracleVision)也取得了进一步突破。数据显示,2024年上半年美图公司研发投入4.3亿元,同比增长44.5%,占总收入26.2% 。美图奇想大模型(MiracleVision)已升级至V5,在美图自研AI技术加持下,视频生成能力不断提升。
3.OpenAI o1:思考能力突破,但也存在局限性
OpenAI 推出了新的 o1 模型,该模型被描述为旨在“过度思考”的 AI。这款名为“o1”的模型开放使用,让用户体验暂停思考然后再回答的功能。尽管 OpenAI 首席执行官试图压低预期,称 o1 仍然存在缺陷,并且在深入使用后显得不如初次使用时那么令人印象深刻,但这款模型依然引来了许多关注和炒作。
o1 确实在处理复杂问题上表现出色,例如帮助家庭规划感恩节大餐,比 GPT-4o 更出色地确定两个烤箱是否足够一家 11 人的聚餐。然而,在处理简单问题时,o1 的思考能力反而沦为了缺陷。它不知道何时停止过度思考,就像在一个简单的查询中(例如在美国哪里可以找到雪松树),它会给出超过 800 字的详细描述,而 GPT-4o 则可以用三句话简洁地回答。
总的来说,虽然 o1 在某些方面表现优于 GPT-4o,但它的全方位的进步并不明显。许多观察者和用户认为,与 GPT-4o 相比,o1 就像向前迈了一步,同时又后退了两步。
o1 具备解决某些复杂问题的独特能力,而 GPT-4o 在这方面略逊一筹,但它不会像 GPT-4 为行业带来的革命性突破那样全面。因此,o1 最适用于处理其真正设计的那些大问题。
4.中国首个多模态地理科学大模型“坤元”问世
中国科学院等单位共同研发,全球首个多模态地理科学大模型“坤元”正式面世。
“坤元”大模型专注于地理科学领域,具备“懂地理”、“精配图”、“知人心”、“智生图”等特点。它能够理解地理专业知识,解答地理问题,分析地理学文献,还能够查询、挖掘地理数据,并绘制专题地图。
“坤元”大模型学习了300万篇科技文献、98部经典教材和上万张专题地图等,对地理学的语言模式、专业术语和领域知识更加熟悉,在地理学基准测试集上的准确性提升了31.3%。它将帮助地理从业者解放双手,加速地理科学研究,并已支撑发表了十余篇高水平学术论文。未来,研发团队将继续推进地图大模型及地理推理机的研发,让地理科学语言大模型能够读懂地图,并构建地理科研协作大平台,促进科学家协同工作。
5.阿里云大模型降价,一百万tokens仅需0.3元
阿里巴巴2024云栖大会宣布旗下云百炼平台三款通义千问系列大模型再次降价。其中,Qwen-Turbo价格跌至每百万输入tokens 0.3元,较原价直降85 % ;Qwen-Plus和Qwen-Max的价格分别降至之前的 80% 和 50%。这款价格战持续激化,阿里云 CTO 周靖人强调,降价是为了降低客户使用门槛,推动大模型商业化并释放应用潜力。
通义千问以开源及性能均衡著称,自去年4月发布以来,已经成为仅次于Meta的Llama开源模型的世界级模型群。旗舰模型Qwen-Max性能与gpt-4相当,并在理解、数学、代码、幻觉抵御、指令遵循等方面表现优异,相较初代通义千问模型,综合能力提升了至少 46%。
阿里云认为,大模型推理成本的下降是关键因素,大幅降低了大模型使用门槛,促进更多企业利用大模型的应用价值。
6.讯飞星火大模型赋能千行百业
科大讯飞近期发布的基于国产算力训练出来的全民开放的大模型“讯飞星火” ,在文本生成、语言理解、知识问答等方面已经实现超越GPT-4 Turbo。(大家公认最好的通用认知大模型)。这款大模型拥有七大核心能力,并构建了“1+N”体系,其中“1”为通用底座大模型, “N”为大模型在教育、医疗、金融、汽车、能源、工业等各个领域的落地应用。
讯飞星火在大模型基础上,在多个领域打造了针对性应用:羚羊工业大模型赋能工业研产供销服管全流程;羚羊能源大模型覆盖风光水火核储六大行业场景,助力能源行业数字化转型;科大讯飞为学校、师生提供智慧教育产品;“智医助理”在全国超过600个区县实现常态化应用,助力医生辅助诊断和智能决策;为众多金融机构提供智能客服、智慧营销等服务,覆盖超过6亿用户;为汽车企提供座舱智能语音服务,助力车企出海;为城市提供超脑、智慧政务等智慧城市解决方案,服务全国超4900家政企单位;还为运营商提供智慧家庭服务以及AI通话解决方案等。
科大讯飞以“能听会说”为前端,“能理解会思考”为后端,加速推动万物互联时代进程。
7.合合信息助力AI安全发展
近年来,生成式人工智能技术快速发展,但也带来了新的安全风险,例如信息泄露、虚假信息传播和道德伦理问题。面对这些挑战,中国信息通信研究院联合阿里巴巴、百度、科大讯飞、合合信息等科技企业共同制定了《生成式人工智能个人信息保护技术要求》系列标准,旨在规范生成式人工智能的设计、训练和应用,保障个人信息安全。
合合信息作为参与单位,积极响应国家政策号召,构建了完善的数据安全和隐私保护机制,并在产品设计、运营中落实了一系列安全规范和技术措施。其旗下的扫描全能王、名片全能王、启信宝等产品已获得相关机构的认证,证明了合合信息在数据安全领域取得的成就。
此外,合合信息还发布了 AI 图像安全技术方案,涵盖了图像篡改检测、生成式图像鉴别等关键技术,旨在应对恶意的图像攻击和信息泄露。
合合信息始终坚持“科技向善”理念,致力于运用技术力量造福社会,积极参与行业共识的建立和解决方案的探讨,推动生成式人工智能安全可持续发展。
8.亚马逊发布AI助手Amelia,助力第三方卖家
亚马逊宣布推出名为Amelia的AI助手,旨在帮助第三方卖家快速解决账户问题并获取销售和库存数据。该工具将首先面向精选的美国卖家进行测试,并计划在今年晚些时候向更广泛的卖家群体开放。
亚马逊将Amelia描述为“集成的生成式人工智能销售专家”,可通过卖家中心(第三方商家内部仪表板)访问。 这是亚马逊过去一年推出的最新生成式AI工具之一,旨在利用OpenAI的ChatGPT带来的热潮。此外,亚马逊还推出了名为Rufus的AI购物助理,名为Q的企业聊天机器人以及Bedrock,一个面向云客户的生成式人工智能服务。亚马逊还计划使用生成式人工智能功能升级其Alexa语音助手。
亚马逊表示,Amelia将利用其Bedrock软件工具,该工具允许用户访问亚马逊以及其他公司(如Anthropic和Stability AI)的大型语言模型。 Amelia的训练数据包括来自互联网的公共数据,以及从亚马逊卖家资源、常见问题解答和其他公开网站提取的信息。
9.klarna利用OpenAI增强AI助ants功能
Klarna宣布其人工智能助理新增功能,该助理由OpenAI提供支持。 全新的 AI 助手提供了一种基于聊天的购物体验,帮助用户节省时间,并支持他们在找到合适商品并且以合适价格买到商品。
AI 助手提供个性化产品推荐、专家建议、类别以及品牌比较以及客户评论的访问权限,这使得从获取购物灵感到完成购买的过程更加简化。Klarna 表示,这些新功能将有助于实现其成为所有金融需求终极工具的愿景。从帮助客户支付和管理财务到寻找合适的商品,Klarna都将全程为客户提供支持。
10.大型语言模型感知时间方向
最近的研究表明,大型语言模型(LLM)如GPT-4在文本预测方面表现出色,但它们对时间方向高度敏感。
研究人员发现,LLM预测下一个词和上一个词的准确率在理论上应该是相等的,但实际上LLM预测上一个词的准确率总是比预测下一个词低几个百分点。
这种现象被称为“时间箭头”偏差,它在所有测试的LLM模型中普遍存在,并且与人类在预测文字时遇到的相同挑战类似。
研究人员认为,这种时间敏感性可能与人工智能代理处理信息的本质有关,为识别智能或生命形式提供了新的思路。
11.苹果开发的 Ferret-UI AI 可以理解和操作移动界面
苹果公司研究人员发布了关于 Ferret-UI 的论文,这是一款新型多模态大语言模型(MLLM),它擅长理解用户界面元素、其功能和潜在用户互动,在一些基本 UI 任务上甚至超越了 GPT-4V.
Ferret-UI 旨在执行与移动屏幕相关的三个核心任务:引用、定位和推理。这些功能使它能够精确理解屏幕上显示的内容,并根据该理解执行操作。
Ferret-UI 的一个关键创新是其任何分辨率 (anyres) 能力,它允许模型适应不同的屏幕宽高比,同时在识别和与 UI 元素交互时保持高精度。该模型将屏幕划分为子图像,使其能够捕捉 UI 元素的整体上下文和细微细节。
在训练数据方面,Apple 利用 GPT-3.5 生成了一个多样化且丰富的训练数据集,这种使用合成数据的做法在 AI 研究中越来越流行,因为它允许模型在比现实数据更大的、更具多样性的示例集中接受训练。对于 Ferret-UI 来说,这些合成数据帮助它提高了在复杂移动 UI 任务中的执行精度。
12.苏州建设“人工智能+”创新发展试验区
苏州市围绕“人工智能+制造”“人工智能+低空经济”等15个重点领域,加快建设具有国际影响力的“人工智能+”创新发展试验区。近几年来,苏州一直积极融入国家人工智能发展战略,推动人工智能赋能各行各业。目前,苏州相关产业规模超过2000亿元,人工智能相关企业超过2000家。
在最新的推进大会上,苏州发布了一系列规划和方案,包括“人工智能+”应用高水平建设“人工智能+”创新发展试验区行动方案、苏州市关于加快推进“人工智能+制造业”的若干措施。 苏州将着力提升智能计算中心建设,并围绕数据共享平台、产业发展平台、人才发展平台等打造多平台架构,充分发挥人工智能普惠算力作用。
此外,苏州还成立了中国(苏州)“人工智能+”创新发展联盟、苏州市人工智能重点实验室和苏州市“人工智能+”创新发展研究院,同时加强与高校、科研机构的合作,促进产业智能化转型升级。
会上,苏州与多家知名企业如科大讯飞、华为、腾讯云、中国联通等达成系列合作协议,共同推动人工智能在制造业、交通、能源、医疗等领域的应用。苏州将持续优化政策环境,构建完善的基础设施,努力打造人工智能创新发展高地。
13.软通动力将加码机器人研发业务
软件服务公司软通动力拟增加其经营范围,新增智能机器人研发、销售等业务。公司控股股东刘天文建议调整公司经营范围,增加计算机及周边设备生产、销售等,也包括人工智能基础软件、人工智能应用软件的开发。
软通动力在机器人领域已有布局,2023年年报中多次提及机器人,并推进“一体机研发项目”,打造软通AI智能流程机器人和AI大模型训推一体化平台。公司已在央国企推出财务非银企直连AI机器人。
软通动力正积极探索人形机器人领域,与智元机器人开展战略合作,共同推进人形机器人迈向通用。公司还成立了北京理工华汇智能科技联合软通动力特种人形机器人实验室,将打造高性能、高智能特种人形机器人。
软通动力未来计划从整机关节配置、半结构化环境快速通行、交互适应平衡三方面构建机器人本体技术体系,以及研发具有感知决策、学习与适应能力的特种机器人高智能操作系统,提升机器人在复杂环境的感知、运动、并行任务、自我决策能力。
**14.微软Copilot 助力企业提高工作效率
新的
**微软旗下AI 助手Copilot 近期更新,功能更加强大,持续受到客户的好评。据微软最新数据显示,Copilot 近期用户数量同比增长超过60%,拥有超过10,000名用户的客户数量更是翻了一番。
此次更新在Office软件系列中加入了全新的AI功能,例如通过Copilot编写Excel表格、分析邮件、进行团队协作等。其中,Copilot 可以帮助用户快速创建图表和数据透视表, 以及使用 Python 语言进行预测和风险分析。此外,Copilot 还能根据用户对邮件的优先级,分析收件箱并筛选重要邮件,帮助用户高效管理邮件。
与沃达丰集团等众多企业签订了大规模合作协议,微软表示Copilot将会成为其未来重要的收入来源之一。
目前,Copilot 每位用户每月30美元,用户普遍对新功能表示期待,认为Copilot 将能大大提高工作效率。但也有一些用户建议微软考虑降低价格,以便更多企业和个人能够使用这个强大的AI工具。
关注「阿杰与AI」公众号
与AI时代更靠近一点
资讯汇总 ominiai.cn