每日AI资讯08-01

399 阅读13分钟

每日AI资讯08-01

新闻摘要

1.360安全大模型免费开放,周鸿祎称要打破大模型垄断

2.西雅特开启ChatGPT语音助手服务

3.阿里通义AI赋能巴黎奥运观赛

4.萨拉·丝尔弗曼诉OpenAI案面臨挫折

5.雨果 增强亚马逊无感 checkout 기술精度

6.多数大型语言模型在政治问题上倾向左派

7.360AI品直助力品牌订单转化

8.多家头部企业携生态企业参展2024数博会

9.微软移除 Copilot Pro GPT Builder 功能,影响用户

10.中国AI大模型技术突飞猛进跻身全球第二

11.Bean Bag 大模型: 重塑磁力的三重奏

12.3D 大模型:下一个科技风口

13.视频大模型Vidu全球上线,最快生成视频,支持动漫、角色一致

扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)

123

1.360安全大模型免费开放,周鸿祎称要打破大模型垄断

周鸿祎宣布360安全大模型正式免费开放,旨在打破大模型垄断,让“人人”都能获得技术红利。他强调360不追求全能大模型,而是打造“专精一事”的模型,并结合百余个实践案例总结出一套专业化大模型方法论。360安全大模型由六个子模型组成,涵盖攻击检测、运营处置、追踪溯源等功能,已帮助国有大型企业提高告警降噪效率和事件研判效率。周鸿祎认为,2024年安全行业将迎来新革命,安全领域迈向“自动驾驶”的必由之路需要安全大模型。他提出,采用AI升级安全需目标明确,类似自动驾驶的L1-L5级别,目前360安全大模型已具备L4级“自动驾驶”能力。 360安全大模型还实现了对全网安全知识的深度理解,让闭环网络也能使用全网知识,这是重要突破。

2.西雅特开启ChatGPT语音助手服务

从2023年7月31日起,西雅特旗下多个车型将搭载ChatGPT语音助手。该功能由OpenAI开发,并通过SoundHound的语音识别平台集成到西雅特的信息娱乐系统中。ChatGPT是一种人工智能语言模型,能够根据深度学习生成响应,使驾驶体验更加智能和交互。ChatGPT 将进一步提升西雅特现有的语音识别功能,使其更加接近自然语言,更加准确和灵敏。驾驶员可以使用语音命令执行各种任务,例如调整温度或导航到特定目的地,而无需移开视线。此外,该系统还能够进行实时对话,就广泛的常识主题回答问题,如同人类助手一样。

目前,除了葡萄牙,ChatGPT 助手还将在法国、意大利、德国、英国、荷兰、比利时、奥地利、西班牙、波兰、卢森堡、瑞士、捷克共和国、瑞典、挪威、爱尔兰和丹麦推出。

3.阿里通义AI赋能巴黎奥运观赛

7月31日,阿里巴巴宣布其AI大模型“通义”,将免费开放给所有用户,为巴黎奥运观众提供专业知识解答和实时中法互译服务。

通义大模型经过奥运专项强化训练,可以解答各种与奥运相关的知识问题,例如赛事规则、运动员信息和赛事历史等。用户可以通过文字提问或拍摄照片识别运动员等,获得详尽且专业的答案。

此外,通义大模型还具备同声传译级别的中法互译功能,能够实时将中文翻译成法语,反之亦然。这使得用户可以轻松与法语人士交流,解决菜单翻译、路牌翻译等日常问题。

阿里巴巴的这项技术应用,将使巴黎奥运成为AI应用最广泛的一届奥运会。国际奥委会主席巴赫也高度赞赏了阿里巴巴的AI技术,认为它将改变体育届的各个方面。

4.萨拉·丝尔弗曼诉OpenAI案面臨挫折

著名作家萨拉·丝尔弗曼、保罗·特雷布莱和塔-内希西·科茨等人对OpenAI提起诉讼,指控该公司利用他们的小说来训练其人工智能聊天机器人ChatGPT,侵犯了他们的版权。然而,美国联邦法官艾拉塞利·马丁内斯-奥古金裁决,驳回了他们对OpenAI构成不正当商业行为的指控。

法官认为,Copyright Act明确规定了对著作权作品的保护,因此作家们利用州法律提起诉讼是不可取的。虽然法官驳回了部分诉求,但作家们对OpenAI构成直接版权侵权的控诉仍然有效。

OpenAI正受到多个方面的压力,包括贸易团体、艺术家和出版商的诉讼,针对其在训练人工智能聊天机器人时使用已出版作品的行为。

5.雨果 增强亚马逊无感 checkout 기술精度

亚马逊的 Just Walk Out 无感 checkout 技术最新升级,显著提高了其精度。该技术应用于名为“雨果”的全新功能,可让消费者方便地从亚马逊购物 App 扫描商品后直接离开商店,无需排队结账。雨果技术利用射频识别(RFID)技术,扩展了无感 checkout 技术应用范围,适用于服装、纺织品、体育用品等更多商品类别。

6.多数大型语言模型在政治问题上倾向左派

一项发表在《PLOS ONE》期刊上的研究表明,24 个不同的大型语言模型(LLM)在政治取向测试中表现出明显的左倾倾向。研究人员对包括 OpenAI 的 GPT 3.5 和 GPT-4,谷歌的 Gemini,Anthropic 的 Claude,Twitter 的 Grok,Llama 2,Mistral 和阿里巴巴的 Qwen 在内,多种开源和闭源对话型 LLMs 进行测试。研究发现,大多数测试 LLMs 的回复被评为左倾观点。研究人员还通过使用来自「大西洋」和「新共和」等出版物的文本对 GPT 3.5 进行训练,成功地使该模型向左倾方向偏移。

研究人员推测,ChatGPT 以其广泛的普及率,可能作为首批LLM,对其他LLMs的微调过程產生了影响,从而导致 LLMs 普遍存在左倾倾向。然而,该研究无法确定 LLMs 的政治偏见是来自于预训练阶段还是微调阶段。

7.360AI品直助力品牌订单转化

人工智能(AI)正在深刻重塑营销领域,360AI品直凭借其强大的技术实力,帮助品牌方实现订单转化率的显著提升。根据数据显示,360AI品直已成功助力品牌方订单转化提升近10倍。

该系统通过AI智能分析消费者行为和市场趋势,精准定位目标客户群,并制定个性化的营销策略。同时,360AI品直还提供大数据驱动下的精准营销工具,帮助品牌方优化广告投放效果,提升转化率。 其以数据为驱动,以科技创新为引擎,为品牌方打造高效、精准的营销解决方案,帮助他们获得更大的商业成功。

8.多家头部企业携生态企业参展2024数博会

2024中国国际大数据产业博览会将于近期举办。今年大会将更加注重国际视野和国家战略,突出展览专业性和前沿性,力求呈现国内大数据产业链和创新链最新成果,展现头部企业全产业链生态优势。华为、南方电网、中国移动等多家头部企业将携各自的生态企业组团参展,例如华为将和20家左右生态企业共襄盛会,展示他们在人工智能领域的最新技术成果以及行业实践。大会还将设立主题展区,如算力生态、数据要素与智能制造、数据要素与数字化转型等,聚焦数字产业化、产业数字化、数据价值化、数字化治理、数字新基建、数据安全等主题,为业内企业和专业观众提供更精准的交流平台。同时,大会将加强专业观展团的组建和定制化服务,并设置登陆大厅发布区、媒体中心、展商服务区、交流洽谈区等,提升“以展促贸”的功能。

9.微软移除 Copilot Pro GPT Builder 功能,影响用户

微软已从 Copilot Pro 专业版中移除 GPT Builder 功能。GPT Builder 允许用户每月支付 20 美元订阅并创建他们自己的小型 Copilot 版本来满足特定需求,例如规划假期、规划会议或撰写电子邮件。微软表示,这一战略性转变旨在将其重点重新定位到更广泛的商业和企业市场。

移除 GPT Builder 对现有用户来说可能有些令人失望,但它也意味着微软能够集中精力开发其他新功能。尽管微软已从 Copilot Pro 专业版中移除这一功能,但它在商业或企业版ライセンス中仍然可用。 ChatGPT 的付费版也提供了类似的功能,所以用户可以选择其他的替代方案。

10.中国AI大模型技术突飞猛进跻身全球第二

中国互联网发展三十年来,从接入国际互联网到“网”开,再到AI的“崛起”,经历了从无到有、从小到大、从大到强的过程。 近年来,中国在人工智能领域取得了长足发展,尤其是大语言模型技术的发展可谓突飞猛进。

从20世纪90年代末开始关注人工智能,到2000年代中期,包括科大讯飞在内的中国企业在语音识别、图像识别等领域取得重要进展。 2011年,旷视科技和商汤科技等AI公司相继成立,专注于计算机视觉技术,中国AI技术应用范围进一步扩大。

2012年深度学习技术的突破,让百度、阿里巴巴、腾讯等互联网巨头纷纷成立AI研究院,推动中国AI技术的大发展。 随着OpenAI推出ChatGPT的震撼,中国企业也开始奋起直追,百花齐放。 截至2024年,中国的大模型技术已跻身世界第二,在斯坦福大学发布的《2024年人工智能指数报告》中排名上位。

尽管面临数据集中不足、算力分散等挑战,但随着技术的突破和政策支持,中国AI大模型市场将迎来更广阔的发展空间,在多个领域发挥重要作用,推动产业变革和经济发展。

11.Bean Bag 大模型: 重塑磁力的三重奏

火山引擎旗下的 Bean Bag 大模型凭借拟人化设计、低成本生态和行业深度合作,成功破解了大模型同质化、落地难和商业化问题。

Bean Bag 的成功秘诀在于三方面:

第一,拟人化设计更加契合用户需求。 Bean Bag 通过语音识别、角色扮演和用户界面设计等方式,力求让用户感受到与人交流的体验,不仅消除了用户对 AI 的陌生感,更吸引了年轻用户群体。

第二,低成本策略降低了企业应用大模型的门槛。 Bean Bag 主打“厘时代”,将主力模型定价低于行业水平99%,让企业可以以更低的成本,更方便地应用大模型。

第三,深度产业合作助推大模型行业发展。 Bean Bag 与汽车行业、智能终端等多个领域建立了生态合作,通过主动了解行业的智能化需求,并提供针对性的解决方案,推动大模型在各个行业的落地和应用。

Bean Bag 的成功经验启示了整个大模型行业,未来应该更加注重用户体验、降低应用成本和深化产业合作,才能真正实现大模型的价值。

12.3D 大模型:下一个科技风口

自 2023 年底以来,AI 3D 模型成像技术取得突破,Meta、Adobe、Stability AI 等巨头动作频频,arXiv 上相关的论文数量也大幅增加。现有 3D 生成技术呈现百花齐放的状态,可以分为文生 3D、图生 3D、纯原生 3D 和混合 3D 等路径,各有千秋。

目前 3D 大模型技术发展迅速,3D 模型生成的质量更好、速度更快,能将 3D 模型生成时间压缩到秒级,极大地提高效率。然而,3D 大模型领域还面临一些挑战,包括训练数据不足、模型几何准确性不足等。

儘管如此,3D 大模型在影视、游戏、工业设计等领域展现了广阔的应用空间,能够帮助设计师快速生成原型,提高工作效率。随着技术不断发展,3D 大模型将迎来更多突破性进展。

3D 大模型技术呈现三大主要趋势:

  • 效率提升: 模型生成速度更快,部分情况下可压缩至秒级。

  • 多样化路径: 文生 3D、图生 3D、纯原生 3D 和混合 3D 等多种技术路径并存, 各自利弊突出。

  • 应用扩展: 在影视、游戏、工业设计等领域得到广泛应用,未来潜力巨大。

    13.视频大模型Vidu全球上线,最快生成视频,支持动漫、角色一致

    生数科技推出的视频生成大模型Vidu对所有用户开放,支持一键生成时长可达16秒、分辨率4K分辨率的高清视频,能够很好地模拟真实物理世界,還能拥有丰富的想象力,具备多镜头生成、时空一致性等特点。Vidu 拥有业界最快实测推理速度,生成一段4秒的片段只需30秒。 新产品发布中,Vidu新增了动漫风格和角色一致性等全新功能, 突破了以往AI视频工具仅限于写实风格的局限,扩展了视频应用场景。Vidu支持上传动漫图,并通过技术创新确保了生成动漫风格的一致性、流畅性和稳定性。 角色一致性功能用户可上传人像图或自定义的角色图,通过文字描述让该角色在不同的场景中做出不同的动作。例如,上传埃隆·马斯克的照片,可以让他变身宇航员遨游太空或超級英雄鋼鐵人。Vidu还能生成影视级画质的画面和特效,具有“画面美观性好”优势。

    关注「阿杰与AI」公众号

    与AI时代更靠近一点