新闻摘要
1.腾讯大模型文生视频功能正式上线
2.Meta 将 OpenAI 的 GPT-4 与 Llama 结合,增强内部 AI 编码工具
3.马斯克寻求阻止OpenAI转为营利组织
4.国产大模型紧追ChatGPT
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)

1.腾讯大模型文生视频功能正式上线
腾讯大模型的文生视频功能于12月3日正式上线,该功能允许用户通过输入描述生成视频。用户可以选择不同的视频风格、比例和高级指令,包括景别、光线、镜头运动等。腾讯表示,该模型的持续时间为5秒,在文本对齐、运动质量和视觉质量方面表现良好。同时,腾讯宣布开源该视频生成大模型,企业和个人开发者可以免费使用和开发。业内人士认为,文生视频的实现难度较高,但商业空间较大,短期内竞争门槛不会马上建立。
2.Meta 将 OpenAI 的 GPT-4 与 Llama 结合,增强内部 AI 编码工具
Meta 公司内部的编码工具 Metamate 使用了 OpenAI 的 GPT-4 模型和 Meta 自己的 Llama 模型,以提高工具的实用性。尽管马克·扎克伯格将 Llama 称为科技行业中最好的模型之一,但 Meta 仍然愿意使用竞争对手的模型来增强其内部工具。Metamate 类似于其他 AI 编码工具,如微软的 GitHub CoPilot 或 Anthropic 的 Claude Sonnet。该工具可以根据开发人员的查询或使用方式,从 Llama 或 GPT-4 中提取答案。Meta 的员工认为该工具很有帮助,但也指出它可能导致公司裁员。
3.马斯克寻求阻止OpenAI转为营利组织
马斯克要求加州联邦法官阻止OpenAI放弃其非营利组织地位,原因是OpenAI涉嫌组织抵制竞争对手的生成式AI产品,并与微软共享董事会成员。马斯克的这一举动是出于对OpenAI转为营利组织可能产生的不公平竞争的担忧。目前,OpenAI的非营利组织地位使其能够获得特定的税收优惠和其他福利,而转为营利组织可能会使其获得更多的资金和资源,从而对其他竞争对手产生不公平的竞争优势。
4.国产大模型紧追ChatGPT
近两年来,ChatGPT等大型语言模型迅速发展,国内也涌现出多个大模型项目。这些国产大模型在技术和应用方面都取得了显著进展,逐渐缩小了与ChatGPT的差距。国产大模型的发展不仅有助于提升我国的人工智能水平,也将推动相关产业的创新和应用。
5.ChatGPT存在硬编码名称过滤问题
最近,研究人员发现ChatGPT存在硬编码名称过滤问题,某些特定名称会导致ChatGPT无法正常工作。这些名称包括Jonathan Zittrain、Jonathan Turley和Brian Hood等。据悉,这些名称是由于之前的诽谤诉讼和错误信息而被添加到过滤列表中的。然而,这种过滤机制可能会导致ChatGPT无法处理某些正常的对话,甚至可能被利用进行对抗性攻击。目前,OpenAI尚未对此问题做出正式回应,但已经开始采取措施解决这一问题。
6.OpenAI 或将在 ChatGPT 中添加广告
据报道,OpenAI 正在招聘广告人才,并在其产品中探索广告模式的可能性。尽管公司目前尚未确认这一计划,但其招聘活动和高管的言论表明,OpenAI 可能正在考虑在 ChatGPT 中添加广告。公司的首席财务官 Sarah Friar 曾表示,OpenAI 正在权衡广告模式,但随后又否认了这一说法。然而,公司的招聘活动和 Friar 的言论表明,OpenAI 可能正在为在 ChatGPT 中添加广告做准备。这一举动可能会损害 ChatGPT 的客观性和用户体验。
7.谁摘了AI大模型的第一批果实?
自2023年初GPT3.5发布以来,各大互联网公司纷纷下场比拼大模型。经过两年的发展,大模型走向垂直应用早已成为共识。Meta、谷歌、微软等巨头都已经进入应用阶段,但巨头体量庞大,几个亿美元的增量可能只占体量的个位数。反倒是中等体量的公司,如Applovin和Pinterest,季度营收在10亿美元左右,多出1亿美元甚至几千万美元都是可以剥离出驱动因素的。
Applovin是一家移动广告技术公司,其AI应用主要是通过其引擎算法Axon实现。Axon最早于2022年发布,2023年初迭代到2.0,带来的营销提效刺激了Applovin的广告收入大幅提升。Pinterest同样受益于大模型技术实现业绩增长,其广告业务也受益于大模型技术的驱动。
然而,并非所有加入大模型赛道的公司都是受益者。Unity和Snapchat尽管大模型产品已经进入应用,但并未直接转化为收入。主要原因是大模型基础设施不足,以及C端体验改善尚未转化成商业收入,但成本端却是实实在在的投入。
8.AI技术支持下的全球技术、人才和企业搜索平台"Tech-GPT"
据报道,近日出现了一种名为"Tech-GPT"的全球技术、人才和企业搜索平台。该平台利用AI技术,能够帮助用户快速找到全球各地的技术、人才和企业。这种平台的出现,可能会为全球技术创新和人才流动带来新的机遇和挑战。
9.媒体公司对OpenAI的诉讼是对AI数据抓取挑战的最新发展
近期,媒体公司对OpenAI的诉讼是对AI数据抓取挑战的最新发展。该诉讼指控OpenAI未经许可抓取了媒体公司的版权内容,用于训练其ChatGPT服务。专家认为,这类诉讼将会继续增加,因为公司需要数据来运行机器学习工具和开发AI产品,而抓取数据的行为可能侵犯版权。OpenAI表示,其模型是基于公开可用的数据,遵循公平使用和相关国际版权原则。然而,专家认为,抓取数据的规模和范围是新的,需要法院的裁决来确定其合法性。
10.周鸿祎的“拿来主义”:360如何用友商大模型实现“世界第一”
周鸿祎的360公司最近发布了新款AI搜索工具“纳米搜索”,并喊出了要做“纯AI搜索世界第一”的口号。然而,纳米搜索实际上是集成了十几家友商大模型的“组合”产品。这种“拿来主义”策略被认为是360在大模型赛道上的一种无奈之举,但同时也是一种聪明的做法。通过集成多个大模型,360可以实现快速的产品开发和部署,从而在竞争激烈的搜索引擎市场中占据优势。然而,这种策略的复制门槛极低,一旦不能在对手反应过来之前快速完成跑马圈地,“世界第一”根本无从谈起。
11.未来十年是属于大模型的时代,NPU会重塑所有端边场景
近日,在36氪WISE2024商业之王大会上,「后摩智能」副总裁倪晓林发表了主题演讲。他表示,未来十年是属于大模型的时代,NPU(神经处理单元)会重塑所有端边场景。倪晓林指出,AI大模型的发展正在沿着两个路径同时高速发展,一是云端模型持续沿着scaling law向前演进,另一个是端边侧出现了更适合本地部署的模型。端边侧的AI具有个性化、低时延、数据隐私等优点,但目前还没有得到普及,主要是因为硬件的限制。NPU的出现可以解决这些问题,实现高算力、低功耗、低成本。后摩智能已经自研了两代存算一体芯片架构,针对LLM类大模型进行了专项设计。该公司还推出了多种标准化产品形态,包括智能加速卡和计算模组等。倪晓林表示,未来十年的AI大模型时代,NPU将重塑所有端边场景,所有的端边设备都将再重做一遍。
12.大模型安全风险加剧,专家警告对抗攻击手法花样翻新
大模型作为人工智能技术的重要组成部分,其安全风险日益加剧。专家指出,大模型的开放性和可扩展性使其面临数据投毒、后门植入、对抗攻击、数据泄露等多种安全威胁。攻击者可以通过向模型输入恶意数据、利用文件处理过程中的漏洞或在模型中植入特定的“后门”来实施攻击。专家警告,对抗攻击手法正在快速迭代发展,攻击者可以通过向模型输入精心构造的提示词,绕过大语言模型的安全策略,使其生成明显不合规内容。同时,大模型本身就涉及大量隐私数据,会在特定的诱导下大规模泄露敏感内容,造成直接危害。因此,专家呼吁应将更多精力投入在AI的安全之上,确保整个系统可信、可靠、可控。
13.GPT-4:革命性的语言和多模态能力
最近,人工智能领域取得了重大突破,尤其是GPT系列的发展。GPT-4的出现带来了语言理解、多语言支持和图像识别的显著改进。它在自然语言处理方面取得了重大进展,能够更好地理解复杂的对话,并减少了聊天机器人交互中的误解。GPT-4还具有出色的多语言能力,支持129种语言,并在低资源语言方面表现出色。此外,它还具有处理文本和图像的能力,使其成为一个真正的多模态模型。在安全和伦理方面,GPT-4也取得了显著改进,能够更好地检测有害内容和仇恨言论。总之,GPT-4的出现标志着人工智能领域的一个新时代,其革命性的语言和多模态能力将为多个行业带来重大变革。
14.腾讯混元发布视频生成大模型并宣布开源
腾讯混元大模型近日发布视频生成大模型,并宣布开源。该模型参数量达130亿,是当前最大的视频开源模型。用户只需输入一段描述,即可生成视频。该模型支持中英文双语输入、多种视频尺寸和清晰度,已上线腾讯元宝APP和腾讯云平台。腾讯混元生成视频大模型在文本视频一致性、运动质量和画面质量等方面领先,尤其在人物和人造场景下表现出色。该模型采用了技术创新,包括基于DiT架构和统一的全注意力机制,使得视频生成更加流畅和逼真。开发者和企业可以直接使用该开源模型,节省人力和算力,加速行业创新步伐。
关注「阿杰与AI」公众号
与AI时代更靠近一点
资讯汇总 ominiai.cn