在最近短短一个月内,如AutoGPT、SAM图像分割等一众AI算法如雨后春笋般冒出来,几乎每天都在刷新我们对AI的认知。
这些算法不仅在各个领域展现出了惊人的性能和创造力,还在不断突破AI的限制和挑战,让我们看到了AI的无限可能和前景。
本期将给大家介绍五个效果十分惊艳的算法,个个实用且创意十足,赶紧码住收藏!
1 Myshell:全天候AI语言教师
MyShell是一款基于自然语言处理技术的AI智能助手,它也是第一个由Web3和AI技术提供支持的语音聊天机器人平台。其名称来源于著名漫画《攻壳机动队》。
凭借着强大的LLM和TTS模型,MyShell可以将与科幻类机器人的开放式对话带入现实。它可以模拟影视角色的声线实现问答对话。
用户可以将它用作口语练习的对象,它能根据你的发音和语法作出评价和分析,甚至给你提出改进的建议。
或者仅用作放松的方式,以实现全天候的聊天陪伴。
目前myshell支持Samantha、夏洛克甚至日本动漫人物的声线。
2 Plask:3D动捕大师
你是否想过,如果有一个人工智能工具,可以让你用一个3D模型来控制人物的姿势和角度,然后生成相应的图像,那该有多好?
而这个名字叫Plask的AI工具完美实现了这个想法。
plask是一个基于AI的绘画神器,它可以让你用一个可调节的3D人物模型来指定人物的姿势和角度,然后生成相应的2D图像。
plask支持生成真实或动漫风格的人物图像,你可以选择不同的主题和场景,比如风景、动物、人物等。plask还可以让你与其他用户分享和互动,欣赏他们的作品或者给他们提供反馈。
可以说,只要你能用3D模型来表达出来,它就有可能实现。
比如,你可以让plask根据3D模型生成不同风格和角度的人物头像、全身照、动作照等等。plask还可以让你根据3D模型生成不同表情和情绪的人物图像,比如微笑、生气、惊讶等等
这个AI工具无疑又将打开一片新市场的大门。
3 SAM分割:分割一切图像
最近,Meta AI发布了 Segment Anything Model(SAM)—— 第一个图像分割基础模型。其核心思想是开发出一个通用的分割模型,可以在用户输入的Prompts指导下分割一切!
很多计算机视觉从业者惊呼“这下CV真的不存在了,快跑!”。
SAM是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同,SAM可以处理所有类型的图像。
相比于以往的图像分割模型,SAM可以识别各种输入提示,确定图像中需要分割的内容,还可以灵活集成到虚拟现实/增强现实等其他系统中,且目前对于一些它未见过或相对模糊的场景,也能实现较好的图像分割效果。
SAM分割的灵感来源于最近备受关注的GPT-4,它也展现出了类似的多模态能力,比如直接从手写文字生成网站、识别图像中的幽默元素等等。
SAM模型将在计算机视觉领域和工业生产领域带来一场巨变。
有了图像分割通用模型后,这些领域内定制化开发产品的成本可能会降低,由此带来毛利率的提升。
还有一些领域,过去因为样本量少而难以应用深度学习等人工智能算法。现在,由于SAM在零样本或者少量样本上表现优异,一些新的应用领域将被拓展,比如从代码驱动变为视觉驱动的机器人、流程工业场景等。
4 AgentGPT:新型自主AI
最近AutoGPT的横空出世,代表着自主人工智能的“崛起”,而有类似自主能力的AI,还有最近同样火爆的AgentGPT。
AgentGPT 是一个在浏览器中运行的任务驱动的自治 AI 代理。
AgentGPT旨在在没有人工协助的情况下跨多个领域处理一系列任务。自主 AI 代理正在重新定义我们与技术交互的方式。通过利用先进的 AI 模型,例如 OpenAI 的 GPT-4 语言模型,这些代理不仅可以执行任务,还可以根据结果生成新的任务,并动态地确定它们的优先级。
自然语言处理和其他 AI 技术的结合使这些代理,能够在各种约束和上下文中自主运行,从而使它们对广泛的应用程序有价值。
相比AutoGPT,AgentGPT更加易用好上手,且目前仍是免费的。
5 Zip Nerf:AI生成3D真实场景
4月13日,Google发布了逆向建模新成果Zip-NeRF,解决了原来Mip-NeRF锯齿问题和复杂场景渲染效果,速度提升22倍。
Zip-NeRF是一个基于网格的反偏差神经辐射场,它可以让你用自然语言来与3D场景进行交互和生成。
谷歌根据Zip Nerf,发布了一段完全由模型生成的场景视频。
它可以理解为一个复杂的数学运算,视频中的每一个像素都不是通过渲染,而是通过数学运算出来的,而输入的“prompt” 便是摄像机的高度、角度、位置等。
通过拍摄场景的不同角度的照片,便可不到一个小时生成逼真的高质量3D场景模型。
甚至还可以让Zip-NeRF根据3D场景来生成不同视角和光照条件下的高动态范围的图像。
以上就是本期介绍的五个AI工具啦,关注咪豆圈,带你了解更多AI前沿资讯!
咪豆AI圈(Meedo)针对当前人工智能领域行业入门成本较高、碎片化信息严重、资源链接不足等痛点问题,致力于打造人工智能领域的全资源、深内容、广链接三位一体的在线科研社区平台,提供AI导航网、AI版知乎,AI知识树和AI圈子等服务,欢迎AI未来儿一起来探索(www.meedo.top/)