世界上最快的AI推理?

213 阅读6分钟

前言

上次体验了一款专注于AI推理的模型,感兴趣可以看往期:【初识Groq AI】,今天又了解到一个专注于AI推理的模型厂商,特此了解一番。

简介

SambaNova 是一家专注于人工智能(AI)工作负载的公司,致力于通过其创新的硬件和软件解决方案来彻底改变AI应用的性能。SambaNova 提供了世界上最快的AI推理平台,支持包括Llama 3.1、3.2和3.3在内的模型,并且对用户免费。公司的产品和技术旨在帮助开发者和企业快速部署和管理AI应用,特别是在需要高性能和高效率的场景下。

产品和服务

  • SambaNova Cloud:利用SambaNova云服务,开发者可以构建他们之前无法实现的应用。例如,Blackbox.ai使用SambaNova云服务来支持代理工作流程,通过自主代理CyberCoder,开发者可以快速同时编辑多个文件,这在以前是一项复杂且耗时的任务。
  • SambaNova Suite:这是一个完整的AI解决方案,包括精细调整、SambaStudio、基础模型和SN40L RDU。它提供了世界上最高效、准确和安全的AI平台,支持企业知识搜索、功能调用和代理RAG等功能。
  • SN40L Reconfigurable Dataflow Unit (RDU):这是专为AI设计的创新硬件,具有数据流架构和三层内存设计,旨在支持最大的和最好的AI模型,推动代理AI的发展。SN40L RDU是全球最快的平台。
  • DataScale:这是SambaNova的硬件系统,专为代理AI设计,能够快速部署生成式AI模型,满足任何规模组织的需求。DataScale系统在能源效率和小型化方面提供了卓越的性能。

优势

国内可正常访问

官网

官网地址:sambanova.ai

图片

注册登录

使用SambaNova提供的服务需要进行注册登录,选择适合自己的方式注册登录

图片

                   

图片

Playground

官网地址:cloud.sambanova.ai

SambaNova提供的Chat服务需要登录,没有账号的可以参考上面的【注册登录】,登录成功后可进行正常的聊天操作

图片

SambaNova Playground提供了 Meta、QWen 和 Llama 相关模型,按类型可分为 文本生成、视觉生成 和 音频生成 3类。

图片

SambaNova Playground还提供了上下文代码接入,一键粘贴当前聊天上下文及代码

图片

下面对这些模型进行一下简单测试,看看模型表现和响应时间方面的差异

文本聊天

第一个问题:模型信息

图片

确实很快,瞬间完成了输出,总耗时 0.62s

第二个问题:将中文翻译为英文

图片

不知道是不是提问方式的问题,AI一开始没理解我的意图,重新描述后得到了结果,转换和输出的过程依然很快。

代码生成

第一个问题:生成深度优先算法

图片

图片

不错,2.1s输出了,这么简单?,让AI写个单元测试验证一下

图片

验证是成功的✅,这就有点强了👍🏻

图片

第二个问题:使用html,css,js帮我写一个记账功能

图片

总共耗时 4.12s,该平台不支持预览,将代码粘贴到本地查看,预览效果如下:

图片

逻辑推理

以 Meta-Llama-3.3-70B 作为基础测试来测试大模型的表现

第一个问题:

鲁迅和周树人的关系

图片

输出正确✅,看来这种问题已经难不倒现在的AI模型了

第二个问题:

小明妈妈7年前的年龄是小明的6倍,小明今天12岁,小明妈妈今天几岁?

图片

回答正确✅

第三个问题:

Strawberry里有几个 r?

图片

回答错误❌,这个问题牵扯到模型底层问题,让AI深度思考就会给出正确答案,这里不做深入。

图片

第四个问题:

9.9和9.11哪个大?

图片

换个模型,千问2.5回答的也有问题

图片

文生图

图片

没法直接根据提示词生成图片

长文本

图片

模型输出限制,无法一次输出长文本

文件处理

文件处理,需要先切换到视觉模型,仅支持上传图片

图片

首先让AI帮我们识别图片内容并以markdown格式输出

图片

虽然它很快,但这输出的结果效果很差,完全不符合预期。那么再让他分析一下构图

图片

API Key

妥善保管API Key,后续将不再展示

图片

提示表示会禁用之前的API Key,点击【Confirm】确认

图片

工具包

SambaNova提供了一个入门工具包,感兴趣的可以自行研究

图片

产品定价

注册登录成功后,默认开启免费模式,可以免费使用UI开发和APIs调用,但是有一定的限制

图片

图片

社区

SambaNova有自己的社区平台,在社区平台可以查看最新信息、进行日常讨论以及提出自己的建议。

图片

体验

SambaNova整体体验下来就一个感觉快,在文本处理、代码生成和逻辑推理方面表现很不错,不仅速度快,答案也比较准确,适合追求快速响应的场景。但也有遗憾的地方,SambaNova不支持长文本输出,不支持绘图,对文件处理方面还有待提高。

友情提示

见原文:世界上最快的AI推理?

本文同步自微信公众号 "程序员小溪" ,这里只是同步,想看及时消息请移步我的公众号,不定时更新我的学习经验。