现在,我们的生活已经越来越需要AI这个智能小助手了。而最新推出的DeepSeek R1依靠其超强的实力和较低的价格,可以更好的帮着我们完成任务。
注:如果想看实操可以直接跳转到 如何使用DeepSeek R1 这一节。
大模型?这东西可太好了
写论文找不到文献重点?小组作业队友总拖ddl?考前复习像在迷宫里乱转?这些问题实在是困扰我们太久。这不禁让我们发问,有没有办法能解决这一问题?
在以前,这个问题的答案只能是发挥一下个人主观能动性,自己加油埋头苦干了。但是现在想必各位已经能够答出一个 "省力" 的答案 —— 使用大模型。
而你要说现在最具性价比的大模型是哪个,那我当然会说:DeepSeek R1 。
对于之前的大模型,如果使用GPT-4o,o1等模型,需要较高的使用成本(o1-mini 输入价格为 21元 / 1M Token,输出价格为 84元 / 1M Token)。而实力更强大的 DeepSeek R1 输入价格只需 4元 / 1M Token ,输出价格只需 16元 / 1M Token 即可。
[!TIP] 上图只展示了输入价格,要了解详情请前往数据提供项目网站
R1的「超能力」,从何而来?
虽然R1很便宜,但是他的性能可以一点都不差。DeepSeek R1在数学问题上表现出色,达到了与 o1-1217 相当的性能,在 MATH-500 基准测试上获得了惊人的高分(97.3%),同时在编码算法任务中也表现出了很强的竞争力。
DeepSeek R1的强大性能和极低的价格并非偶然,而是源于其先进的技术架构和海量的训练数据。 为了更好地理解DeepSeek R1的能力,我们接下来将深入探讨其核心技术,包括MoE架构、长上下文处理以及庞大的知识库。
MoE架构:让各路大神来回答你的问题
MoE架构,简单来说就是AI团队中的 "超级学霸小组"。当你提问时,MoE会让不同专家负责数学、编程、写作,然后动态投票决定谁回答最靠谱。最后再将答案呈现到你的面前。
而MoE的好处就是可以节省大量的训练需求和与其他模型相比更快的推理速度。
CoT(思维链):让AI想的更多一些
对于复杂问题(尤其是复杂的数学题),之前的监督微调(SFT)大模型很难直接给出正确答案。而COT会在输出最终答案之前,显式输出中间逐步的推理步骤。
CoT 大幅度提高了 LLM 在复杂推理任务上的性能,并且输出的中间步骤方便使用者了解模型的思考过程,提高了大模型推理的可解释性。
有了这两个利器,DeepSeek R1自然也就强大了。
我们该如何使用DeepSeek R1
前面我们讲了很多,那么最大的问题来了:我们该如何去更好的使用DeepSeek R1呢?
[!TIP] 这里我们使用咱们社团构建的iOS AI。主要是方便使用知识库,多端共享等功能。
网站:gpt.xauat.site 安卓端App:请看社团QQ群群文件
我们现在打开 iOS AI:
点击左上角的Logo图像:
之后点击 登录/注册 按钮。我们就会来到这样一个页面:
如果你是iOS Club社团成员,你可以直接输入手机号和学号进行登录。如果并不是,注册即可。
登录注册成功之后,就可以开始使用AI了!
如何使用DeepSeek R1
我们现在来到中间的对话部分。在输入框的上方有一排按钮:
点击第一个(类似于大脑的那个)按钮。选择 DeepSeek R1:
在下方输入框中输入你想要问的问题,就可以开始聊天了!
接下来,我们就要讲讲,如何让你的AI变得更得心应手。
一点点小技巧:礼貌的询问AI
在人们使用了很长一段时间的大模型之后,发现了一个小秘诀:礼貌的询问AI比生硬的问题更能让AI生成出你想要的回答。
例如,我们现在有这样一个需求:我们想让AI用《甄嬛传》台词解释区块链技术。如果是生硬的来讲,就是:
用《甄嬛传》台词解释区块链技术
但是我们可以使用更加礼貌的问法,一般来说只需要在前面加个 ”请” 即可。例如:
请你用《甄嬛传》台词解释区块链技术
这样的话AI就可以生成出更好的回答。
问问题时,灵活运用Markdown语法
在我们询问问题时,我们可以使用到Markdown来帮助我们,让问题更加的细致和完善。
例如我们有这样一个场景:我们需要让AI找出这段代码的问题,但是这段代码有点长,如果直接进行复制的话,可能会让AI摸不清哪些是代码片段。这个时候我们就可以使用到 Markdown 的一个小小的语法。
我们可以这样写:
我在Blazor写代码时遇到Bug:
```
具体代码我就不贴了
```
运行时不能一下子将Markdown内容展示出来,需要再次刷新才行
我们只需要使用 ``` 将内容给框起来即可。
使用文档功能
iOS AI自带文档解析功能。因此我们可以将一些文档存入iOS AI中。存入后iOS AI会进行分块和向量化。我们只需在对话中点击输入框第二个按钮,然后传入相应的文件即可。
或者我们可以点击左侧中间第二个 文件 按钮,来到文件页面。
在右上角也可以进行文件上传。
我们在使用时直接选择输入框上方第三个按钮,选择对应的文件即可。
知识库:更丰富的 「文档」
我们还可以构建自己的知识库。在文件页面点击知识库右侧的 + 按钮,即可创建自己的知识库。然后点击你创建好的知识库,在右上角上传文件或文件夹即可。
使用方式和前面的文件使用方式一致。
更多助手,更多帮助
我们现在点击左侧中间第三个 发现 按钮:
我们可以在这里找到各种各样的助手。他们都预先写好了相应的预设。我们可以直接添加到助手栏中:
最后我们就可以直接和这位助手进行对话了。
这些都是一些基础型的建议,接下来让我们讲一些更加 “进阶” 的内容
进阶内容:让AI成为你的代码调试助手
前面我们有讲到,我们可以使用Markdown丰富我们的问题描述。那么我们也可以使用这一点让AI成为代码调试助手。我们现在只需要将我们的问题先简单描述一下,然后贴上代码,并在后面写上我们想要的结果即可。在这里我们可以借用Github体issus的格式:
- 问题摘要(简明标题)
- 背景说明(不超过三句话)
- 代码片段(含错误上下文)
- 预期行为描述
- 实际运行结果
- 已尝试的解决方案(可选)
- 环境配置信息(可选)
例如这样:
简单的问题描述(例如 在安装某项目时,出现了下面的问题:)
```
这里贴上相关代码
```
(如果需要贴多个代码,请在代码前面添加名称或者主要功能)
(如果是安装软件或者认为和计算机环境有关系的,可以贴上相关环境变量)
这这里写上你想要的预期效果
这样就可以了。在iOS AI中,将会是这样的:
这样AI就可以更精准的了解到你的需求和问题代码片段。从而能更好的帮助到你完成代码的调试。
让AI来帮你绘制流程图
在之前想要绘制流程图,可能各位会使用到draw.io等软件来进行制作。不过现在有了一个更加简洁的办法:使用AI来帮你绘制流程图。
我们只需要给定相关的关系文本(或者文档),然后在输入框中提出这个词:mermaid。至于mermaid是什么,这个以后可以讲讲。
我们现在可以这么写:
请你使用mermaid来生成一份流程图。内容如下:
```
关系文本
```
现在AI就会帮你生成一份流程图。各位只需要截图使用即可。当然,你也可以将生成的mermaid文本进行复制,再进行更改。
润色你的文本表达
前面我们提到,iOS AI 有很多的助手。我们也可以在 发现 页面找到我们需要的助手。例如我们可以搜索 ”文本改写大师“:
我们点击右侧的 添加助手并对话。这时我们就可以和这位助手进行对话了。我们可以给定一段 ”口水话“。并且让他进行更改。例如我们可以使用下面这个格式:
你能不能帮我看看这段话?
文本内容
这样就可以让这位助手进行润色和帮助型更改。而且这位助手会标注好有问题的词汇及其具体问题。
建立自己的数字「藏书阁」
iOS AI 现在支持知识库和文档解析功能。因此我们完全可以构建起自己的一套知识库。例如我们想要快速的阅读一篇论文时,我们可以点击输入框的第二个按钮,然后选择相应的论文文件:
当向量化完毕之后,我们便可向AI助手询问关于这篇论文的一些问题。
当我们需要使用大量的文档数据时,我们也可以自己构建一个知识库(具体构建办法请看前面的内容)。例如当我们在进行期末复习或需要写文章时,我们可以把相关的内容(例如PPT,Word文档,网页等等)统统加到知识库中。然后点击输入框上方第三个按钮,选择相应的知识库即可。
最后
相信各位看到这里也都了解了最新的DeepSeek R1模型,以及如何在iOS AI中更好的使用这一模型。希望各位在读完这篇文章之后,能够更好的「驾驭AI」,让AI成为你生活中的小助手。
文后注解
[1] 关于DeepSeek R1的相关测试数据和分析请看github.com/deepseek-ai… [2] 关于MoE架构,可以去看huggingface.co/blog/zh/moe [3] 关于CoT(思维链),如果各位感兴趣可以去看zhuanlan.zhihu.com/p/670907685 [4] 有消息指出,DeepSeek R1并未使用CUDA,而是采用了PTX这一更底层的语言。其更像是汇编语言。 [5] iOS AI 前端来源于开源项目LobeChat:github.com/lobehub/lob…