大模型基础知识

78 阅读2分钟

mcp是啥?

MCP(Model Context Protocol,模型上下文协议) 是由 Anthropic 推出的一种开放标准,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信协议。MCP 的主要目的在于解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题,MCP 使得 AI 应用能够安全地访问和操作本地及远程数据,为 AI 应用提供了连接万物的接口。

MCP 官网:https://modelcontextprotocol.io
MCP GitHub:https://github.com/modelcontextprotocol

本地跑个大模型

ollama.com/

ollama run qwen3:0.6b

image.png

满血模型是啥

AIGC大模型参数的5B、7B是指模型中可训练参数的数量。这里的“B”表示10亿(Billion),即10^9。因此,5B表示50亿个可训练参数,7B表示70亿个可训练参数。这些参数是神经网络中的权重和偏置,它们在训练过程中通过反向传播算法进行更新,以使模型能够更好地拟合训练数据。

image.png

image.png

下载个大模型UI界面

www.cherry-ai.com/download

image.png

大模型咋知道你要的是啥?

看这个 juejin.cn/post/733751…

input和隐藏层和output神经模型svg alexlenail.me/NN-SVG/

卷积神经网络 easyai.tech/ai-definiti…

算法调参全连接神经网络 juejin.cn/post/684490…

image.png

playground.tensorflow.org/

Transformer架构的核心是基于Encoder-Decoder结构,采用自注意力机制(Self-Attention)和多头注意力(Multi-Head Attention)实现并行化处理序列数据,解决了传统RNN模型的长序列依赖和计算效率问题bbycroft.net/llm

mcp和function call 和agent的区别

image.png

详情看这个 juejin.cn/post/748818…

  • agent -> app
  • functioncall -> ajax
  • mcp -> http
  • rag -> chrome

了解这个有啥用?

做些公司或者个人用的本地话的定制服务 比如:rd-mcp-server 这个 有两个工具:

  • 1.返回生成sls页面的提示词
  • 2.返回接口信息markdown

这两个都是不能在公网暴露,并且依赖本地知识库的定制化的功能