大模型基础知识

2025-04-30 365 阅读2分钟

mcp是啥？

MCP（Model Context Protocol，模型上下文协议）是由 Anthropic 推出的一种开放标准，旨在统一大型语言模型（LLM）与外部数据源和工具之间的通信协议。MCP 的主要目的在于解决当前 AI 模型因数据孤岛限制而无法充分发挥潜力的难题，MCP 使得 AI 应用能够安全地访问和操作本地及远程数据，为 AI 应用提供了连接万物的接口。

MCP 官网：https://modelcontextprotocol.io
MCP GitHub：https://github.com/modelcontextprotocol

本地跑个大模型

ollama run qwen3:0.6b

满血模型是啥

AIGC大模型参数的5B、7B是指模型中可训练参数的数量。这里的“B”表示10亿（Billion），即10^9。因此，5B表示50亿个可训练参数，7B表示70亿个可训练参数。这些参数是神经网络中的权重和偏置，它们在训练过程中通过反向传播算法进行更新，以使模型能够更好地拟合训练数据。

下载个大模型UI界面

www.cherry-ai.com/download

大模型咋知道你要的是啥？

看这个 juejin.cn/post/733751…

input和隐藏层和output神经模型svg alexlenail.me/NN-SVG/

卷积神经网络 easyai.tech/ai-definiti…

算法调参全连接神经网络 juejin.cn/post/684490…

playground.tensorflow.org/

Transformer架构的核心是基于Encoder-Decoder结构，采用自注意力机制（Self-Attention）和多头注意力（Multi-Head Attention）实现并行化处理序列数据，解决了传统RNN模型的长序列依赖和计算效率问题‌ bbycroft.net/llm

mcp和function call 和agent的区别

详情看这个 juejin.cn/post/748818…

agent -> app
functioncall -> ajax
mcp -> http
rag -> chrome

了解这个有啥用？

做些公司或者个人用的本地话的定制服务比如：rd-mcp-server 这个有两个工具：

1.返回生成sls页面的提示词
2.返回接口信息markdown

这两个都是不能在公网暴露，并且依赖本地知识库的定制化的功能