首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
玩转AGI
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
面试篇-大模型进阶篇
一、什么是生成式大模型? 生成式大模型(简称大模型 LLMs)是指能用于创作新内容(如文本、图片、音频、视频等)的深度学习模型。其与普通深度学习模型的主要区别在于: 模型参数量更大:通常在 Billi
面试篇-大模型基础篇
一、目前主流的开源模型体系有哪些? 目前主流的开源模型体系分为三种: 第一种:prefix Decoder 系 介绍 :输入双向注意力,输出单向注意力。 代表模型 :ChatGLM、ChatGLM2、
面试篇-大模型微调
显存相关问题 1. 如果想要在某个模型基础上做全参数微调,究竟需要多少 显存 ? 一般 nB 的模型,最低需要 16 - 20nG 的显存。以 vicuna - 7B 为例,官方样例配置为 4A1
面试篇-Prompt
1. 什么是提示词工程?请举例说明。 答案: 提示词工程(Prompt Engineering) 是指通过设计、优化输入给大语言模型的文本提示,以引导模型生成更准确、有用、结构化的内容。 案例: 2.
面试篇-十分钟搞懂LangChain 疑难杂症
什么是 LangChain? LangChain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支
面试篇-一文搞懂 RAG技术
一、LLMs 已经具备了较强能力了,存在哪些不足点? 在 LLM 已经具备了较强能力的基础上,仍然存在以下问题: 幻觉问题 :LLM 文本生成的底层原理是基于概率的 token by token 的形
面试篇-一文搞定 Agent
以下是对上述内容的进一步整理和丰富: 一、基础理论与算法 PEAS 描述框架 : Performance(性能) :是衡量 AI Agent 表现优劣的指标,例如在自动驾驶场景下,可用车辆的行驶时间、
Deepseek篇--开源技术DualPipe 与 EPLB详解
2 月 24 日,DeepSeek 启动 “开源周”,第四个开源的代码库为 DualPipe 与 EPLB(一下发布了两个)。DualPipe 与 EPLB 依然使用了大量与 Hopper 架构绑定的
Qwen Agent | 将思考「工具化」提升规划能力
一、为什么需要"思考工具"? 想象你是一名航空公司的客服,面对"我要退改签国际航班"这样的复杂请求时,会不假思索地直接操作吗?当然不会!正常人都会先: 确认用户身份和票务信息 核对退改签政策(24小时
一文帮打通:AI, 机器学习, 大模型, LLM, Agent 都是啥关系?
引言:你被这些词汇“绕晕”了吗? 最近是不是感觉整个世界都在聊AI?从ChatGPT、Sora、到Cursor… 人工智能正以前所未有的速度和广度渗透进我们的生活和工作。 伴随而来的是一堆高频词汇:大
下一页
个人成就
文章被点赞
8
文章被阅读
7,418
掘力值
796
关注了
0
关注者
8
收藏集
0
关注标签
0
加入于
2025-05-10