首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
DeepSeek忠实粉丝
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
DeepSeek忠实粉丝
43分钟前
关注
微调篇--Transformers多模态流水线任务
推理pipeline [pipeline] 让使用Hub上的任何模型进行任何语言、计算机视觉、语音以及多模态任务的推理变得非常简单。即使您对特定的模态没有经验,或者不熟悉模...
0
评论
分享
DeepSeek忠实粉丝
43分钟前
关注
微调篇--Transformers执行分类推理任务
一、Transformers 分类推理过程 将数据预处理、模型调用、结果后处理三部分组装成的流水线,如下流程图 使我们能够直接输入文本便获得最终的答案,不需要我们关注细节 ...
0
评论
分享
DeepSeek忠实粉丝
23小时前
关注
微调篇--HF-transformers快速入门
现在做 NLP 方面的研究实在离不开预训练语言模型,尤其是 BERT。 huggingface 的 transformers 包是目前使用 BERT 最主流最方便的工具之一...
0
评论
分享
DeepSeek忠实粉丝
23小时前
关注
微调篇--Transformers架构解析
随着人工智能技术的飞速发展,大语言模型(Large Language Models, LLMs)在自然语言处理(NLP)领域扮演了越来越重要的角色。它们不仅在语义理解、文本...
0
评论
分享
DeepSeek忠实粉丝
2天前
关注
微调篇--Deepseek模型Lora微调
引言 随着人工智能技术的飞速发展,大型语言模型(LLM)在自然语言处理(NLP)领域扮演着越来越重要的角色。然而,预训练的模型往往需要针对特定任务进行微调,以提高其在特定领...
0
评论
分享
DeepSeek忠实粉丝
2天前
关注
微调篇--基于GPT定制化微调训练
分享内容 GPT模型特性与应用场景(诗词、对联、文章) 数据集构建规范 本地训练全流程实践 模型特性与应用场景 GPT-2 是基于 Transformer 架构的生成式预训...
0
评论
分享
DeepSeek忠实粉丝
3天前
关注
微调篇--超长文本微调训练
分享内容 新闻评论分析任务训练流程 加载自定义数据集 处理超长文本的训练问题 扩展词汇表并匹配模型 修改模型配置信息 评论分析任务概述 评论分析是情感分析的一个应用场景,旨...
0
评论
分享
DeepSeek忠实粉丝
3天前
关注
微调篇--BERT模型进行文本分类
前言 中文情感分析的多分类任务简介 情感分析 的分类 情感分析旨在分析文本中的情感倾向。在传统的情感分析任务中,通常是将情感分类为 “正面” 和“负面”两类。多分类情感分析...
0
评论
分享
DeepSeek忠实粉丝
5天前
关注
Deepseek篇--阿里QwQ-325b性能比肩Deepseek满血版
3月6日 凌晨 3 点,阿里开源发布了新推理模型 QwQ-32B,其参数量为 320 亿,但性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。 千问的推文表...
0
评论
分享
DeepSeek忠实粉丝
5天前
关注
Deepseek篇--背后核心技术揭秘
探讨 DeepSeek 大模型的核心技术,从公司背景、模型能力、训推成本到核心技术细节进行了全面分析。 一、关于 DeepSeek 公司及其大模型 1.1 公司概况 Dee...
0
评论
分享
DeepSeek忠实粉丝
5天前
关注
Deepseek篇--开源技术3FS & smallpond详解
2 月 24 日,DeepSeek 启动 “开源周”,第四个开源的代码库为 3FS&smallpond(又是一下发布了两个)。 3FS(Fire-Flyer File Sy...
0
评论
分享
DeepSeek忠实粉丝
5天前
关注
Deepseek篇--开源技术DualPipe 与 EPLB详解
 2 月 24 日,DeepSeek 启动 “开源周”,第...
0
评论
分享
DeepSeek忠实粉丝
7天前
关注
Deepseek篇--开源技术DeepGEMM详解
2 月 24 日,DeepSeek 启动 “开源周”,第三个开源的代码库为 DeepGEMM,并向 CUTLASS 团队致敬。DeepGEMM 使用了大量与 Hopper ...
0
评论
分享
DeepSeek忠实粉丝
7天前
关注
Deepseek篇--开源技术DeepEP详解
2 月 24 日,DeepSeek 启动 “开源周”,第二个开源的代码库为 DeepEP。很好,又挤了一段有硬件基因的牙膏出来。H100/H800 绝对是 DeepSeek...
0
评论
分享
DeepSeek忠实粉丝
8天前
关注
Deepseek篇--开源技术FlashMLA详解
2 月 24 日,DeepSeek 启动 “开源周”,首个开源的代码库为 FlashMLA。DeepSeek 这种挤牙膏式的宣推手段也是很有意思,看来梁文锋团队不仅仅是技术...
0
评论
分享
DeepSeek忠实粉丝
8天前
关注
DeepSeek篇--结合LlamaIndex构建RAG应用
前言 在大模型(如 GPT、LLaMA 等)快速发展的今天,生成式 AI 的能力已经令人惊叹,但其固有的 “幻觉问题” 仍然是一个重要挑战。大模型在生成文本时,可能会输出与...
0
评论
分享
DeepSeek忠实粉丝
8天前
关注
Deepseek篇--结合Autogen构建多Agent应用
分享内容 通过打造一款 AI 旅游规划师,通俗易懂、深入浅出的讲清楚 AI 应用的大方向 - Agent 智能体 - 的原理。 无需科学上网,无需付费API,无需编程能力,...
0
评论
分享
DeepSeek忠实粉丝
8天前
关注
Deepseek篇--结合Autogen构建多Agent应用
分享内容 RAG 工作原理与技术架构深度剖析 Dify入门与私有化部署 Dify 构建知识库 Dify接入Deepseek R1构建Agent应用 RAG 工作原理与技术架...
0
评论
分享
DeepSeek忠实粉丝
11天前
关注
DeepSeek篇-基于DeepSeek R1搭建企业级知识库
Ollama 部署 DeepSeek-R1模型 使用 Ollama 部署 DeepSeek-R1 模型的步骤相对简单,以下是详细的部署流程: 步骤 1: 安装 Ollama...
0
评论
分享
DeepSeek忠实粉丝
12天前
关注
DeepSeek篇-模型本地部署, 保姆级教程
分享内容 Ollama 部署工具介绍 DeepSeek-R1主要特点和应用场景 使用 Ollama 部署 DeepSeek-R1步骤 总结 官网: https://www....
0
评论
分享
下一页
个人成就
文章被点赞
3
文章被阅读
1,364
掘力值
554
关注了
0
关注者
2
收藏集
0
关注标签
4
加入于
2025-05-09