首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
致Great
掘友等级
自然语言处理
勇于面对,不要躲避yanqiangmiffy.github.io
获得徽章 12
动态
文章
专栏
沸点
收藏集
关注
作品
赞
325
文章 210
沸点 115
赞
325
返回
|
搜索文章
最新
热门
一文深入了解DeepSeek-R1:模型架构
📝 1. 输入上下文长度 DeepSeek-R1的输入上下文长度为128K。 DeepSeek-R1 从其基础模型 DeepSeek-V3-Base 继承了 128K 上下文长度。最初,DeepSee
DeepSeek 背后的数学原理:深入探究群体相对策略优化 (GRPO)
GRPO动机 什么是 GRPO? 群体相对策略优化 (GRPO,Group Relative Policy Optimization) 是一种强化学习 (RL) 算法,专门用于增强大型语言模型 (LL
DeepSeek-R1 论文解析——人工智能领域的 RL LLM 新时代?
简介 最近几年,AI领域真是突飞猛进,尤其是大型语言模型(LLM),它们为通用人工智能(AGI)的发展打下了基础。OpenAI的o1模型就是个很好的例子,它用了一种创新的推理时间扩展技术,大大提升了推
深入了解Deepseek模型的最佳三篇论文
其中以下几篇尤为重要,因其在技术创新和实际应用中取得了重大突破: DeepSeek-R1:通过强化学习提升大型语言模型的推理能力。 2025年1月发布,提出了一种使用强化学习而非监督学习的方法,显著提
图解DeepSeek R1训练流程
论文试图解决的问题 这篇论文介绍了一种新的第一代推理模型——DeepSeek-R1系列,旨在通过强化学习(Reinforcement Learning, RL)提升大型语言模型(Large Langu
【HuggingFace项目】:Open-R1 - DeepSeek-R1 大模型开源复现计划
概述 Open-R1 是由 HuggingFace 发布的一个完全开放的项目,旨在通过三个主要步骤复现 DeepSeek-R1 的完整训练流程。这个项目的目标是让更多人能够理解和使用 DeepSeek
RAG如何让生成AI更智能?最新方法与优劣深度解析
近年来,人工智能技术突飞猛进,尤其是生成式AI,简直像是开了挂一样,各种惊艳的表现让人直呼“未来已来”。根据IDC的研究,生成式AI的市场规模在2022年已经达到了107亿美元,而到2026年,这个数
RAG分块新思路:LGMGC如何提升文档分块的语义连贯性?
今天给大家分享一篇关于RAG文本切块的论文: 论文概述 在**开放域问答(Open-Domain Question Answering, ODQA)**任务中,**文档分块(chunking)**过程
【RAG落地利器】Weaviate、Milvus、Qdrant 和 Chroma 向量数据库对比
什么是向量数据库? 向量数据库是一种将数据存储为高维向量的数据库,高维向量是特征或属性的数学表示。每个向量都有一定数量的维度,根据数据的复杂性和粒度,可以从数十到数千不等。 向量通常是通过对原始数据(
【RAG落地利器】向量数据库Milvus教程:如何实现MetaData检索过滤
环境依赖 安装 Docker 安装 Milvus Milvus 在 Milvus 存储库中提供了 Docker Compose 配置文件。要使用 Docker Compose 安装 Milvus,只需
下一页
个人成就
文章被点赞
514
文章被阅读
103,131
掘力值
3,838
关注了
16
关注者
4,801
收藏集
5
关注标签
32
加入于
2015-12-13