首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
我有一计333
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
17
文章 17
沸点 0
赞
17
返回
|
搜索文章
赞
文章( 17 )
沸点( 0 )
【算法笔记】6.LeetCode-Hot100-链表专项
本文开始,不再记录原题,只记录解题思路和 AC 代码,加快进度。 1. 相交链表(t160) 思路分析:一上来没看懂这题要做什么,看了题解才知道这题是要找到两个链表相交的首个公共节点,一个巧妙的解法就
使用非专业计算显卡,能跑DeepSeek满血版吗?
理论计算 使用非专业计算显卡,能跑DeepSeek**满血版吗? 通常概念下,DeepSeek满血版指DeepSeek-R1-671B(最高档参数量)的模型。 根据前文总结的计算公式,671B参数量,
【大模型微调】2.微调方法详解与模型显存占用实测
引言 前文在 Windows 环境下打通模型 SFT 微调流程后,本文进一步在 Linux 服务器上进行实验。 LLaMA-Factory 给了一则不同模型精度和训练方法所需显存的参考表。 此表的显存
【大模型微调】3.通过Easy Dataset构建自己的微调
启动 LLaMA-Factory: 这样就可以选择到构建的数据集。 这个路径并不是必须放到 data 目录下,也可以放到其它位置,文件名称对应上即可。 选择完数据集后,就可以按照前文所述的操作开始微调
【大模型微调】4.模型评估标准及操作流程
引言 要找到最优的模型训练策略,首先要明确模型的评估体系。 进一步可分解为三个子问题: 评估标准是什么? 如何进行模型评估? 如何利用公开数据集进行评估? 本文将从这三个问题进行探究。 评估标准是什么
Qwen3-Embedding:原理解读和检索场景测试
概述 2025.6.6,通义千问团队发布了 Qwen3-Embedding 和 Qwen3-Reranker 系列。 两组模型一块训练发布,本文侧重于前者进行分析和测试。 开源地址:https://g
Flutter环境搭建与多端部署
前言 在移动互联网时代,只做PC端应用,应用场景还是太局限。 如果要对移动端进行应用开发,最直接的办法就是用原生方式开发,Android 系统用 Android Studio,iOS 系统用 Xcod
【大模型微调】1.LLaMA-Factory简介和基本使用流程
引言 本文开始,进入到大模型微调领域。 之前一直在做 RAG 的相关内容,RAG 能够直接通过预先解析好的知识库,增强模型回答的输出质量。 然而,当知识库较大时,RAG 会显著增加检索搜索的时间,导致
FreePDFv5.1.0:调整输出结果/优化问答表现
概述 FreePDF 发布 v5.1.0 版本。 更新内容如下: 增加保存双语对照文件可选项 调整引擎配置布局 问答界面支持 markdown 格式渲染 项目开源地址:https://github.c
我的"实习生"又添新成员:Kiro产品体验
前言 前天,亚马逊也下场进入 Ai 编程赛道,开放 Kiro 产品公测。 官网地址:https://kiro.dev Kiro的产品定位,图源官网 Kiro 是对标 Cursor** 的 IDE 类型
下一页
个人成就
文章被点赞
31
文章被阅读
8,060
掘力值
486
关注了
0
关注者
5
收藏集
0
关注标签
8
加入于
2025-07-17