我有一计333

赞

17

|

搜索文章

赞

文章( 17 ) 沸点( 0 )

【算法笔记】6.LeetCode-Hot100-链表专项

本文开始，不再记录原题，只记录解题思路和 AC 代码，加快进度。 1. 相交链表(t160) 思路分析：一上来没看懂这题要做什么，看了题解才知道这题是要找到两个链表相交的首个公共节点，一个巧妙的解法就

我有一计333
8月前
217
2
评论

【算法笔记】6.LeetCode-Hot100-链表专项

使用非专业计算显卡，能跑DeepSeek满血版吗？

理论计算使用非专业计算显卡，能跑DeepSeek**满血版吗？通常概念下，DeepSeek满血版指DeepSeek-R1-671B(最高档参数量)的模型。根据前文总结的计算公式，671B参数量，

我有一计333
9月前
305
1
评论

使用非专业计算显卡，能跑DeepSeek满血版吗？

【大模型微调】2.微调方法详解与模型显存占用实测

引言前文在 Windows 环境下打通模型 SFT 微调流程后，本文进一步在 Linux 服务器上进行实验。 LLaMA-Factory 给了一则不同模型精度和训练方法所需显存的参考表。此表的显存

我有一计333
9月前
723
2
评论

【大模型微调】2.微调方法详解与模型显存占用实测

【大模型微调】3.通过Easy Dataset构建自己的微调

启动 LLaMA-Factory: 这样就可以选择到构建的数据集。这个路径并不是必须放到 data 目录下，也可以放到其它位置，文件名称对应上即可。选择完数据集后，就可以按照前文所述的操作开始微调

我有一计333
9月前
117
1
评论

【大模型微调】3.通过Easy Dataset构建自己的微调

【大模型微调】4.模型评估标准及操作流程

引言要找到最优的模型训练策略，首先要明确模型的评估体系。进一步可分解为三个子问题：评估标准是什么？如何进行模型评估？如何利用公开数据集进行评估？本文将从这三个问题进行探究。评估标准是什么

我有一计333
9月前
150
1
评论

【大模型微调】4.模型评估标准及操作流程

Qwen3-Embedding：原理解读和检索场景测试

概述 2025.6.6，通义千问团队发布了 Qwen3-Embedding 和 Qwen3-Reranker 系列。两组模型一块训练发布，本文侧重于前者进行分析和测试。开源地址：https://g

我有一计333
9月前
997
3
评论

Qwen3-Embedding：原理解读和检索场景测试

Flutter环境搭建与多端部署

前言在移动互联网时代，只做PC端应用，应用场景还是太局限。如果要对移动端进行应用开发，最直接的办法就是用原生方式开发，Android 系统用 Android Studio，iOS 系统用 Xcod

我有一计333
9月前
220
1
评论

Flutter环境搭建与多端部署

【大模型微调】1.LLaMA-Factory简介和基本使用流程

引言本文开始，进入到大模型微调领域。之前一直在做 RAG 的相关内容，RAG 能够直接通过预先解析好的知识库，增强模型回答的输出质量。然而，当知识库较大时，RAG 会显著增加检索搜索的时间，导致

我有一计333
9月前
525
1
评论

FreePDFv5.1.0:调整输出结果/优化问答表现

概述 FreePDF 发布 v5.1.0 版本。更新内容如下：增加保存双语对照文件可选项调整引擎配置布局问答界面支持 markdown 格式渲染项目开源地址：https://github.c

我有一计333
9月前
234
1
评论

我的"实习生"又添新成员：Kiro产品体验

前言前天，亚马逊也下场进入 Ai 编程赛道，开放 Kiro 产品公测。官网地址：https://kiro.dev Kiro的产品定位，图源官网 Kiro 是对标 Cursor** 的 IDE 类型

我有一计333
9月前
531
1
评论

我的"实习生"又添新成员：Kiro产品体验

个人成就

文章被点赞 31

文章被阅读 11,993

加入于

2025-07-17