首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
我有一计333
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
17
文章 17
沸点 0
赞
17
返回
|
搜索文章
我有一计333
2月前
关注
AI 日报-2025年07月30日
行业动态 科学专用大模型引领多模态新突破: 在WAIC 2025大会上,上海AI实验室发布并开源了“书生”科学多模态大模型Intern-S1。该模型凭借其在分子结构解析、...
0
评论
分享
我有一计333
2月前
关注
【算法笔记】6.LeetCode-Hot100-链表专项
本文开始,不再记录原题,只记录解题思路和 AC 代码,加快进度。 1. 相交链表(t160) 思路分析:一上来没看懂这题要做什么,看了题解才知道这题是要找到两个链表相交的首...
2
评论
分享
我有一计333
2月前
关注
AI 日报-2025年07月29日
2025年07月29日 AI 日报 温馨提示:以下内容由AI自动从网络获取总结生成,准确性需自行甄别 具身智能:从“觉醒”到安全,双重突破与潜在风险 商汤“悟能”具身智能平...
0
评论
分享
我有一计333
2月前
关注
【算法笔记】5.LeetCode-Hot100-矩阵专项
1. 矩阵置零(t73) 中等难度,题目示例如下: 思路分析:看到这题,一个朴素的思想是,只要遇到 0 的元素就去查询同行同列,但这样操作搜索的复杂度过高。看题解可以采用一...
3
评论
分享
我有一计333
3月前
关注
【算法笔记】4.LeetCode-Hot100-数组专项
1. 和为 K 的子数组(t560) 中等难度,题目示例如下: 思路分析:这道题求和首先想到用双指针进行遍历枚举,左指针控制循环开始的位置,右指针在左指针的起始位开始向右累...
0
评论
分享
我有一计333
3月前
关注
【算法笔记】3.LeetCode-Hot100-字符串专项
1. 无重复字符的最长子串(t3) 中等难度,题目示例如下: 解题思路:第一个想法就用纯暴力的方式去做,挨个元素开始遍历,用unordered_set来去重,maxLen记...
0
评论
分享
我有一计333
3月前
关注
【算法笔记】2.LeetCode-Hot100-双指针专项 原
1. 移动零(t283) 简单难度,题目示例如下: 暴力解法:从头开始遍历,如果遇到非零元素,将其交换到末尾。 时间复杂度: O(); 空间复杂度:O(1) 更好的解法:使...
0
评论
分享
我有一计333
3月前
关注
【算法笔记】1.LeetCode-Hot100-哈希专项
在刷题过程中,发现各种题解千奇百怪,不同的人有不同的代码风格。因此,有必要以一种统一的风格来记录题解,同时记录在刷题过程中的思考。 1.两数之和(t1) 简单难度,题解如下...
0
评论
分享
我有一计333
3月前
关注
【不背八股】1.if __name__ == "__main__" 有什么作用?
起名动机 最近开始准备秋招,技术圈惯例会把常见的面试问答题戏称为“八股文”,网上流传不少这样的材料,写得晦涩难懂,以至于让好多求职者去背诵。 在我看来,用文科思维学工科毫无...
0
评论
分享
我有一计333
3月前
关注
【大模型微调】7.日志监控配置与模型量化分享
引言 本文继续研究 LLaMA-Factory,内容侧重于日志监控和模型量化分享。 更好的训练日志监控 LLaMA-Factory 的 Webui** 仅生成训练损失的曲线...
0
评论
分享
我有一计333
3月前
关注
【大模型微调】6.模型微调实测与格式转换导出
引言 本文继续研究 LLaMA-Factory 微调数据的流程,侧重于微调结果与模型导出。 数据集准备 首先参考 LLaMA-Factory 核心开发者的文章[1],下载用...
0
评论
分享
我有一计333
3月前
关注
【大模型微调】5.调参经验总结与显存占用因素探究
引言 本文承接本系列第二篇文章,继续探究各参数应该如何进行设置,以及其对模型显存的影响。 调参参考经验总结 训练模型的过程通常被戏称为“炼丹”。参数组合和结果息息相关,但没...
0
评论
分享
我有一计333
3月前
关注
【大模型微调】4.模型评估标准及操作流程
引言 要找到最优的模型训练策略,首先要明确模型的评估体系。 进一步可分解为三个子问题: 评估标准是什么? 如何进行模型评估? 如何利用公开数据集进行评估? 本文将从这三个问...
1
评论
分享
我有一计333
3月前
关注
【大模型微调】3.通过Easy Dataset构建自己的微调
启动 LLaMA-Factory: 这样就可以选择到构建的数据集。 这个路径并不是必须放到 data 目录下,也可以放到其它位置,文件名称对应上即可。 选择完数据集后,就可...
1
评论
分享
我有一计333
3月前
关注
【大模型微调】2.微调方法详解与模型显存占用实测
引言 前文在 Windows 环境下打通模型 SFT 微调流程后,本文进一步在 Linux 服务器上进行实验。 LLaMA-Factory 给了一则不同模型精度和训练方法所...
2
评论
分享
我有一计333
3月前
关注
使用非专业计算显卡,能跑DeepSeek满血版吗?
理论计算 使用非专业计算显卡,能跑DeepSeek**满血版吗? 通常概念下,DeepSeek满血版指DeepSeek-R1-671B(最高档参数量)的模型。 根据前文总结...
1
评论
分享
我有一计333
3月前
关注
FreePDFv5.1.0:调整输出结果/优化问答表现
概述 FreePDF 发布 v5.1.0 版本。 更新内容如下: 增加保存双语对照文件可选项 调整引擎配置布局 问答界面支持 markdown 格式渲染 项目开源地址:ht...
1
评论
分享
我有一计333
3月前
关注
【大模型微调】1.LLaMA-Factory简介和基本使用流程
引言 本文开始,进入到大模型微调领域。 之前一直在做 RAG 的相关内容,RAG 能够直接通过预先解析好的知识库,增强模型回答的输出质量。 然而,当知识库较大时,RAG 会...
1
评论
分享
我有一计333
3月前
关注
Flutter环境搭建与多端部署
前言 在移动互联网时代,只做PC端应用,应用场景还是太局限。 如果要对移动端进行应用开发,最直接的办法就是用原生方式开发,Android 系统用 Android Studi...
1
评论
分享
我有一计333
3月前
关注
Qwen3-Embedding:原理解读和检索场景测试
概述 2025.6.6,通义千问团队发布了 Qwen3-Embedding 和 Qwen3-Reranker 系列。 两组模型一块训练发布,本文侧重于前者进行分析和测试。 ...
3
评论
分享
下一页
个人成就
文章被点赞
30
文章被阅读
5,459
掘力值
478
关注了
0
关注者
5
收藏集
0
关注标签
8
加入于
2025-07-17