首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
visnix
掘友等级
获得徽章 15
动态
文章
专栏
沸点
收藏集
关注
作品
赞
405
文章 403
沸点 2
赞
405
返回
|
搜索文章
赞
文章( 403 )
沸点( 2 )
你用的 Claude 可能是虚假 Claude ,论文数据告诉你,Shadow API 中的欺骗性模型声明
最近刚好看到了一篇名为 《Real Money, Fake Models: Deceptive Model Claims in Shadow APIs》 的论文,翻译过来就是《真金白银,假货模型:Sh
移动端开发稳了?AI 目前还无法取代客户端开发,小红书的论文告诉你数据
近期,由小红书联合多伦多大学等高校的研究人员发布了 《SWE-Bench Mobile》(2602.09540) 论文,内容主要是评估 LLM 智能体在处理真实生产级移动端应用开发任务时的能力,并提出
2026 Flutter VS React Native ,同时在 AI 时代 VS Native 开发,你没见过的版本
本来已经 2026 ,感觉这种 Flutter VS React Native 的场景其实没什么太大对比意义,因为两个框架现在都比较成熟,也都大规模在各种消费级应用里被使用,但是这时候 Shorebi
2025 年的寒冬,我这个大龄程序员失业了
2025 年的年底,对我来说,并不体面。 裁员的通知来得并不突然。大环境不好,这句话我们已经听了三四年。从 2022 到 2025,互联网不再增长,故事不再性感,资本不再慷慨。只是当那封邮件真正落在自
AI大模型原理剖析和实战(第一部分:入门导学与DeepSeek初体验)
本部分作为课程的起点,旨在为你建立宏观的AI大模型认知,完成必要的开发环境搭建(Anaconda + PyCharm + 远程服务器),并带领你通过实战快速上手国产之光 DeepSeek 模型
AI大模型原理剖析和实战(第四部分:后训练与微调)
后训练(Post-training)则是为了让模型变得“懂规矩、有逻辑、讨人喜欢”(像接受职业培训)。这一部分是目前企业应用最广泛的技术领域,涵盖了从 SFT 到 LoRA 再到 RLHF 的全流程。
AI大模型原理剖析和实战(第三部分:大模型预训练流程)
如果说前两部分是“造砖”和“画图纸”,那么这一部分就是真正的“盖摩天大楼”。预训练(Pre-training)是大模型消耗算力最大、耗时最长、技术壁垒最高的阶段。
AI大模型原理剖析和实战(第二部分:大模型核心原理与Transformer架构)
NLP 的基石(词向量)出发,深入剖析 Transformer 架构的细节——Tokenizer 分词原理到 BPE 算法实现,手写 Self-Attention、MQA/GQA 以及旋转位置编码
Prisma 7 重磅发布:告别 Rust,拥抱 TypeScript,性能提升 3 倍
最近在使用 NestJs 和 NextJs 在做一个协同文档 DocFlow,如果感兴趣,欢迎 star,有任何疑问,欢迎加我微信进行咨询 yunmz777 2025 年 11 月 19 日,Pris
Claude 封杀中国后,我终于找到了平替!
就在这两天,AI 大模型界像约好了一样,扎堆发布新模型。9 月 29 日 DeepSeek-V3.2-Exp 发布,9 月 30 日 Claude 4.5 紧随其后发布……
下一页
个人成就
文章被点赞
11
文章被阅读
3,248
掘力值
114
关注了
38
关注者
5
收藏集
0
关注标签
43
加入于
2018-09-04