人工智能 - 鬓_微霜的收藏集 - 掘金

人工智能

更多收藏集

15篇文章 · 0订阅

Qwen2大模型微调入门实战（完整代码）

Qwen2是通义千问团队的开源大语言模型，由阿里云通义实验室研发。以Qwen2作为基座大模型，通过指令微调的方式实现高准确率的文本分类，是学习大语言模型微调的入门任务。指令微调是一种通过在由（指令，

林泽毅
1年前
4.1k
27
2

Qwen2大模型微调入门实战（完整代码）

《深入浅出OCR》前言知识：机器学习基础（一）

✨全新系列《深入浅出OCR》专栏，对标最全OCR教程，每章将分别从OCR技术发展、方向、概念、算法、论文、数据集等角度展开详细介绍，本篇为第一篇前言知识，主要介绍机器学习基础，后续继续更新其他文章。

GoAI
2年前
2.8k
10
1

《深入浅出OCR》前言知识：机器学习基础（一）

Transformer 模型的 PyTorch 实现

Google 2017年的论文 Attention is all you need 阐释了什么叫做大道至简！该论文提出了Transformer模型，完全基于Attention mechanism，抛弃了传统的RNN和CNN。我们根据论文的结构图，一步一步使用 PyTorch …

luozhouyang
7年前
40k
50
13

深入理解Transformer技术原理｜得物技术

谷歌在2017年发布Transformer架构的论文时，论文的标题是：Attention Is All You Need。重点说明了这个架构是基于注意力机制的。

得物技术
2年前
7.6k
62
2

深入理解Transformer技术原理｜得物技术

向量检索核心算法——相似性度量

在我们的日常生活中，搜索和匹配是非常常见的事情。比如，你在网上购物时想找到与某件衣服相似的款式；在听音乐时想找到风格相近的歌曲；或者在阅读一篇文章后，想找到内容相关的其他文章或新闻。这些都离不开一个重

兰陵小生
1年前
880
12
2

前端高薪岗位之大模型端上部署及训练

端上大模型的可行性和前景已经得到了业内的普遍认可，目前大量工程已在PC端、手机端实现大模型的离线部署，更有部分App登陆应用商店，只需下载即可畅通无阻地对话。

天文聊AI实战
2年前
2.4k
6
3

前端高薪岗位之大模型端上部署及训练

骁龙888实时运行，美团、浙大等打造全流程移动端多模态大模型MobileVLM

大模型涌向移动端的浪潮愈演愈烈，终于有人把多模态大模型也搬到了移动端上。近日，美团、浙大等推出了能够在移动端部署的多模态大模型，包含了 LLM 基座训练、SFT、VLM 全流程。

机器之心
2年前
2.3k
1
2

《深入浅出LLM基础篇》（一）：大模型概念与发展

本作者推出全新系列《深入浅出LLM》专栏，分为基础篇、进阶篇、实战篇等，本文为基础篇具体章节如导图所示，分别从大模型模型概念、经典模型、创新点、微调、分布式训练、数据集、RAG、Agent及项目实站！

GoAI
2年前
8.7k
66
9

《深入浅出LLM基础篇》（一）：大模型概念与发展

Python程序打包指南：手把手教你一步步完成

这篇指南将带你深入了解如何将Python程序进行打包。从简单易懂的步骤出发，将手把手地教你完成整个打包过程。无论你是初学者还是有一定经验的开发者，都能从本文中获取实用的知识

uncle_ll
2年前
4.3k
6
评论

一文带你入门LangChain

在人工智能领域的不断发展中，语言模型扮演着重要的角色。特别是大型语言模型（LLM），如ChatGPT，已经成为科技领域的热门话题，并受到广泛认可。

MoonWebTeam
2年前
4.2k
43
评论

一文带你入门LangChain