大模型 - 用户625123483773的收藏集 - 掘金

大模型

用户625123483773

更多收藏集

5篇文章 · 0订阅

Unsloth：学生党福音！开源神器让大模型训练提速10倍：单GPU跑Llama3，5小时变30分钟

Unsloth 是一款开源的大语言模型微调工具，支持 Llama-3、Mistral、Phi-4 等主流 LLM，通过优化计算步骤和手写 GPU 内核，显著提升训练速度并减少内存使用。

蚝油菜花
1年前
550
1
评论

Unsloth：学生党福音！开源神器让大模型训练提速10倍：单GPU跑Llama3，5小时变30分钟

使用 PySpark 进行数据清洗与 JSON 格式转换的实践详解（保姆级编码教程）

在大数据处理中，PySpark 提供了强大的工具来处理海量数据，特别是在数据清洗和转换方面。本文将介绍如何使用 PySpark 进行数据清洗，并将数据格式转换为 JSON 格式的实践。简介 PySp

冷月半明
2年前
1.7k
7
评论

一文讲清楚人工智能自然语言处理中的数据预处理(数据清洗)

一、定义在自然语言处理（NLP）中，数据预处理，又可称数据清洗，是指将原始文本数据转换成适合机器学习模型处理的格式的过程。二、实例讲解上面的定义阐述有些僵硬吧，笔者思考了好久，给出下面这个极其生

念旧_
1年前
1.4k
6
评论

一文讲清楚人工智能自然语言处理中的数据预处理(数据清洗)

汇编语言入门教程-阮一峰

计算机真正能够理解的是低级语言，它专门用来控制硬件。汇编语言就是低级语言，直接描述/控制 CPU 的运行。如果你想了解 CPU 到底干了些什么，以及代码的运行步骤，就一定要学习汇编语言。

Rain_or_Shine
8年前
3.7k
60
4

向量数据库

随着各种大型语言模型 (LLM)的开源，开发人员也意识到向量数据库越来越重要，因为它可以进一步增强这些模型。像 GPT 这种LLM大模型，通常使用大规模的嵌入向量来表示文本数据

奇舞精选
1年前
6.1k
11
评论