人工智能 - wlioe的收藏集 - 掘金

人工智能

更多收藏集

3篇文章 · 0订阅

仅用61行代码，你也能从零训练大模型

本文并非基于微调训练模型，而是从头开始训练出一个全新的大语言模型的硬核教程。看完本篇，你将了解训练出一个大模型的环境准备、数据准备，生成分词，模型训练、测试模型等环节分别需要做什么。

腾讯云开发者
2年前
6.4k
9
评论

仅用61行代码，你也能从零训练大模型

如何将keras训练的模型转换成tensorflow lite模型

keras是一个比较适合初学者上手的高级神经网络API，它能够以TensorFlow, CNTK, 或者 Theano作为后端运行。而keras训练完的模型是.h5文件，如果想要在移动端运行模型需要tflite模型文件 keras转tensorflow完成后，接下来我们就要将.…

colawarrior
7年前
2.9k
点赞
评论

如何基于 MindSpore 实现万亿级参数模型算法？

摘要：近来，增大模型规模成为了提升模型性能的主要手段。特别是NLP领域的自监督预训练语言模型，规模越来越大，从GPT3的1750亿参数，到Switch Transformer的16000亿参数，又是一

华为云开发者联盟
4年前
1.1k
1
评论