稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
数据处理
订阅
avatar
路过跑堂 创作等级LV.3
更多收藏集

微信扫码分享

微信
新浪微博
QQ

3篇文章 · 0订阅
  • Datawhale×魔搭 AI夏令营 【2024年第四期】:AIGC学习笔记
    本文简单记录小白学习过程。从文生图实现方案逐渐进阶,偏重图像工作流、微调、图像优化等思路,从零入门AI生图原理&实践。
    • 一点睡
    • 1年前
    • 712
    • 2
    • 1
    AIGC
    Datawhale×魔搭 AI夏令营 【2024年第四期】:AIGC学习笔记
  • Cosmopedia: 如何为预训练构建大规模合成数据集
    本文概述了我们在生成含数十亿词元的合成数据集以复现 Phi-1.5 过程中所遇到的挑战及其解决方案,由此最终创建了 Cosmopedia 合成数据集。合成数据已成为机器学习社区的 C 位话题,其题中之
    • HuggingFace
    • 1年前
    • 467
    • 2
    • 评论
    人工智能
    Cosmopedia: 如何为预训练构建大规模合成数据集
  • 【从零训练Steel-LLM】预训练数据收集与处理
    Steel LLM项目旨在从0开始预训练一个1B左右的LLM,使用T级别的数据。我将会分享训练过程中的所有细节,本文第一篇文章,主要讲解数据收集与处理。
    • 炼钢AI
    • 1年前
    • 830
    • 点赞
    • 评论
    算法
    【从零训练Steel-LLM】预训练数据收集与处理