稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
刍狗的个人资料头像

刍狗

掘友等级
掘友3级:新星掘友
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 2 沸点 0
赞
2
返回
|
搜索文章
赞
文章( 2 ) 沸点( 0 )
  • 从零实现工业级Transformer:分布式训练+混合精度+内存优化的终极方案​
    1.Transformer 的整体结构 2.编码器结构:Self-Attention层 + 前馈神经网络层 3.解码器结构:带掩码的 Self-Attention层 + Self-Attention
    • 聚客AI
    • 8月前
    • 764
    • 2
    • 评论
    人工智能 LLM 掘金·日新计划
    从零实现工业级Transformer:分布式训练+混合精度+内存优化的终极方案​
  • Java 208 道面试题:第一模块答案
    目前市面上的面试题存在两大问题:第一,题目太旧好久没有更新了,还都停留在 2010 年之前的状态;第二,近几年 JDK 更新和发布都很快,Java 的用法也变了不少,加上 Java 技术栈也加入了很多新的框架,比如 Spring Boot、Spring Cloud 等,但类似的…
    • Java中文社群
    • 6年前
    • 9.9k
    • 151
    • 14
    面试 Java
    Java 208 道面试题:第一模块答案
  • 关注了
    6
    关注者
    0
    收藏集
    5
    关注标签
    9
    加入于
    2019-03-10