如何打造一个拖垮公司的大模型?

243 阅读2分钟

引言

分享一个关于大模型的优质吐糟视频,以下文案摘录自视频号《特大号》

如何打造一个拖垮公司的大模型?

不多不少,总共分十步

  1. 先砸10亿买卡
  • 挑最强最贵的买

  • 做大模型,穷才是原罪

  1. 顶流公司挖大牛当首席科学家:
  • 如close ai,1000万年薪

  • 最好是整个团队,成建制,好管理,重点是出活儿快

  1. 定战略,当卷王
  • 模型参数万亿级别,比别人大三圈,当不成卷王就会被卷死

  • 再来个智算中心,算力至少1000pflops

  • 自己训完大模型,还开放出来给同行

  1. 万事开头难,全员加班搞数据
  • 数据不够怎么办?公开,自有,买(数据可用不可见)

  • 全体动员做标注

  • 老板亲自下场,主打一个陪伴

  1. 玩命训练,不出意外的话出意外了:
  • 服务器挂了,存储速度跟不上

  • 跨卡性能不行,梯度消失/爆炸…

  • 什么?checkpoint没保存?

  • 反复回退,调参,排雷。。。

  1. 内部开始自我修正
  • 问题一多,团队就乱,人都变得很浮躁(推诿撕逼扯皮纠缠)

  • 而公司主营业务停滞不前,业绩下滑

  1. 不管产品行不行,市场宣传要先行
  • 广告全媒体覆盖,让业界感知到来势汹汹的霸气
  1. 生态伙伴少不了,氛围搞起来
  • 先结盟5000家合作伙伴,达成合作意向

  • 第二天联合发新闻稿,让吃瓜群众充满期待

  1. 大模型终于练出来了
  • 可看上去怎么怪怪的,不会是个大傻子吧?

  • 不是对标 gpt4吗?

  • 落地实施难:不知道给谁用,不知道往哪儿用

  1. 及时止损,人间清醒
  • 团队解散,开始复盘

多么痛的领悟

大牛来了又走了
gpu买了又卖了
智算中心建了又拆了
大模型炼了又废了

早知如何,何必当初?量力而行,切莫跟风瞎搞。。。