引言
分享一个关于大模型的优质吐糟视频,以下文案摘录自视频号《特大号》
如何打造一个拖垮公司的大模型?
不多不少,总共分十步
- 先砸10亿买卡:
-
挑最强最贵的买
-
做大模型,穷才是原罪
- 顶流公司挖大牛当首席科学家:
-
如close ai,1000万年薪
-
最好是整个团队,成建制,好管理,重点是出活儿快
- 定战略,当卷王:
-
模型参数万亿级别,比别人大三圈,当不成卷王就会被卷死
-
再来个智算中心,算力至少1000pflops
-
自己训完大模型,还开放出来给同行
- 万事开头难,全员加班搞数据:
-
数据不够怎么办?公开,自有,买(数据可用不可见)
-
全体动员做标注
-
老板亲自下场,主打一个陪伴
- 玩命训练,不出意外的话出意外了:
-
服务器挂了,存储速度跟不上
-
跨卡性能不行,梯度消失/爆炸…
-
什么?checkpoint没保存?
-
反复回退,调参,排雷。。。
- 内部开始自我修正
-
问题一多,团队就乱,人都变得很浮躁(推诿撕逼扯皮纠缠)
-
而公司主营业务停滞不前,业绩下滑
- 不管产品行不行,市场宣传要先行
- 广告全媒体覆盖,让业界感知到来势汹汹的霸气
- 生态伙伴少不了,氛围搞起来
-
先结盟5000家合作伙伴,达成合作意向
-
第二天联合发新闻稿,让吃瓜群众充满期待
- 大模型终于练出来了
-
可看上去怎么怪怪的,不会是个大傻子吧?
-
不是对标 gpt4吗?
-
落地实施难:不知道给谁用,不知道往哪儿用
- 及时止损,人间清醒
- 团队解散,开始复盘
多么痛的领悟
大牛来了又走了
gpu买了又卖了
智算中心建了又拆了
大模型炼了又废了
早知如何,何必当初?量力而行,切莫跟风瞎搞。。。