liangsh01 的个人主页 - 动态

算法专家

·

1年前

用大模型生成带文字的海报

本文代码讲整合在： GitHub - liangwq/Chatglm_lora_multi-gpu: chatglm多gpu用deepspeed和这篇文章介绍如何利用VL...

1

算法专家

·

1年前

AI和人的协同作业模式
sqlboy的价值不在于sql工具
现在工具都做不到完全自动化
领域建模能力还缺
只能说是逐步取代只会用工具的人
工具智能了以前是人找工具现在工具找人适配人
你的认知价值目前ai是取代不了的
是的前面几轮技术低代码自动可视化取数…
都是想解决一个问题只是aigc往前把这些想法推进了一大步

展开

大模型生态圈

等人赞过

2

4

算法专家

·

1年前

大模型公司为什么要自己搞芯片？ | 这些应用要被用起来
收益要大于显卡资源投入才行
所以openai会想自己搞芯片是有道理的
哪怕你做的再牛用户使用成本太高
改造链路成本+api费用比或者说自己搭建环境费用
远远大于现有工作链路运行成本
使用概率就会下来
对于大模型公司能做到就是
1.提高模型能力，拉升能力下界，超过行业7分位
2.降低推理成本，让芯片高效低价
3.让模型推理成本低并发、推理可复用
如果按这个逻辑看未来大模型生态就是云计算的生态
大模型公司背后技术就是云公司业务层面可能会出现差异这是业务建模的事
他们的商业推理逻辑估计就是要批量应用成本必须要低
训练成本和推理成本都要低特别是推理成本要低
所以搞芯圆厂逻辑上看也是可以理解的
所以你看网络上up宣传的工作流
一大把但是估计也就他们自己能受益
大部分人看了也就是看了无法很好和工作结合
反倒是科研学生群体把那些经典工作流用起来的比较能够真正受益

展开

大模型生态圈

赞过

2

算法专家

·

1年前

AIGC之视频生成--连贯动作序列生成

背景 2023年应该是AIGC走向大众视野，让大众可知可感并且参与其中的一年。但是从基于AIGC的创业的创意和产品来看，显然创业者对AIGC的理解还是过于保守，对于AIGC...

1

算法专家

·

1年前

#AI Bot技术挑战赛# Ai尽头是储能的一些看法
目前ai就是计算机在计算，
所谓算力就是电子在芯片按一定规律运动
然而现在控制电子运动是一个耗散系统无法形成自闭环，
也就是必须不停通过耗电来维持电子一定规律计算
一个状态到另一个状态转换无法自转换必须消耗电力
那么算力就看你有多少电力
ai多智能就看你有多少能量储备

展开

大模型生态圈

等人赞过

2

7

算法专家

·

1年前

现代数学背后的易经思维和智慧
易数理，现代数学本质也是一种思维方式和表述语言，现代的科学语言大部分是围绕数学语言来表述的。所以在技术和产业界已经更熟悉了这套表述语言，但是背后陈述的思想是否有易经的思维和智慧呢，可以肯定是有的，只不过不是用我们熟悉的“易经”语言表述出来而已。
比如阴阳互生平衡协调在目前人工智能的大模型中就是很明显体现，对抗学习提升模型学习和迁移能力平衡在大模型的ood问题里面也是用的特别多。所以易经的思想不是没用而是用了我们却不认识。至于是否易经语言表述会逐步流行于agi个人感觉这个是有可能对齐，但也需要我们的努力。agi一定是体系化的君臣佐使五行调和平衡测度这些理论都是可以引进来的并且会很直接。但是现在缺少对易经理解很深刻的agi学者来做这层翻译和领导工作。

展开

大模型生态圈

算法专家

·

1年前

AIGC之图片生成——基于检索的图生成

项目代码：https://github.com/liangwq/Chatglm_lora_multi-gpu/tree/main/APP_example AIGC之图片生成...

1

算法专家

·

1年前

AIGC产业应用现状及前景
可以肯定AIGC这阶段
产业应用存在极大问题和阻力
没有一个kill APP
一线曙光但改革也是举步维艰
改痛苦不改怕失去机会
所以大家极力跟进
期待走通一条范例

展开

AI聊天室

赞过

1

3

算法专家

·

1年前

AIGC之图片生成——基于clip内容检索

项目代码：https://github.com/liangwq/Chatglm_lora_multi-gpu/tree/main/APP_example 背景：古语云：“...

0

算法专家

·

1年前

基于扩散的生成模型架构理论综述

现有的生成建模技术在很大程度上可以根据它们如何表示概率分布分为两类。1.基于似然的模型，通过（近似）最大似然直接学习分布的概率密度（或质量）函数。典型的基于似然的模型包括自...

0

算法专家

·

1年前

#新人报道# 关于保持更新版本模型前后一致的思考
保持更新版本模型保持前后一致性
图模型前后理解一致性
其实不一致的原因大体看来有3个：
1.条件laten分布的差异
2.文本到图对齐模型差异
3.diffusion生成过程的差异
我们在训练时候既然希望能够保持前后迭代的稳定，并且保持后一版本比前一版本更优秀。
那么其实我们确实需要保证在上个版本中条件laten尽可能一致，至少我们宏观表示一致，我们希望优化的是描述细节、细粒度对齐，那么我们是不是可以通过换词换细节描述方式让模型学会细节表述（比如文本被压到的空间分布是尽可能一致）
对于整体如果不符合预期的图文，我们就在新版本中让模型纠正到正确表示
也就是我们后续模型的迭代应该是在做基准模型的sft、rlhf对齐，如果真需要做二次预训练应该也是只对表述不好的图片进行学习

展开