遇到不会写代码和配置环境的卡点
之前通过裁判文书总结小助手,熟悉了一下工作流,本来因为同行的需求,想做一个类似权威案例推荐的工作流,需要包括最高法指导性案例、最高法案例库入库案例、法答网精选问答等权威案例,然后卡在了爬虫这一步。
用Cursor工作流中的代码插件,并且用Cursor帮我编写了代码(当然,仍然需要根据我需要爬的网站的参数class去调整一些内容),最后总是运行ok但是最终输出为null,似乎代码插件的情况很难让Cursor理解,一会儿是没环境,一会儿是不能request,一会儿是按照Coze自己推荐的写法却取不进数来。暂时先搁置中。就在这时看到了Github的神级项目:browser use webUI,可以模拟真人用户和网页进行互动并获取数据,晚点想研究一下。
对了,也因此产生了想建个文科生自学AI的交流群,方便大家沟通和讨论一些自学AI中文科生特有的问题。也欢迎任何感兴趣的同学,包括可能只是想了解文科生使用AI的生态的人加入~备注稀土掘金即可。
尝试Coze应用
看到Coze推出了应用,想要尝试一下看到底是怎么把用户的数据收集处理,然后反馈到UI界面上的,刚好最近快过年了,每年都愁怎么拜年,就想到刚好用AI帮我写特别一点的祝福,先只做了输出文字祝福的,后来总觉得单调,为什么不用图呢,于是最终搞了个新年定制祝福生成器:扣子
第一步:UI制作
UI制作其实还蛮简单的,直接把左边的组件拖到右边的页面上就可以,组合组件拖过来后,也可以只删除其中你不需要的部分。文字、颜色、宽高、位置都可以调整,大家可以自由探索,值得注意的目前可能是两点:
-
图片的填充方式是包含、填充还是拉伸;
-
按钮的加载态是否要设置,如果想要点完按钮后显示出加载中的状态,加载态要设置成对应的工作流的loading状态。
这个loading状态的选择,是鼠标放到加载态的框上,会出现一个扩展符号,点开并在列表中选择就可以了:
第二步:工作流制作
举三个页面中相对最复杂(其实也没有啦哈哈)的页面为例,业务逻辑是用户输入文字和图片数据后,文字处理强的大模型分析文字并生成祝福语,同时视觉理解强的大模型根据原图生成prompt并给到图像生成工具、参考原图以保证人物一致的情况下出图,之后图片和祝福语整合并输出,因此工作流如下:
下面这条线,我把用户上传的图片作为输入给到豆包的视觉理解大模型,并对原图中的人物生成特征性的描述,这样出来的动画人物还是比较贴近原图中人像的特征的。
关于怎么组合图像和文字,插件“画板”真的很好用。首先设置画板的元素,可以带入之前工作流中输入过来的参数,然后在画板编辑里就可以看到这些元素并进行调整了,比如:
点开画板编辑,可以看到所有元素都已经贴进来了,剩下的工作就是按你的喜好调整各种设置:
最后一步:数据绑定
入参配置
怎么去调用工作流,然后把工作流处理的数据反馈到UI界面上呢?回到页面上,可以看到我们其实只需要用户输入信息,点击按钮,然后就生成图片。所以触发动作只在按钮上,选中按钮后,右边的事件里就可以选择“新建”,其中有“调用工作流”,选中后,会出现工作流第一步中你设置的输入参数,鼠标放在框上会出现扩展按钮,点击后出现左边的悬浮框,在悬浮框中选中对应组件中的数据,比如我设置的“name”参数,对应的是用户在第一个框里输入的内容,而点击第一个框后,右上角(可以看下图button4位置处)显示这个框叫做Input3,那么就在name框中绑定{{Input3.value}},需要注意的是图片类型的value是一组数据,而我们只需要调用其中第一个数据,因此在选了value后,还得在后面加上[0](学过python基础的都知道,这是只调用该组数中第一个数据的意思)。入参配置就这样设置好啦。
编辑
输出绑定
因为我的输出直接在图片框里,点击图片框,选择“属性”,第一排“常用设置”里就有“来源”,选择“绑定数据”,同样道理打开悬浮框,然后选择你调用的工作流的output就可以了。
然后就可以点击预览,在网页上测试啦,没问题的话就可以点击发布啦~~~