Day04:给原型加上AI能力

0 阅读3分钟

在上一章Day03:动手做出原型 中,我们做出了产品的基础页面,这一章我们把相关的功能都接入大模型!

API是什么?

API 就是程序之间约定好的标准化沟通方式,它规定了数据怎么传、用什么格式,像统一话术一样让系统能准确理解。只对外提供调用结果,不暴露内部实现逻辑,还能让网页、App 等不同程序通用调用,不用重复开发,高效又安全。

对于我们的项目而言,我们需要:根据文字生成文字的模型的模型,根据图片生成文字的模型,生成图片的模型。共3个API。

API的接入方式:

  • 在API官网找到说明文档
  • 生成API key(有了这个才可调用API,防止被滥用)
  • 在文档中,找到调用API的示例
  • 把示例发给AI,让AI帮我们实现!

生成文字:豆包API

我们这里调用的是 Doubao‑Seed‑2.0‑pro 多模态模型,它支持文本 + 图像输入,但输出仅为文本。可完成2个功能。

  1. 文案生成功能,可以基于商品信息点击后生成对应抖音电商文案,多种风格。
  2. 帮我们实现将上传的图片,自动生成电商卖点文本、关键词的功能

进入火山引擎-你的AI云,找到AI体验中心

image.png

在右上角点击API接入

image.png

创建API key

image.png

这里是curl命令,在linux终端执行该命令,测试模型调用效果。

image.png

测试结果如下图

image.png

确定测试成功后,点击完整调用指南,查看完整的调用流程。(这里其实不需要)

image.png

之后把刚才的调用示例发给AI,例:

参考这个API调用方法,帮我完成功能。(注意确保API key信息不要在git中提交) 
实际上我们这里调用的是 多模态模型,它支持文本 + 图像输入,但输出仅为文本。

功能1:文案生成功能,可以基于商品信息点击后生成对应抖音电商文案,多种风格。
功能2:帮我们实现将上传的图片,自动生成电商卖点文本、关键词的功能

以下参考资料:

curl https://ark.cn-beijing.volces.com/api/v3/responses \
-H "Authorization: Bearer 这里是你的API key" \
-H 'Content-Type: application/json' \
-d '{
    "model": "doubao-seed-2-0-pro-260215",
    "input": [
        {
            "role": "user",
            "content": [
                {
                    "type": "input_image",
                    "image_url": "https://ark-project.tos-cn-beijing.volces.com/doc_image/ark_demo_img_1.png"
                },
                {
                    "type": "input_text",
                    "text": "你看见了什么?"
                }
            ]
        }
    ]
}'

生成图片:Seeddream

类似地,找到图片生成模型,之后测试,接入

image.png

image.png

生成的图片如下: image.png

提示词例子:

请你基于下面 API,帮我实现这个工程中,电商业务的常见功能(例如海报生成、抖音电商首图生成等等)

<此处粘贴 API KEY以及图像编辑代码>

结果

之后经过不断提问和微调,得到了预想的功能

文案生成:

image.png

图片卖点生成:

image.png

海报生成:

image.png

参考

项目在github.com/tao355667/V…

datawhalechina/easy-vibe: Vibe coding from 0 to 1 |把想法做成真正能上线的产品|首个交互式教程|零基础也能学会的 AI 编程实战

部分文字用豆包润色