哈喽,大家好!
我是阿星👋🏻
最近nano-banana真的太火了,
今天阿星给大家介绍两种可以自己轻松使用nano的办法。
1、自己搭建chatbot接入api使用
2、通过cherrystudio使用
一、第二种方法:自己写一个chatbot接api
为了让自己随时能上传附件
我就让克劳德给我写了一套编程提示词。我只展现一下思路给大家。
api用的是deer api
完整提示词我放在星球
香蕉AI助手
1. 项目目标提示词
创建一个名为"阿星AI助手"的多功能聊天工具,支持:
- 文本聊天(基于Gemini 2.5 Flash模型)
- 文生图功能(文本生成图片)
- 图生图功能(基于图片生成新图片)
- 图片分析功能(让AI描述和分析上传的图片)
要求使用现代Web技术,支持拖拽上传,响应式设计,本地存储设置和
对话历史。
2. API设计提示词
API端点设计:
- 聊天API: POST https://api.deerapi.com/v1/chat/completions
- 文生图API: POST
https://api.deerapi.com/v1/images/generations
- 图生图API: POST https://api.deerapi.com/v1/images/edits
API请求格式要求:
- 聊天请求支持多模态输入(文本+图片)
- 图片数据使用base64格式,包含data:image/type;base64,前缀
- 支持Gemini 2.5 Flash Image Preview模型
- 需要正确的Authorization头:Bearer {API_KEY}
3. 正确的多模态提示词结构
用户消息内容结构:
{
"model": "gemini-2.5-flash-image-preview",
"messages": [{
"role": "user",
"content": [
{
"type": "text",
"text": "请描述这张图片"
},
{
"type": "image_url",
"image_url": {
"url":
"data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD..."
}
}
]
}]
}
4. 模式区分提示词
明确区分三种操作模式:
1. 聊天模式(默认):文本对话和图片分析
2. 文生图模式:仅基于文本提示生成图片
3. 图生图模式:基于上传的图片生成新变体
关键逻辑:上传图片时根据当前模式决定行为:
- 聊天模式 + 图片 → 图片分析
- 图生图模式 + 图片 → 生成新图片
- 避免自动模式切换混淆用户意图
5. 错误避免提示词
避免以下设计错误:
- 不要将所有上传图片的情况都当作图生图处理
- 确保图片分析功能走正确的聊天API路径
- 正确处理base64数据格式(包含data:前缀)
- 明确区分生成新图片和分析现有图片的意图
它还给我做了黑色夜间版🥺
图生图模式:👇🏻
把我转绘成3D风格
图生图模式:👇🏻
给我画一个库洛米的头饰
图生图模式:👇🏻
将这个角色转换为一个角色模型。在它后面放置一个印有该角色图像的盒子,并且让一台电脑屏幕上显示Blender建模过程。在盒子前面添加一个圆形塑料底座,让角色模型站在上面。
图生图模式:👇🏻
帮我把生米煮成熟饭。做成1000块钱一斤的大米广告,要高端,我准备找马斯克代言,你可以把他也p上
文生图模式:👇🏻
帮我生成一个华丽的有平静疯感的3d库洛米四格漫画。
二、cherrystudio + nano-banana
先说效果其实不是很理想,但是可以试试熟悉一下cherrystudio的接入方法
1. 注册DeerAPI账户
2. 创建DeerAPI密钥
3. 下载并安装Cherry Studio
4. 在Cherry Studio配置好模型服务
🔴 模型提供商名称随便填,但是格式一定要选OpenAI👇
🔴 api地址一定要按照我给的填👇
🔴 名称严格按照下面名称复制进去保存即可👇
gemini-2.5-flash-image-preview
gemini-2.5-flash-image
5、开始使用
但是cherrystudio
有个问题就是想上传附件比较麻烦
所以我建议大家自己开发自己用或者去lovart用……
AI编程还有很多有趣的地方
完整提示词我放星球了可以加入我们一起学习
我是阿星,我们下期再见!