从零搭建 BettaFish:打造自己的多 Agent 舆情分析系统

0 阅读1分钟

最近在 GitHub 上发现了一个有意思的项目——BettaFish(微舆)。它不只是一个爬虫工具,而是一个从零开始实现的多智能体舆情分析系统。简单来说,过去需要人工花几天时间梳理的舆情信息,现在几分钟内就能自动完成。你只需要像聊天一样输入分析需求,系统会自动爬取微博、小红书、抖音等平台的相关内容,再由多个 AI Agent 分工协作,最终生成一份结构化的 HTML 分析报告。整个流程在本地环境运行,数据完全掌握在自己手里。

在深入部署细节之前,先来看一下它的核心工作机制。这个系统最核心的部分是四个 Agent:负责网页搜索的 Query Agent、处理图片视频的 Media Agent、挖掘本地数据库的 Insight Agent,以及负责汇总报告的 Report Agent。它们在 ForumEngine(论坛引擎)的协调下,像团队一样协作完成任务。

1、本地Windows安装Docker部署 BettaFish

部署 BettaFish 主要有两种方式:适合快速体验的 Docker 部署,和适合深度定制开发的源码部署。下面主要介绍 Docker 方式。

1.1 环境准备

步骤 1:下载 Docker Desktop

前往 Docker 官网下载 Windows 安装程序。点击 Download for Windows 下载安装程序

BettaFish推荐使用Docker方式在Windows本地部署,操作最简单、无需繁琐的Python环境配置。以下是保姆级步骤(基于Windows 10/11):

步骤 2:安装 Docker Desktop

双击下载的 Docker Desktop Installer.exe,点击 OK 开始安装,安装完成后,点击 Close and restart 重启计算机

步骤 3:启动并验证

重启后启动 Docker Desktop,等待引擎启动完成(右下角图标变绿)。然后用管理员身份打开 PowerShell,运行以下命令验证:

检查 Docker 版本
docker --version

检查 Docker Compose 版本
docker compose version

运行测试容器
docker run hello-world

步骤 4:安装 Git

git-scm.com/downloads 下载安装,完成后在 PowerShell 中输入 git --version 验证。

git --version 

1.2 部署BettaFish

步骤 1:下载项目

从 GitHub 下载 BettaFish 项目压缩包并解压到桌面。

步骤 2:进入项目目录(在 PowerShell 中执行)

# 先进入桌面上的文件夹(根据你的实际路径调整)
cd "C:\Users\LING\Desktop\BettaFish-main"
# 确认进入正确目录(应该能看到 docker-compose.yml 等文件)
dir

步骤 3:复制环境配置文件

copy .env.example .env

步骤 4:启动 Docker

在 PowerShell(当前目录为 BettaFish-main)中执行:

docker compose up -d

第一次启动会下载镜像,体积较大,需要耐心等待几分钟到十几分钟。如果下载速度慢,可以尝试配置国内镜像加速器。

步骤 5:验证是否成功

部署完成后,在浏览器打开 http://localhost:5000。如果看到 BettaFish 的配置页面或主界面,说明部署成功。

常见问题处理

  • **端口****冲突(5000 被占用):**打开 .env 文件,把 PORT=5000 改成 PORT=5001,然后执行 docker compose downdocker compose up -d,访问 http://localhost:5001

  • 查看运行日志:docker compose logs -f

  • 停止服务:docker compose down

2、接入蓝耘大模型

BettaFish的所有Agent均兼容OpenAI格式API,可轻松接入蓝耘(Lanyun)元生代MaaS平台的大模型,享受高性价比的GPU算力。

2.1 获取蓝耘 API 信息:

登录蓝耘 MaaS 平台,选择模型(如 step-3.5-flash),在控制台获取 API Key 和 Base URL。

2.2 配置到 BettaFish

推荐通过UI或.env文件配置(每个Agent可独立设置不同模型):

方式一:启动后UI配置

访问 http://localhost:5000 ,系统会引导进入配置向导。在LLM配置部分填写:

  • Base URL:maas-api.lanyun.net/v1

  • API Key:你的蓝耘Key

  • Model Name:/maas/jieyue/step-3.5-flash

  • 全部填写好上述信息

填写好Tavily和Anspire的APIkey联动搜索引擎、网站抓取等在线服务,两个都需配置

  • 填写完毕后,保存并重启系统

方式二:直接编辑.env文件

在 .env 中添加类似以下内容(不同Agent使用不同前缀):

# Insight Agent
INSIGHT_ENGINE_API_KEY=
INSIGHT_ENGINE_BASE_URL=
INSIGHT_ENGINE_MODEL_NAME=
.....

.env 中添加对应配置项,每个 Agent 可以独立设置不同的模型。保存后执行 docker compose restart 重启服务。

配置完成后,BettaFish会自动调用蓝耘大模型进行推理。蓝耘的高性价比模型让本地部署也能获得顶级性能,同时支持流式输出和长上下文分析。

3、使用方法

BettaFish的使用像聊天一样简单:

  1. 浏览器打开 http://localhost:5000 ,进入主界面。

  2. 在输入框用自然语言描述需求,例如:

    "分析最近小米SU7在小红书和抖音上的舆情,预测下周市场反响”

  3. 点击“开始分析”或“生成报告”。

  4. 系统自动执行流程:

    1. Insight Agent挖掘洞察。

    2. Media Agent处理短视频、图像等多模态内容。

    1. Query Agent补充搜索信息。

    1. ForumEngine让多个Agent“开会辩论”,Host Agent主持合成客观结论。

    1. Repo t Agent生成结构化报告(含情感分析、趋势预测、数据图表、原始来源等)。
  5. 查看与导出:支持网页浏览、Markdown导出、PDF下载。其他几个Agent下载相关报告一样

此外,可单独运行特定模块测试(如Streamlit单Agent demo或爬虫独立运行)。整个分析过程通常几分钟内完成,输出专业级报告。

4、高阶使用方法

BettaFish 支持深度自定义:

  1. 自定义 Agent:进入 agents/ 目录,基于现有模板创建新 Agent,调整辩论提示词

  2. 公私域数据融合:在 InsightEngine 中接入企业内部数据库(CRM、销售数据等)

  3. 高级爬虫与定时任务:自定义 MindSpider 配置,结合 Windows 任务计划程序实现自动监控

  4. 报告模板定制:修改 ReportEngine 的 Markdown/LaTeX 模板

  5. 多模型混合:不同 Agent 使用不同模型,平衡准确率与成本

  6. 仪表盘扩展:通过 Streamlit 或自定义前端构建实时热点趋势图

写在末尾

BettaFish(微舆)是一款真正“人人可用”的开源多Agent舆情分析神器。它以轻量部署、强大智能和隐私保护为核心,完美适配本地Windows环境。通过Docker快速安装、蓝耘大模型无缝接入,以及简单自然的聊天式使用,你就能轻松获得专业级的舆情洞察与报告。

无论你是个人用户想“吃瓜不迷路”、品牌方守护声誉,还是研究者/决策者需要趋势预测,BettaFish都能帮助你打破信息茧房、还原真实舆情、辅助科学决策。

立即行动:克隆GitHub项目,按照本文步骤部署,接入蓝耘API,开启你的AI舆情之旅!随着社区持续迭代,它将变得更加强大。