Reddit_Business_Idea_Validator
为什么出海看reddit?
Reddit是欧美年轻人扎堆的兴趣社区,类似国内贴吧,但更垂直。用户以24-44岁男性为主,爱科技、游戏、亚文化,消费力强且反感硬广。出海人可通过创建兴趣小组(Subreddit)、发干货帖子、办AMA问答活动自然引流,但需长期互动,避免直接推销
reddit的数据获取:
PRAW(Python Reddit API Wrapper)是一个Python库,它封装了Reddit的API,让我们能够轻松地与Reddit进行交互。使用PRAW,我们可以获取帖子、评论,甚至可以发布内容或管理subreddit。PRAW不仅简化了Reddit API的使用,还提供了许多便利功能,使得Reddit数据抓取变得轻而易举。
参考: blog.csdn.net/m0_73693562…
我的开源项目介绍
核心功能
- Reddit 数据抓取: 自动抓取相关帖子和评论数据(使用用户输入作为搜索关键词)
- AI 内容分析: 使用 LLM 分析用户痛点和市场需求
- 自动化报告生成: 生成专业的市场验证报告
系统流程图
┌─────────────────────────────────────────────────────────────────────────────────┐ │ 系统入口 │ │ python run_agent.py "业务创意" │ └─────────────────────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────────────────────┐ │ 环境配置与初始化 │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ Config │ │ Context │ │ MCP Clients │ │ Storage │ │ │ │ Manager │ │ Store │ │ │ │ Server │ │ │ └─────────────┘ └─────────────┘ └─────────────┘ └─────────────┘ │ └─────────────────────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────────────────────┐ │ Orchestrator Agent 启动 │ │ ┌─────────────────────────────────────────────────────────────────────────┐ │ │ │ 任务: validate_business_idea │ │ │ │ 业务创意: "用户输入的业务创意" │ │ │ └─────────────────────────────────────────────────────────────────────────┘ │ └─────────────────────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────────────────────┐ │ 1. 数据抓取阶段 (Scraper Agent) │ │ ┌─────────────────────────────────────────────────────────────────────────┐ │ │ │ 任务: scrape_data │ │ │ │ - 使用业务创意作为搜索关键词 │ │ │ │ - 通过 Reddit MCP Server 抓取 Reddit 帖子和评论 │ │ │ │ - 保存 checkpoint: scraping_complete.json │ │ │ └─────────────────────────────────────────────────────────────────────────┘ │ └─────────────────────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────────────────────┐ │ 2. 数据分析阶段 (Analyzer Agent) │ │ ┌─────────────────────────────────────────────────────────────────────────┐ │ │ │ 任务: analyze_data │ │ │ │ ├── analyze_posts: 分析帖子内容,提取用户痛点和需求 │ │ │ │ ├── analyze_comments: 分析评论情感和用户反馈 │ │ │ │ ├── comments_tag_analysis: 评论标签分析 │ │ │ │ └── combined_analysis: 综合分析生成市场验证评分 │ │ │ │ 保存 checkpoint: analysis_complete.json, comments_tag_analysis_complete.json│ │ │ └─────────────────────────────────────────────────────────────────────────┘ │ └─────────────────────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────────────────────┐ │ 3. 报告生成阶段 (Reporter Agent) │ │ ┌─────────────────────────────────────────────────────────────────────────┐ │ │ │ 任务: generate_and_save_report │ │ │ │ ├── generate_html_report: 生成 HTML 格式报告 │ │ │ │ ├── save_report: 保存报告到 reports/ 目录 │ │ │ │ └── 保存 checkpoint: report_saved.json │ │ │ └─────────────────────────────────────────────────────────────────────────┘ │ └─────────────────────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────────────────────┐ │ 4. 结果输出与存储 │ │ ┌─────────────────────────────────────────────────────────────────────────┐ │ │ │ 输出文件: │ │ │ │ ├── reports/{business_idea}_{timestamp}.html │ │ │ │ ├── agent_context/checkpoints/{run_id}/ │ │ │ │ │ ├── scraping_complete.json │ │ │ │ │ ├── analysis_complete.json │ │ │ │ │ ├── comments_tag_analysis_complete.json │ │ │ │ │ ├── combined_analysis_complete.json │ │ │ │ │ └── report_saved.json │ │ │ │ └── 小提示: 相关资料请到 agent_context/checkpoints/{run_id}/ 目录下查看 │ │ │ └─────────────────────────────────────────────────────────────────────────┘ │ └─────────────────────────────────────────────────────────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────────────────────────────────────┐ │ 任务完成 │ │ 返回 TaskResult 包含执行结果 │ └─────────────────────────────────────────────────────────────────────────────────┘