重磅更新!FastDatasets 推出可视化 Web 界面,数据集生成更简单了 🎉
宝子们,好消息来啦!FastDatasets 迎来重大更新——全新可视化 Web 界面正式上线!再也不用敲命令行了,点点鼠标就能生成高质量训练数据集,效率直接起飞!🚀
github.com/ZhuLinsen/F…
告别命令行,拥抱可视化操作
之前用 FastDatasets 还需要敲命令行,虽然功能强大,但对新手不够友好。现在有了 Web 界面,零门槛上手,妈妈再也不用担心我不会用命令行啦!
# 启动超简单,一行命令搞定
cd web
python web_app.py
浏览器打开 http://localhost:7860,美观的界面立刻呈现在眼前!
Web 界面四大核心功能,样样都是神器
1. 📁 智能文件上传
- 拖拽上传:直接把文件拖到界面里,支持 PDF、Word、Markdown、纯文本
- 批量处理:一次上传多个文件,批量生成数据集
- 格式检测:自动识别文件格式,无需手动指定
2. ⚙️ 参数配置中心
再也不用记复杂的命令行参数了,界面化配置超直观:
- 文本分块设置:滑动条调整最小/最大分块长度
- 输出格式选择:Alpaca、ShareGPT 格式一键切换
- LLM 配置:API Key、Base URL、模型名称可视化设置
- 并发控制:智能调节 LLM 和文件处理并发数
- 高级选项:思维链(CoT)、每块问题数量等专业设置
3. 📊 实时处理监控
处理过程全程可视化,再也不用盲等了:
- 进度条显示:实时显示处理进度百分比
- 状态更新:当前处理文件、剩余时间一目了然
- 日志输出:详细处理日志实时滚动显示
- 错误提示:遇到问题立即提醒,不用猜测
4. 📥 结果管理中心
生成结果管理更便捷:
- 质量预览:查看生成的问答对数量和质量
- 一键下载:支持多种格式数据集文件下载
- 格式转换:在线转换不同的数据集格式
- 历史记录:查看之前的处理结果
使用体验大升级,6 步搞定数据集生成
- 启动服务:
python web_app.py一键启动 - 上传文件:拖拽文档到上传区域
- 配置参数:根据需求调整各项参数
- 开始处理:点击开始按钮,坐等结果
- 监控进度:实时查看处理状态和进度
- 下载结果:处理完成后一键下载数据集
整个过程可视化、自动化、智能化,新手 5 分钟就能上手!
为什么 Web 界面这么香?
🎯 降低使用门槛
- 不需要记忆复杂命令行参数
- 可视化配置,所见即所得
- 错误提示更友好,问题定位更精准
🚀 提升工作效率
- 批量文件处理,一次搞定多个文档
- 实时进度监控,合理安排时间
- 参数模板保存,重复任务一键复用
💡 功能更强大
- 支持更多高级配置选项
- 结果预览和质量评估
- 多格式导出和在线转换
命令行 vs Web 界面,你选哪个?
特性
命令行版本
Web 界面版本
使用门槛
需要学习命令
零门槛上手
参数配置
记忆复杂参数
可视化配置
进度监控
文本输出
实时可视化
批量处理
脚本编写
拖拽上传
结果管理
文件系统
在线管理
两个版本都保留,命令行适合自动化脚本,Web 界面适合交互式操作,各取所需!
技术架构升级,性能更强劲
- 异步处理:Web 界面同样支持高并发异步处理
- 状态管理:实时状态同步,多任务并行不冲突
- 错误恢复:智能错误处理和任务恢复机制
- 资源优化:内存和 CPU 使用更高效
未来还有更多惊喜
这只是 Web 界面的第一个版本,后续还会有更多功能:
- 🎨 主题定制:多种界面主题可选
- 📈 数据分析:生成数据集质量分析报告
- 🔄 模板管理:保存和分享配置模板
- 🌐 多语言支持:界面国际化
- 📱 移动适配:手机平板也能用
立即体验,感受效率革命
# 立即体验 Web 界面
git clone https://github.com/ZhuLinsen/FastDatasets.git
cd FastDatasets/web
python web_app.py
如果这个更新对你有帮助,请给个 Star ⭐ 支持一下! 你的每一个星标都是我们持续优化的动力!
让数据集生成变得更简单,让 AI 开发更高效!FastDatasets Web 界面,等你来体验!
#FastDatasets #Web界面 #数据集生成 #可视化 #大模型训练 #效率工具 #LLM #datasets #用户体验升级