LLM+FFmpeg=自然语言处理音视频

118 阅读1分钟

在音视频处理领域,FFmpeg一直是一个强大而复杂的工具。然而,其命令行界面对普通用户来说往往显得晦涩难懂。随着大语言模型(LLM)技术的发展,我们现在可以通过自然语言来操控FFmpeg,让音视频处理变得的简单。

于是我做了一个小项目ai-ffmpeg:你可以用自然语言告诉它你想对视频做什么,它就能帮你完成。 比如: - "把这个视频压缩小一点" - "提取视频中的音频" - "调快视频的播放速度"

在线体验:ffmpeg-online.top/

github: github.com/woniu9524/a…

特点

  • 🔒 完全本地处理: 视频不会上传到服务器,保护你的隐私 -💬 简单对话: 用日常语言就能完成视频处理
  • 🌐 随时可用: 打开浏览器就能用,无需安装软件

它是怎么工作的?

  • 你用普通话描述需求
  • AI 把你的话转换成专业的 FFmpeg 命令 - 浏览器直接处理视频
  • 处理完就能看到效果和下载

使用场景示例

  1. 视频压缩
用户输入:把这个视频压缩到50MB以下 AI转换:ffmpeg -i input.mp4 -c:v libx264 -crf 23 -c:a aac -b:a 128k output.mp4 
  1. 调整播放速度
用户输入:把视频速度提高到1.5倍 AI转换:ffmpeg -i input.mp4 -filter:v "setpts=0.667*PTS" -filter:a "atempo=1.5" output.mp4 

展望

这个项目只有通过ffmpeg.wasm+LLM做了个简单的小项目,如果做成软件的+agent的话,可以完成更强大的功能。

结语

事实上我觉得很多命令行工具又都可以配一个AI界面来方便的完成一些任务。