首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
FT542
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
实战:基于 LangChain + Multimodal RAG 构建视频知识库(数据清洗全流程)
在训练垂直领域的 Video-Text 模型时,我们通常遵循 Data Ingestion -> Cleaning -> Chunking -> Embedding 的标准链路。
实战:基于 LangChain + Multimodal RAG 构建视频知识库(数据清洗全流程)
在训练垂直领域的 Video-Text 模型时,我们通常遵循 Data Ingestion -> Cleaning -> Chunking -> Embedding 的标准链路。但是问题很多。
CV 模型训练避坑:视频分类任务中的“水印偏差(Watermark Bias)”消除策略
在 CVPR 等顶会论文中,经常提到数据集的 Bias 问题。在视频领域,一个典型的 Bias 就是**“平台水印”**。 如果你的负样本(Negative Samples)大多来自无水印的电影切片
构建多模态(Multi-modal)短视频数据集:从爬虫到清洗的工程化实践
在多模态大模型(LMM)的训练中,我们需要海量的 Video-Text 对齐数据。然而,直接从公开网页抓取的数据往往带有平台水印(Watermark)或硬字幕,这会严重影响模型对画面语义的理解
跨端应用静态资源极致优化:从 WebP 自动转换到资源管线重构
1. 基于 Node.js 的 CI/CD 资源压缩流水线 依靠人工压缩图片是不靠谱的且难以维护。最佳实践是在 Git Hook 或 CI 构建阶段,引入自动化脚本对资源进行 WebP 转换和无损压缩
Python 工业级视频流处理:从 FFmpeg 管道优化到非结构化数据清洗
1. 拒绝临时文件:基于内存管道的帧提取 传统的 os.system('ffmpeg -i ...') 调用方式会产生大量磁盘 IO,导致处理速度受限于硬盘读写。
从 Figma 切图到 WebP 自动化构建流 (CI/CD)
作为前端工程师,我们不仅要关注代码逻辑,还要管理媒体资产(Assets)的生产链路。通常的流程是:UI 给图 -> 前端切图 -> 压缩 -> 上线。
在票据识别或文档数字化的爬虫项目中,背景水印是降低 OCR 准确率的头号杀手。本文对比了传统的 OpenCV 二值化处理与 AI 修复方案,并提出了一套基于置信度筛查的高精度识别方案。
在使用 Python 的 pytesseract 或 PaddleOCR 进行文字识别时,我们经常遇到这样的 Bad Case:图片清晰度很高,但因为上面覆盖了一层淡淡的倾斜水印(Watermark)
Stable Diffusion LoRA 训练实战:基于 Python 的数据集清洗与“伪影”去除策略
做过 AIGC 模型训练的开发者都知道,Stable Diffusion 对训练集中的特征极其敏感。如果你的训练集Dataset中包含了大量带有角落水印、Logo 或文字覆盖的图片,训练模型会很麻烦
从单体应用到 Serverless:一款图片处理小程序的架构取舍与技术演进
作为一名独立开发者,在构建图像处理应用时,往往面临着“既要又要”的诱惑:既想做视频处理,又想做图像修复,然而,资源是有限的,算力是昂贵的。 本文将以**“香蕉一键去水印”**这款小程序作为案例剖析。
下一页
个人成就
文章被阅读
292
掘力值
162
关注了
0
关注者
0
收藏集
0
关注标签
3
加入于
2026-01-22