分类
- 场景分类 a) 容易做到高指标,但是达到一定程度,如90%左右时,更多的优化只能体现在 去重效果上,不去重时无大变化
比较容易展开的业务
- 各类平台 a) 内容理解平台、技能平台、数据标注平台、自动化测试平台
比较难推进和衡量的业务 1)文本改写 a) 属于ASR来做比较好,业务方比较难推进&不好衡量工作价值 b) 挖掘混淆词典比较靠谱,其他的不好落地 2)未召回 a) 召回率是多少
读取流数据
cap = cv2.VideoCapture(video_path)
frames = []
h, w = 0, 0
while cap.isOpened():
ret, frame = cap.read()
if not ret: break
# frame = np.fliplr(frame).copy()
frame_obj = Frame(raw_img=frame)
h, w = frame_obj.h, frame_obj.w
frames.append(frame_obj)
print("Processing", video_path, "total frames", len(frames))
return h, w, frames