实战细节

93 阅读1分钟

分类

  1. 场景分类 a) 容易做到高指标,但是达到一定程度,如90%左右时,更多的优化只能体现在 去重效果上,不去重时无大变化

比较容易展开的业务

  1. 各类平台 a) 内容理解平台、技能平台、数据标注平台、自动化测试平台

比较难推进和衡量的业务 1)文本改写 a) 属于ASR来做比较好,业务方比较难推进&不好衡量工作价值 b) 挖掘混淆词典比较靠谱,其他的不好落地 2)未召回 a) 召回率是多少

读取流数据
cap = cv2.VideoCapture(video_path)
        frames = []
        h, w = 0, 0
        while cap.isOpened():
            ret, frame = cap.read()
            if not ret: break
            # frame = np.fliplr(frame).copy()
            frame_obj = Frame(raw_img=frame)
            h, w = frame_obj.h, frame_obj.w
            frames.append(frame_obj)
        print("Processing", video_path, "total frames", len(frames))
        return h, w, frames