首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
音视频(AV OPenGL CV)
订阅
爱吃包子的小伙子
更多收藏集
微信扫码分享
微信
新浪微博
QQ
97篇文章 · 0订阅
提升音频转录准确性:VAD技术的应用与挑战
引言 在音频转录技术飞速发展的今天,我们面临着一个普遍问题:在嘈杂环境中,转录系统常常将非人声误识别为人声,导致转录结果出现错误。例如,在whisper模式下,系统可能会错误地转录出“谢谢大家”。本文
一文搞懂IOS音视频编解码器VideoToolbox
一文搞懂 IOS 音视频编解码器 VideoToolbox,介绍了VideoToolbox的流程和基本用法
OpenGL学习(三)-- OpenGL 基础渲染
渲染管线(rendering pipeline),它是一系列数据处理过程,并且将应用程序的数据转换到最终渲染的图像。下图是 OpenGL 4.3 版本的管线。 OpenGL 中的 图元 只不过是顶点的集合以预定义的方式结合在一起罢了。 通过最近学习 OpenGL 的蓝宝书(《O…
OpenGL学习(一)-- 术语了解
在学习 OpenGL 之前,我们先来了解一下涉及到的一些术语名词。 将数学和图形数据转换成 3D 空间图像的操作叫做渲染(Rendering)。当这个术语作为动词使用时,指的是计算机创建三维图像时所经历的过程。它也作为名词使用,指的仅仅是最终的图像作品。 如上图显示的是用线条绘…
opengl学习(mac xcode平台)
微积分,非必须。微积分是计算机视觉的基础,涉及到偏导梯度、傅里叶变换等,参考资料: 计算机视觉基础 :必学,opengl涉及的坐标变换、相机变换,色彩处理等都需要计算机视觉基础。直接硬上opengl理解起来会很突兀 1. opengl教程-learnopenGL 2. lear…
iOS图形处理概论:OpenGL ES,Metal,Core Graphics,Core Image,GPUImage,OpenCV等
对于刚接触iOS图形相关框架的小白,有一些图形框架在字面上和功能上非常容易混淆。这里旨在总结一下各种框架,区分它们的概念和功能,以作日后进一步细分学习的指引。因而,本文并不会针对具体框架作详解,只作区分引导,读者可自行选择方向继续深造。为此,笔者总结了一张各种框架关系图,如下所…
iOS开发中截取相机部分画面,切割sampleBuffer(Crop sample buffer)
本例需求:在类似直播的功能界面,二维码扫描,人脸识别或其他需求中的功能界面或其他需求中需要从相机捕获的画面中单独截取出一部分区域。 原理:由于需要截取相机捕获整个画面其中一部分,所以也就必须拿到那一部分画面的数据,又因为相机AVCaptureVideoDataOutputSam…
音频编码 Audio Converter
iOS中将采集到的原始音频数据(PCM)进行编码以得到压缩数据类型(AAC...). 本例最终实现的是通过Audio Unit采集到PCM数据,将其压缩转为AAC数据,并以录制的形式保存在沙盒中.可调整编码后音频数据格式,采样率,编码器类型等参数. 利用Audio Toolbo…
笔记-GPUImage(一)简介以及如何正确的导入项目
GPUImage是一个开源的基于GPU的图片或视频的处理框架,其本身内置了近120多种场景的滤镜效果,并且支持照相机和摄像机的实时滤镜,并且能够自定义图像滤镜。 GPUImage是采用链式方法处理画面的,通过addTarget方法添加对象到链中,处理完一个target,就会把上…
OpenGL渲染流程
之前学习管线的时候,我们知道OpenGL的渲染流程是有固定次序的。那么先了解下渲染框架: 这里的客户端和服务端都是对OpenGL而言。客户端将数据和渲染指令发送给服务端。 客户端是运行在CPU上的程序代码和OpenGL API的调用以及数据的传递。 服务端是OpenGL接收客户…