视频点播(Video On Demand, VOD)是个人用户最常用的功能之一,也是许多媒体平台的支柱业务,如国外的Netflix、Hulu和国内的爱奇艺、优酷、腾讯视频、B站等。视频点播的核心在于将媒体传输内容的选择权交给用户,将用户选择的音视频媒体内容通过网络传输到用户的播放器进行播放。视频点播的内容可能来源于专业生产内容(PGC)、用户生产内容(UGC)或直播回放内容等,在通过云端服务器转码处理后保存。当用户向平台网站请求某个音视频节目时,媒体流信息通过内容分发网络(CDN)加速后发送至用户的播放客户端。
一个典型的视频点播系统结构如下:
视频直播产生的历史实际上比视频点播更加久远,在早期的有线电视中,几乎所有的节目都只能通过直播的方式呈现给观众。随着网络流媒体的兴起,各种直播平台经历了如“千播大战”的爆发式增长,最后兼并整合为几大巨头平台,如国内的斗鱼、虎牙和B站,以及国外的Twich等。视频直播的整体结构与视频点播有一定的相似性,如都依赖音视频转码服务和内容分发网络进行数据的标准化和加速传输等,它们之间最主要的区别在于,视频直播的内容来自主播端通过采集端实时获取的数据,而视频点播的内容来自内容发布方预先制作的节目内容。
一个典型的视频直播系统结构如下:
安防监控是音视频领域的重要应用场景,也是最具商业价值的业务之一。在一个典型的安防监控系统中,通过监控摄像机采集的视频流信息会经由网络视频录像服务器进行录制存储或转发。客户端通过管理服务器控制媒体流转发或录制的逻辑,并可以请求某一路实时流或录像文件的播放。
一个典型的安防监控系统结构如下:
视频会议是近年来蓬勃发展的新兴领域之一。2020年,在许多行业均因新冠肺炎疫情遭到重创的情况下,视频会议逆流而上,创造了自诞生以来最为迅速的增长。许多基于公网的视频会议系统都以WebRTC为基础,以尽可能低的延迟提供高质量的音频和视频实时通信服务。
一个典型的视频会议系统结构如下:
- 4CIF/SD: 图像分辨率为720像素×576像素,也称为标准清晰度(Standard Definition,SD)视频,常用于标清数字电视广播和数字视盘(DVD)。
- HD/720P: 图像分辨率为1280像素×720像素,也称为高清晰度(High Definition,HD)视频,常用于高清晰度数字电视广播和蓝光数字视盘(蓝光DVD)。
- FHD/1080P: 图像分辨率为1920像素×1080像素,也称为全高清晰度(Full High Definition,FHD)视频,与HD视频一样,也常用于高清晰度数字电视广播和蓝光DVD视盘。
- UHD: 分辨率比FHD视频更高的视频格式,也称为超高清(Ultra High Definition,UHD)视频。常用格式有4K和8K等,分辨率分别为3840像素×2160像素(4K)和7680像素×4320像素(8K),常用于超高清数字电视和高端数字娱乐系统。
像素格式的视频数据之所以能被压缩,其根本原因在于视频中存在冗余信息。我们可以通过多种不同的算法去除冗余信息,从而对数据进行压缩。视频数据中的冗余信息主要有:
- 时间冗余:视频中相邻两帧之间的内容相似,存在运动关系。
- 空间冗余:视频中某一帧内部的相邻像素存在相似性。
- 编码冗余:视频中不同数据出现的概率不同。
- 视觉冗余:观众的视觉系统对视频中的不同部分敏感度不同。
针对不同类型的冗余信息,在各视频编码的标准算法中都有专门的技术应对,以通过不同的角度提高压缩比率。
预测编码是数据压缩中最常用的方法之一,例如,在脉冲编码调制(Differential Pulse Code Modulation,DPCM)中,就是用当前采样值与预测采样值的差进行编码的,即通过这种方式减少输出数据的体积。在视频压缩中,预测编码作为最核心的算法之一起到了重要作用。在视频编码中,预测编码主要有两种方法:
- 帧内预测:帧内预测是根据当前帧已编码的数据进行预测,利用图像内相邻像素之间的相关性去除视频中的空间冗余。
- 帧间预测:帧间预测是将部分已编码的图像作为参考帧,利用前后帧之间的时间相关性去除视频中的时间冗余。
- 邮箱 :charon.chui@gmail.com
- Good Luck!