本书较全面地介绍了运动图像及其伴音通用压缩编码国际标准MPEG-2及MPEG标准的新进展。全书分为三部分:第一部分分为三章,分别较详尽地从系统、视频和音频介绍了MPEG-2数据流的数据结构、语法和语义、编码和解码算法及系统框图;第二部分主要介绍了MPEG标准的新进展,分别介绍了MPEG-4、MPEG-7和MPEG-21的主要内容、数据结构、框架要素和现状;第三部分重点阐述了最新的面向网络传输的视频编码方法,它包括精细的可扩展性编码、渐进的精细可扩展性编码、增强层码率分配算法和精细的空域可扩展性编码方法。\r\n\r\n 本书可作为从事多媒体计算机、多媒体通信、数字电视广播和交互式电视技术的研制、开发及应用的工程技术人员以及大专院校有关专业师生的参考书。\r\n
\r\n
第一章 MPEG-2系统 \r\n\r\n 1. 1 引言 \r\n\r\n 1. 1. 1 传送流 \r\n\r\n 1. 1. 2 程序流 \r\n\r\n 1. 1. 3 传送流和程序流之间的转换 \r\n\r\n 1. 1. 4 分组的原始数据流 \r\n\r\n 1. 1. 5 时间模式 \r\n\r\n 1. 1. 6 条件访问 \r\n\r\n 1. 1. 7 多路复用宽操作 \r\n\r\n 1. 1. 8 单独的流操作(PES分组层) \r\n\r\n 1. 1. 9 系统参考解码器 \r\n\r\n 1. 1. 10 应用 \r\n\r\n 1. 2 描述比特流语法的方法 \r\n\r\n 1. 3 传送流的比特流要求 \r\n\r\n 1. 3. 1 传送流的编码结构和参数 \r\n\r\n 1. 3. 2 传送流系统目标解码器(T-STD) \r\n\r\n 1. 3. 3 传送流语法和语义的说明 \r\n\r\n 1. 3. 4 程序特殊信息 \r\n\r\n 1. 4 程序流的比特流要求 \r\n\r\n 1. 4. 1 程序流的编码结构和参数 \r\n\r\n 1. 4. 2 程序流系统目标解码器 \r\n\r\n 1. 4. 3 程序流语法和语义的说明 \r\n\r\n 1. 4. 4 程序流映射 \r\n\r\n 1. 4. 5 程序流目录 \r\n\r\n 1. 5 程序流和原始流描述子 \r\n\r\n 1. 5. 1 流描述子中各字段的语义定义 \r\n\r\n 1. 5. 2 视频流描述子 \r\n\r\n 1. 5. 3 视频流描述子中各字段的语义定义 \r\n\r\n 1. 5. 4 音频流描述子 \r\n\r\n 1. 5. 5 音频流描述子中各字段的语义定义 \r\n\r\n 1. 5. 6 体系描述子 \r\n\r\n 1. 5. 7 体系描述子中各字段的语义定义 \r\n\r\n 1. 5. 8 注册描述子 \r\n\r\n 1. 5. 9 注册描述子中各字段的语义定义 \r\n\r\n 1. 5. 10 数据流对准描述子 \r\n\r\n 1. 5. 11 数据流对准描述子中各字段的语义定义 \r\n\r\n 1. 5. 12 目标背景栅格描述子 \r\n\r\n 1. 5. 13 目标背景栅格描述子中各字段的语义定义 \r\n\r\n 1. 5. 14 视频窗口描述子 \r\n\r\n 1. 5. 15 视频窗口描述子中各字段的语义定义 \r\n\r\n 1. 5. 16 条件访问描述子 \r\n\r\n 1. 5. 17 条件访问描述子中各字段的语义定义 \r\n\r\n 1. 5. 18 ISO 639语言描述子 \r\n\r\n 1. 5. 19 ISO 639语言描述子中各字段的语义定义 \r\n\r\n 1. 5. 20 系统时钟描述子 \r\n\r\n 1. 5. 21 系统时钟描述子中各字段的语义定义 \r\n\r\n 1. 5. 22 多路复用缓冲区使用描述子 \r\n\r\n 1. 5. 23 多路复用缓冲区使用描述子中各字段的语义定义 \r\n\r\n 1. 5. 24 版权描述子 \r\n\r\n 1. 5. 25 版权描述子中各字段的语义定义 \r\n\r\n 1. 5. 26 最大比特率描述子 \r\n\r\n 1. 5. 27 最大比特率描述子中各字段的语义定义 \r\n\r\n 1. 5. 28 私用数据指示器描述子 \r\n\r\n 1. 5. 29 私用数据指示器描述子中各字段的语义定义 \r\n\r\n 1. 6 多路复用流语义的限制 \r\n\r\n 1. 6. 1 缓冲区管理 \r\n\r\n 1. 6. 2 系统参考时钟的编码频率 \r\n\r\n 1. 6. 3 程序参考时钟的编码频率 \r\n\r\n 1. 6. 4 原始流系统参考时钟的编码频率 \r\n\r\n 1. 6. 5 显示时间标签的编码频率 \r\n\r\n 1. 6. 6 时间标签的条件编码 \r\n\r\n 1. 6. 7 PES分组首部中P-STD_buffer_size的编码频率 \r\n\r\n 1. 6. 8 程序流中系统首部的编码 \r\n\r\n 1. 6. 9 系统参数受限的程序流 \r\n\r\n 1. 6. 10 传送流 \r\n\r\n 附录1. A 数字存储媒体的命令和控制(DSM CC) \r\n\r\n 1. A. 1 简介 \r\n\r\n 1. A. 2 基本元素 \r\n\r\n 1. A. 3 技术元素 \r\n\r\n 附录1. B CRC解码器模型 \r\n\r\n 附录1. C 程序特殊信息 \r\n\r\n 1. C. 1 传送流中程序特殊信息的说明 \r\n\r\n 1. C. 2 简介 \r\n\r\n 1. C. 3 功能机制 \r\n\r\n 1. C. 4 从分段映射到传送流分组 \r\n\r\n 1. C. 5 重复率和随机访问 \r\n\r\n 1. C. 6 程序是什么 \r\n\r\n 1. C. 7 program_number的分配 \r\n\r\n 1. C. 8 在一典型系统中PSI的使用 \r\n\r\n 1. C. 9 PSI结构的关系 \r\n\r\n 1. C. 10 带宽效用和信号获取时间 \r\n\r\n 第二章 MPEC-2视频 \r\n\r\n 2. 1 引言 \r\n\r\n 2. 1. 1 目的 \r\n\r\n 2. 1. 2 应用 \r\n\r\n 2. 1. 3 框架和级别 \r\n\r\n 2. 1. 4 可分级语法和不可分级语法 \r\n\r\n 2. 2 一些约定 \r\n\r\n 2. 2. 1 比特流语法的描述方法 \r\n\r\n 2. 2. 2 函数定义 \r\n\r\n 2. 2. 3 保留. 禁止和marker_bit \r\n\r\n 2. 2. 4 算术精确性 \r\n\r\n 2. 3 视频比特流的语法和语义 \r\n\r\n 2. 3. 1 编码视频数据的结构 \r\n\r\n 2. 3. 2 视频比特流语法 \r\n\r\n 2. 3. 3 视频比特流语义 \r\n\r\n 2. 4 视频解码过程 \r\n\r\n 2. 4. 1 高层语法结构 \r\n\r\n 2. 4. 2 变长码解码 \r\n\r\n 2. 4. 3 反扫描 \r\n\r\n 2. 4. 4 反量化 \r\n\r\n 2. 4. 5 反DCT \r\n\r\n 2. 4. 6 运动补偿 \r\n\r\n 2. 4. 7 空域分级 \r\n\r\n 2. 4. 8 SNR分级 \r\n\r\n 2. 4. 9 时域分级 \r\n\r\n 2. 4. 10 数据分割 \r\n\r\n 2. 4. 11 混合分级 \r\n\r\n 2. 4. 12 解码过程输出 \r\n\r\n 2. 5 框架和级别 \r\n\r\n 2. 5. 1 ISO/IEC 11172-2的兼容性 \r\n\r\n 2. 5. 2 限定的框架间的关系 \r\n\r\n 2. 5. 3 限定的级别间的关系 \r\n\r\n 2. 5. 4 分级的层 \r\n\r\n 2. 5. 5 限定的框架. 级别和层的参数值 \r\n\r\n 附录2. A 离散余弦变换 \r\n\r\n 附录2. B 可变长度码表 \r\n\r\n 2. B. 1 宏块寻址 \r\n\r\n 2. B. 2 宏块类型 \r\n\r\n 2. B. 3 宏块模式 \r\n\r\n 2. B. 4 运动向量 \r\n\r\n 2. B. 5 DCT系数 \r\n\r\n 附录2. C 视频缓冲检验器 \r\n\r\n 第三章 MPEG-2音频 \r\n\r\n 3. 1 引言 \r\n\r\n 3. 1. 1 ISO/IEC 11172-3降低音频编码采样率的扩充 \r\n\r\n 3. 1. 2 多通道音频的低比特率编码 \r\n\r\n 3. 2 ISO/IEC 11172-3降低采样频率音频编码扩展的要求 \r\n\r\n 3. 2. 1 编码音频比特流活法的说明 \r\n\r\n 3. 2. 2 音频比特流语法的语义 \r\n\r\n 3. 2. 3 音频解码过程 \r\n\r\n 3. 3 多通道低比特率音频编码的要求 \r\n\r\n 3. 3. 1 编码音频比特流语法说明 \r\n\r\n 3. 3. 2 音频比特流语法的语义 \r\n\r\n 3. 3. 3 音频解码过程 \r\n\r\n 附录3. A 图 \r\n\r\n 附录3. B 表 \r\n\r\n 第四章 MPEG标准的新进展 \r\n\r\n 4. 1 基于对象的编码标准--MPEG-4 \r\n\r\n 4. 1. 1 概述 \r\n\r\n 4. 1. 2 MPEG-4的编码思想 \r\n\r\n 4. 1. 3 MPEG-4的数据结构 \r\n\r\n 4. 1. 4 VOP的编码 \r\n\r\n 4. 1. 5 分割 \r\n\r\n 4. 1. 6 Sprite技术--背景全景图编码 \r\n\r\n 4. 1. 7 小结 \r\n\r\n 4. 2 多媒体内容描述接口--MPEG-7 \r\n\r\n 4. 2. 1 概述 \r\n\r\n 4. 2. 2 MPEG-7标准的主要内容 \r\n\r\n 4. 3 多媒体框架--MPEG-21 \r\n\r\n 4. 3. 1 问题的提出和研究目标 \r\n\r\n 4. 3. 2 用户和用户需求 \r\n\r\n 4. 3. 3 框架中的要素 \r\n\r\n 4. 3. 4 关键问题 \r\n\r\n 4. 3. 5 应用范围 \r\n\r\n 4. 3. 6 现状与研究计划 \r\n\r\n 第五章 面向网络传输的视频编码 \r\n\r\n 5. 1 视频在网络上传输的难点 \r\n\r\n 5. 1. 1 模型和体系结构 \r\n\r\n 5. 1. 2 面临的挑战 \r\n\r\n 5. 2 错误控制 \r\n\r\n 5. 2. 1 信道错误控制 \r\n\r\n 5. 2. 2 信源错误控制 \r\n\r\n 5. 2. 3 信源/信道联合编码 \r\n\r\n 5. 2. 4 错误隐藏 \r\n\r\n 5. 3 传统视频编码在传输中的应用 \r\n\r\n 5. 3. 1 最小传输 \r\n\r\n 5. 3. 2 自适应编码 \r\n\r\n 5. 3. 3 Transcoding \r\n\r\n 5. 3. 4 码流切换 \r\n\r\n 5. 3. 5 分层可扩展性编码 \r\n\r\n 5. 4 适合网络传输的编码方案 \r\n\r\n 5. 4. 1 精细的可扩展性编码(Fine Granular Scalable Coding) \r\n\r\n 5. 4. 2 渐进的精细可扩展性编码(Progressive FGS Coding) \r\n\r\n 5. 5 PFGS增强层的码率分配 \r\n\r\n 5. 5. 1 问题的提出 \r\n\r\n 5. 5. 2 问题的描述和简化 \r\n\r\n 5. 5. 3 PFGS增强层的联合率失真函数 \r\n\r\n 5. 5. 4 PFGS增强层的码率分配算法 \r\n\r\n 5. 5. 5 实验结果 \r\n\r\n 5. 5. 6 码率分配算法的推广 \r\n\r\n 5. 6 精细的空域可扩展性视频编码 \r\n\r\n 5. 6. 1 传统的空域可扩展性编码 \r\n\r\n 5. 6. 2 精细的空域可扩展性编码 \r\n\r\n 5. 6. 3 视频的采样 \r\n\r\n 5. 6. 4 宏块模式选择 \r\n\r\n 5. 6. 5 低分辨率下的增强 \r\n\r\n 5. 6. 6 不同分辨率之间的运动分析 \r\n\r\n 5. 7 结束语 \r\n\r\n 参考文献 \r\n
\r\n
21世纪的人类社会是信息化社会, 数字化后的信息, 尤其是数字化后的视频和音频信息具有数据海量性, 它给信息的存储和传输造成较大的困难, 成为阻碍人类有效地获取和使用信息的瓶颈问题之一. 因此, 研究和开发新型有效的多媒体数据压缩编码方法, 以压缩的形式存储和传输这些数据将是最好的选择.
传统的压缩编码是建立在仙侬(Shannon)信息论的基础上, 它以经典的集合论为基础, 用统计概率模型来描述信源. 但是, 它末考虑信息接受者的主观特性以及事件本身的具体含义. 重要程度和引起的后果. 压缩编码的发展历程实际是以仙枚信息论为出发点, 不断完善的过程, 编码方法可以分成下述三类:
考虑信源的统计特性:预测编码方法. 变换编码方法. 矢量量化方法. 子带-小波编码方法和神经网络编码方法等,
考虑人眼的视觉特性:基于方向滤波的图像编码方法和基于图像轮廓-纹理的编码方法,
考虑图像传递的景物特性:分形编码和基于内容的编码方法.
也有人将图像编码方法分为两代:第一代是基于数据统计, 去掉的是数据冗余, 称为低层压缩编码方法, 第二代是基于内容, 去掉的是内容冗余, 其中基于对象(Object-Based)方法称为中层压缩编码方法, 基于语义(Syntax-Based)方法称为高层压缩编码方法.
标准化是产业化活动成功的前提, 国际标准化组织于1986年成立了运动图像压缩编码组织MPEG(Moving Picture Expert Group), 主要致力于制定运动图像的压缩编码标准, 1993年8月正式编辑出版了MPEG-1 ISO/IEC 11172, 1994年又编辑出版了MPEG-2ISO/IEC 13818. 它们主要采用了第一代压缩编码方法, 如预测编码. 变换编码. 熵编码和运动补偿.
MPEG组织于1999年1月正式公布了MPEG-4 ISO/IEC 14496 V1. 0版本, 1999年12月又公布了V2. 0版本. MPEG-4的制定初衷主要针对视频会议. 可视电话的超低比特率压缩编码的需求. 在制定的过程中, MPEG组织深深感受到人们对媒体信息, 特别是对视频信息的需求由播放型转向基于内容的访问. 检索和操作. MPEG-4与前面提到的MPEG-1和MPEG-2有很大的不同, 它为多媒体数据压缩编码提供了更为广阔的平台, 它定义的是一种格式. 一种框架, 而不是具体算法, 古希望建立一种更自由的通信与开发环境. 于是MPEG-4新的目标就定义为支持多种多媒体的应用, 特别是多媒体信息基于内容的检索和访问, 可根据不同的应用需求, 现场配置解码器. 编码系统也是开放的, 可随时加入新的有效的算法模块.
在MPEG-4之后, 现在MPEG组织正在制定MPEG-7“多媒体内容描述接口”, 同时还在制定MPEG-21. 1999年8月MPEG主席Leonardo Chiariglione提出了
“Technologies for E-Content”的报告, 引起了各国代表团的关注. 1999年10月日本代表团在MPEG国际会议上提出了制定MPEG-21标准的提案, 以支持电子内容传输和电子贸易(N3002), 1999年12月MPEG会议通过了征集“Multimeda Framework”技术报告的议案(N3162), 2000年3月MPEG会议成立了MPEG-21专家组.
最近由于Internet的迅猛发展和无线通信的普及, 视频和音频压缩编码的目标也不断地从传统的面向存储变为面向传输. 新一代的视频编码国际标准中的精细可扩展性(fine granular scalable, FGS)编码, 提供了完全可扩展的增强层码流, 它可以在任何地点截断, 具有极强的网络带宽适应能力.
为了较全面地介绍运动图像及其伴音通用压缩编码国际标准MPEG-2和MPEG标准的新进展, 我们把全书分成三部分:第一部分介绍MPEG-2, 共三章, 分别从系统. 视频和音频较详细地介绍了MPEG-2数据流的数据结构. 语法和语义. 编码和解码算法及系统框图, 第二部分是第四章, 重点介绍了MPEG标准的新进展, 分别介绍了MPEG-4. MPEG-7和MPEG-21的主要内容. 数据结构. 框架要素和现状, 第三部分是第五章, 阐述了最新的面向网络传输的现频编码方法, 它包括精细可扩展性编码. 渐进的精细可扩展性编码. 增强层码率分配算法和精细的空域可扩展性编码方法. 全书由钟玉琢. 王琪. 赵黎和杨小勤编译, 参加编译工作的还有乔秉新和祁卫等人.
在编译过程中, 作者参考了国内外有关多媒体数据压缩编码的书刊及文献资料, 还有清华大学计算机系的论文和科研成果报告. 但是多媒体数据压缩编码技术正处在蓬勃发展的阶段, 新的文献资料我们收集得还不完整. 限于作者的学识水平, 书中不足和错误之处, 恳请读者给予批评指正.
本书编译过程中得到译者所在研究所及本组其他成员的大力支持, 在此表示衷心感谢.
译者
2001年12月1日