[an error occurred while processing this directive]

课程信息

《多媒体技术(含实验)课程》课程教学大纲

发布时间：2021-05-17 人气： 869

《多媒体技术》教学大纲20170525.docx

《多媒体技术(含实验)课程》课程教学大纲

课程名称：多媒体技术（含实验）	课程代码：ELIE2008
英文名称：Multimedia Technology
课程性质：（通识、公共、大类等）	学分/学时：
开课学期：6
适用专业：信息工程、通信工程、电子信息工程
先修课程：高等数学、工程数学、信号与线性系统、数字信号处理
后续课程：信息系统综合实验
开课单位：电子信息学院	课程负责人：王加俊
大纲执笔人：王加俊、陈雪勤	大纲审核人：胡剑凌

一、课程性质和教学目标（在人才培养中的地位与性质及主要内容，指明学生需掌握知识与能力及其应达到的水平）

课程性质：多媒体技术是信息工程的专业必修课、以及通信工程和电子信息工程的专业选修课程，是信号与线性系统、数字信号处理等课程的后续课程。

教学目标：通过本课程的学习，使学生掌握语音、音频、图像以及视频等媒体的基本概念以及利用计算机对语音、音频、图像以及视频进行综合处理和分析的基本技术，了解多媒体信息处理技术的应用和发展概况，进一步培养学生解决多媒体信息的传输和处理中复杂问题的能力。本课程的具体教学目标如下：

(1) 熟悉多媒体及多媒体技术的基本概念及特征；了解声音的基本特性及主观感觉；熟悉音频、图像、视频信号数字化的过程，掌握均匀量化的原理；

(2) 掌握彩色三要素、三基色原理及混色方法等色度学基本知识；理解RGB、YUV、YIQ、YCbCr、HSI/HSV等颜色空间的表示及转换；熟悉ITU-R BT.601建议的主要内容；掌握Matlab中用于图像处理基本函数的用法。

(3) 掌握数字图像增强的基本方法和技术；掌握二值图像的数学形态学处理的基本原理和常用方法；掌握图像的阈值化分割、边缘检测、区域分割等图像分割方法；掌握数字图像以及视频的无失真编码、预测编码、变换编码的基本原理、了解JPEG、MPEG等常用的图像及视频编码标准；掌握数字水印的基本概念、数字图像水印的嵌入与提取方法、了解数字视频水印的嵌入和提取方案。

(4) 熟悉声学基本概念及度量参数；掌握人的三个主观听感要素：响度、音调、音色的概念；熟悉人的听觉特性和语音的发音机理；了解数字音频文件的多种格式，掌握WAV、RIFF格式的结构；掌握语音信号时频域声学特征提取方法。

(5) 掌握数字音频压缩技术的原理；掌握线性预测编码、矢量量化、子带编码的原理，了解MPEG音频编码原理；了解基音频率与声调、说话人性别之间的关联；理解数字音频水印的原理，掌握基本的数字音频水印实现方法；理解声纹识别系统中的特征、分类模型的概念，掌握一种声纹识别系统的设计方法。

二、课程目标与毕业要求的对应关系（明确本课程知识与能力重点符合标准哪几条毕业要求指标点）

毕业要求	指标点	课程目标
1、工程知识	1-2掌握多媒体基础知识，具备对音频/语音、视频/图象进行信号分析与处理能力	教学目标1
2、问题分析	2-3能正确运用多媒体技术原理分析复杂工程问题。	教学目标2
3、设计/开发解决方案	3-1能够综合考虑，形成对复杂问题的设计方案。	教学目标3

三、课程教学内容及学时分配（含课程教学、自学、作业、讨论等内容和要求，指明重点内容和难点内容）（重点内容：«；难点内容：D）

1、多媒体信息处理基础（7学时）

1.1多媒体的基本概念

1.1.1多媒体的基本概念

1.1.2多媒体与多媒体技术

1.2图像信息处理基础

1.2.1光的颜色与彩色三要素

1.2.2三基色的基本原理

1.2.3颜色空间模型及转换关系

1.2.4图像信号的数字化

1.3视频信号的数字化

1.4 Matlab在图像处理中的应用

1.4.1 Matlab简介

1.4.2 Matlab中图像文件的基本操作

1.5声学基础知识

1.5.1声波、声音与声学的基础概念

1.5.2声音的参数与度量

1.5.3室内声学基础

1.5.4人耳的听觉特性

1.5.5声音质量评价方法

1.6音频信号数字化处理

1.6.1音频信号的数字化

1.6.2过采样与噪声整形

1.6.3数字音频文件格式

1.6.4数字音频编辑软件

² 目标及要求

（1）熟悉多媒体及多媒体技术的基本概念及特征。

（2）了解声音的基本特性及主观感觉。

（3）熟悉音频、图像、视频信号数字化的过程，掌握均匀量化的原理。

（4）掌握彩色三要素、三基色原理及混色方法等色度学基本知识。

（5）理解RGB、YUV、YIQ、YCbCr、HSI/HSV等颜色空间的表示及转换。

（6）熟悉ITU-R BT.601建议的主要内容。

（7）了解MATLAB在图像处理和分析领域的应用。

（8）熟悉声学基本概念及度量参数。

（9）掌握人的三个主观听感要素：响度、音调、音色的概念。

(10)了解影响室内声学环境的因素以及混响的作用。

（11）掌握人耳听觉范围和听觉掩蔽效应，了解听觉延时效应和双耳效应。

(12)熟悉评价声音质量的主客观指标。

（13）熟悉资源交换文件格式RIFF的结构和WAV文件格式的基本结构，了解mp3/midi/ra/rm/wma/ape/au等音频文件格式。

(14)熟悉数字音频编辑软件如：cooledit/audition等的使用方法。

² 作业内容

（1）媒体的概念与分类；

（2）多媒体技术的基本概念及特征；

（3）彩色三要素的物理含义，RGB、HIS如何对颜色进行描述?

（4）编写程序实现RGB与HIS之间的转换；

（5）复合数字编码与分量数字编码的基本原理及其优缺点；

（6）ITU-R BT.601建议的主要内容有哪些？有何实际意义？

（7）人耳的听觉范围及等响度曲线的特点？

（8）人耳区别不同人声及各类乐器依据的主要参量？

（9）描述听觉掩蔽效应，思考听觉掩蔽效应的应用。

（10）说明音频信号数字化的三个主要步骤及其功能。

（11）过采样以及噪声整形技术为什么可以提高A/D转换器精度？

2、图像增强(6学时)

2.1引言

2.2图像的灰度变换

2.2.1灰度的线性变换

2.2.2灰度的非线性变换

2.2.3直方图均衡化

2.2.4直方图的规定化

2.3图像平滑

2.3.1模板操作和卷积运算

2.3.2邻域平均法

2.3.3中值滤波

2.3.4频域低通滤波

2.4图像锐化

2.4.1梯度算子

2.4.2 Sobel算子

2.4.3 Laplacian算子

2.4.4频域高通滤波

2.5图像的同态滤波

2.6伪彩色增强

² 目标及要求

（1）掌握数字图像增强的基本方法和技术；

（2）掌握数字图像灰度的线性与非线性变换的方法及应用；

（3）熟悉直方图均衡化、直方图规定化的步骤；

（4）掌握图像平滑的基本方法，如邻域平均法、中值滤波法、低通滤波；

（5）掌握图像锐化的基本方法，如梯度运算、Sobel算子、拉普拉斯算子、高通滤波；

（6）了解图像的同态滤波；

（7）了解伪彩色增强、假彩色增强的基本方法。

² 作业内容

（1）图像增强的目的；

（2）利用线性变换实现灰度动态范围的拉伸或压缩；

（3）利用灰度直方图的均衡化和规定化技术实现图像增强；

（4）图像的平均值滤波、中值滤波的适用范围有何区别、分别利用这两种滤波器进行图像去噪处理；

（5）利用一阶微分算子对图像进行锐化处理；

（6）利用同态滤波对图像进行对比度增强处理；

（7）利用灰度分层法或灰度变换法将一幅灰度图像转换成彩色图像。

3、形态学图像处理（6学时）

3.1引言

3.1.1数学形态学的基本思想

3.1.2集合论基础

3.1.3数学形态学中的几个基本概念

3.2二值形态学基本运算

3.2.1腐蚀

3.2.2膨胀

3.2.3腐蚀与膨胀的对偶性

3.2.4开运算

3.2.5闭运算

3.3二值图像的形态学处理

3.3.1边缘提取

3.3.2区域填充

3.3.3骨架提取

3.3.4细化

3.3.5粗化

3.3.6形态学滤波

² 目标及要求

（1）了解数学形态学的基本思想；

（2）熟悉集合和子集的概念及表示方法，掌握集合间的关系及并、交、补、差等运算；

（3）理解数学形态学中结构元素的概念及作用；

（4）掌握膨胀、腐蚀、开、闭运算的物理含义，以及由上述各种基本运算导出的各种二值图像形态学处理算法。

² 作业内容

（1）说明二值膨胀、腐蚀运算对图像处理的作用和特点，并通过编程实现之；

（2）说明二值开、闭运算对图像处理的作用和特点，并通过编程实现之；

（3）利用形态学处理实现二值图像的骨架化；

（4）利用形态学处理提取二值图像的内、外、形态学边缘；

（1）利用形态学滤波实现图像的细化、粗化、以及区域的填充处理。

4、图像分割（6学时）

4.1图像分割的概念及分类

4.1.1图像分割的概念

4.1.2图像分割的依据和方法分类

4.2基于灰度阈值化的图像分割

4.2.1阈值化分割的原理

4.2.2全局阈值化分割

4.2.3局部阈值分割法

4.3基于边缘检测的图像分割

4.3.1边缘检测的基本原理和步骤

4.3.2梯度算子

4.3.3 Laplacian算子和LOG算子

4.3.4 Canny算子

4.4基于区域的图像分割

4.4.1区域生长法

4.4.2区域的分裂与合并法

² 目标及要求

（1）了解图像分割的依据和方法分类；

（2）掌握基于灰度阈值化的图像分割方法；

（3）掌握边缘检测的基本原理，熟悉Roberts、Sobel、Prewitt、LOG、Canny等边缘检测算子；

（4）了解轮廓跟踪的基本方法及步骤；

（5）掌握基于区域生长法、区域分裂与合并法的图像分割方法。

² 作业内容

（1）简述图像分割的依据、分割方法的分类；

（2）分别利用迭代法、Otsu方法确定全局阈值，实现图像的分割；

（3）分别利用Sobel算子、LOG算子、Canny算子进行边缘提取并比较各自的优缺点；

5、数字图像与视频压缩编码原理（6学时）

5.1数字图像与视频压缩编码概述

5.1.1数字图像与视频压缩的必要性和可能性

5.1.2数字图像与视频压缩编码的主要方法及分类

5.2无失真编码

5.2.1游程编码

5.2.2 Huffman编码

5.2.3算术编码

5.3预测编码

5.3.1图像差值信号的统计特性

5.3.2帧内预测编码

5.3.3帧间预测编码

5.4变换编码

5.4.1图像的频域统计特性

5.4.2变换编码的基本原理

5.4.3正交变换基的选择

5.4.4 DCT图像编码

² 目标及要求

（1）熟悉数字图像与视频编码的基本原理及常用方法；

（2）重点掌握霍夫曼（Huffman）编码、算术编码、预测编码和DCT编码的基本原理；

（3）掌握运动估计和运动补偿预测编码的基本原理。

² 作业内容

（1）简述图像压缩的依据、原理、方法及其分类；

（2）利用Huffman编码方法对单符号离散信源进行编码；

（3）利用算术编码方法离散信源符号序列进行无失真信源编码，并比较算术编码和Huffman编码的优缺点；

（4）说明预测编码的原理，并画出DPCM的原理框图；

（5）通过编程，将一幅512´512的256灰度级的图像分成4096个8´8的子块，并对每一块进行DCT变换，保留其中32个较大的变换系数实现2:1的压缩比；通过补零操作以及反变换恢复出512´512的图像，比较此图和原图的视觉质量。

6、数字图像与视频压缩编码标准（6学时）

6.1静止图像的编码标准

6.1.1 JPEG标准概述

6.1.2 JPEG基本编码系统

6.1.3基于DCT的渐进编码

6.1.4分级编码

6.2数字视频编码的标准进化过程

6.3 MPEG-1/MPEG-2视频编码标准

6.3.1 I帧、P帧、B帧

6.3.2时频码流的分层结构

6.3.3 MPEG-1/MPEG-2视频编解码原理

² 目标及要求

（1）掌握JPEG基本系统的编解码原理；

（2）理解MPEG-2视频编码中的“类”和“级”的含义；

（3）理解I帧、P帧、B帧图像的编码特点，熟悉MPEG-2视频码流的分层结构；

² 作业内容

（1）JPEG标准采用了何种压缩算法？画出JPEG算法的原理框图，写出JPEG压缩算法的主要步骤；

（2）解释帧重排的原因；

（3）画出MPEG-1视频编码的原理框图，说明每一模块的功能；

7、数字水印技术（3学时）

7.1数字水印概述

7.1.1数字水印技术产生的背景和应用

7.1.2数字水印的基本特征

7.1.3数字水印系统的组成

7.1.4数字水印的分类

7.2数字图像水印算法

7.2.1最低有效位方法

7.2.2基于DCT域的方法

7.3数字视频水印的嵌入和提取方案

7.3.1基于未压缩的原始视频的水印方案

7.3.2基于视频编码的水印方案

7.3.3基于压缩视频码流的水印方案

² 目标及要求

（1）了解数字水印的基本特征、分类和应用；

（2）掌握水印数字系统的组成，数字水印的嵌入和提取的基本原理；

（3）掌握最低有效位（LSB）法、基于DCT的数字图像水印嵌入和提取算法；

（4）了解数字视频水印的嵌入和提取方案。

² 作业内容

（1）何为数字水印？可分成几类？

（2）简述数字水印的嵌入和提取过程；

（3）通过编程，实现数字图像DCT域水印的嵌入与提取。

8、数字音频压缩编码（3学时）

8.1数字音频编码概述

8.1.1音频信号的分类

8.1.2数字音频压缩编码的原理

8.1.3音频编解码器的性能指标

8.1.4数字音频编码技术的分类

8.2常用数字音频编码技术

8.2.1线性预测编码

8.2.2矢量量化原理

8.2.3 CELP编码

8.2.4感知编码

8.2.5子带编码

8.2.6无损音频编码

8.3 MPEG-1/MPEG-2音频编码标准

8.3.1 MPEG-1音频编码算法的特点

8.3.2 MPEG-2音频编码标准

8.3.3一些其他编码标准

² 目标及要求

（1）掌握数字音频压缩技术的几类方法和压缩编码原理；

（2）掌握线性预测编码、矢量量化、子带编码的原理。

（3）了解MPEG-1，MPEG-2音频编码器的原理

² 作业内容

（1）音频编码技术通常分为哪几类，各有什么优缺点？

（2）音频编解码器的主要性能指标有哪些？这些指标相互之间有何关系？

（3）子带编码的基本思想是什么？进行子带编码有什么好处？

（4）解释矢量量化与标量量化，举例说明；

（5）请说明LPC-10的2.4kbits传输率的组成？

9、语音信号分析（5学时）

9.1语音信号数字化及预处理

9.1.1预滤波及采样量化

9.1.2预处理

9.2时域分析

9.3.1短时能量及短时平均幅度

9.3.2短时过零率

9.3.3短时相关分析

9.3.4短时平均幅度差

9.3频域分析

9.3.1短时傅里叶变换

9.3.2临界频带特征

9.4同态处理

9.4.1同态处理的基本原理

9.4.2复倒谱与倒谱

9.5线性预测分析

9.2.1线性预测基本原理

9.2.2预测参数的求解

9.2.3 LPC谱估计

9.6基音周期估计

9.6.1自相关法

9.6.2平均幅度差函数法

9.6.3倒谱法

9.6.4一些优化方法

² 目标及要求

（1）掌握短时能量、短时过零率、基音频率等特征计算方法；

（2）理解端点检测与基音检测之间的关系。

（3）理解同态滤波与倒谱之间的关系及倒谱计算方法；

（4）理解线性预测方法的原理；

（5）了解基音检测的改善方法。

² 作业内容

（1）已知采样频率，那么基音周期、基音频率与样本点数之间的运算方法？

（2）对语音进行基音检测之前为什么要先做端点检测、加窗分帧处理？

（3）画出一帧语音信号采用短时自相关法进行基音检测的过程，用示意图画出中间状态。

（4）给出统计数据下，各年龄段、性别的人群基音频率的范围，分析产生该分布的原因。

10、音频数字水印技术（3学时）

10.1音频数字水印概述

10.1.1音频数字水印的应用背景

10.1.2音频数字水印方法概述

10.2音频数字水印基本原理

10.2.1音频数字水印的嵌入

10.2.2音频数字水印的提取

10.3几种典型的音频数字水印方法

10.3.1时域音频数字水印方法

10.3.2变换域音频数字水印方法

10.3.3压缩域音频数字水印方法

10.4音频数字水印评价标准

10.4.1感知透明性评价方法

10.4.2鲁棒性评价

10.4.3几种常见音频数字水印攻击

10.5实验示例

10.5.1水印的设计

10.5.2实验方法

10.3.3性能分析

² 目标及要求

（1）掌握数字音频水印嵌入和提取的原理；

（2）了解数字音频水印的应用领域；

（3）掌握LSB的实现原理和方法；

（4）理解变换域和压缩域的方法；

（5）了解音频数字水印的攻击手段；

（6）熟悉音频数字水印的评价标准。

² 作业内容

（1）画出数字音频水印嵌入和提取的原理框图。

（2）简述LSB方法实现音频数字水印的原理，以及该方法的优缺点。

（3）通常数字音频水印的主要性能指标包括哪几方面？指标间是否有关联？

（4）请列举音频数字水印的评价方法。

11、声纹识别方法（3学时）

11.1声纹识别概述

11.1.1什么是声纹识别

11.1.2声纹识别发展现状

11.1.3声纹识别应用

11.2声纹识别基本原理

11.3声纹识别中常用特征

11.3.1语音声纹特征概述

11.3.2线性预测系数（LPC）

11.3.3线性预测倒谱系数（LPCC）

11.3.4线性预测倒谱系数（LPCC）

11.3.5 Mel频率倒谱系数（MFCC）

11.4高斯混合模型

11.4.1高斯混合模型原理

11.4.2基于GMM的声纹识别

² 目标及要求

（1）掌握声纹识别的原理；

（2）了解声纹识别的应用领域；

（3）掌握Mel频率倒谱系数的计算方法；

（4）理解LPC、LPCC的计算方法；

（5）理解高斯混合模型的原理；

（6）掌握声纹识别的实现方案流程。

² 作业内容

（1）什么是声纹识别，声纹识别可以怎样分类？

（2）声纹识别主要有哪些应用？

（3）画出MFCC特征的计算框图。

（4）画出基于高斯模型的声纹识别系统框图。

12、实验(18学时)

序号	项目名称	实验类型	学时分配	每组人数	必修/选修
1	图像增强和图像分割	综合性	9学时	1	必修
3	语音基音检测及应用	综合性	9学时	1	必修

四、教学方法

授课方式：a.理论课（讲授核心内容、总结、按顺序提示今后内容、答疑、公布习题和课外拓展学习等）；b.课后练习（按照理论内容进行）；c.实验环节（根据理论课教学内容，要求学生学会相应的Matlab命令和函数，编写相应的处理程序完成实验任务）；d.办公室时间（学生无需预约，可来教师办公室就课程内、外内容进行讨论）；e.答疑（全部理论课程和实验课程完成后安排1～2次集中答疑，答疑时间不包括在课程学时内，答疑内容包括讲授内容、习题、实验等）；g.期中考查和期末闭卷考试。

课程要求：a.理论课：在理论课讲授环节中，应注意概念讲清讲透，并贯彻理论联系实际的原则，注意学生逻辑思维能力、工程观点和分析与解决问题能力的培养。根据本课程的特点，必须严格要求学生独立完成一定数量的简单算法编程实现；b.实验环节：要求学生学会通过C++或MATLAB编程，完成综合性的多媒体信息处理实验，培养学生独立进行设计和分析问题的能力。

五、考核及成绩评定方式

考核方式：

期中考试：考查；

期末考试：闭卷笔试；

平时成绩：课堂表现及作业；

实验成绩：实验表现和实验结果。

成绩评定方式：期末成绩50%，期中成绩20%，平时成绩10%，实验成绩20%

六、教材及参考书目

教材：

卢官明，焦良葆.多媒体信息处理，邮电出版社，2011

多媒体技术-音频部分讲义（自编，未出版，2016.2）

参考书目：

R.C.Gonzalez, R.E.Woods, Digital Image Processing (2^nded) Prentice Hall, 2002.

R.C.Gonzalez, R.E.Woods,S.L. Eddins, Digital Image Processing Using MATLAB,电子工业出版社，2004.

许录平.数字图像处理，科学出版社，2007.

卢官明，宗昉.数字音频原理及应用（第二版），机械工业出版社，2012

《多媒体技术(含实验)课程》课程教学大纲

《多媒体技术》教学大纲20170525.docx

《多媒体技术(含实验)课程》课程教学大纲

一、 课程性质和教学目标（在人才培养中的地位与性质及主要内容，指明学生需掌握知识与能力及其应达到的水平）

二、 课程目标与毕业要求的对应关系（明确本课程知识与能力重点符合标准哪几条毕业要求指标点）

三、 课程教学内容及学时分配（含课程教学、自学、作业、讨论等内容和要求，指明重点内容和难点内容）（重点内容：«；难点内容：D）

一、课程性质和教学目标（在人才培养中的地位与性质及主要内容，指明学生需掌握知识与能力及其应达到的水平）

二、课程目标与毕业要求的对应关系（明确本课程知识与能力重点符合标准哪几条毕业要求指标点）

三、课程教学内容及学时分配（含课程教学、自学、作业、讨论等内容和要求，指明重点内容和难点内容）（重点内容：«；难点内容：D）