课程信息

《多媒体技术(含实验)课程》课程教学大纲

《多媒体技术》教学大纲20170525.docx

《多媒体技术(含实验)课程》课程教学大纲

课程名称:多媒体技术(含实验)

课程代码:ELIE2008

英文名称:Multimedia Technology

课程性质:(通识、公共、大类等)

学分/学时:

开课学期:6

适用专业:信息工程、通信工程、电子信息工程

先修课程:高等数学、工程数学、信号与线性系统、数字信号处理

后续课程:信息系统综合实验

开课单位:电子信息学院

课程负责人:王加俊

大纲执笔人:王加俊、陈雪勤

大纲审核人:胡剑凌

一、 课程性质和教学目标(在人才培养中的地位与性质及主要内容,指明学生需掌握知识与能力及其应达到的水平)

课程性质:多媒体技术是信息工程的专业必修课、以及通信工程和电子信息工程的专业选修课程,是信号与线性系统、数字信号处理等课程的后续课程。

教学目标:通过本课程的学习,使学生掌握语音、音频、图像以及视频等媒体的基本概念以及利用计算机对语音、音频、图像以及视频进行综合处理和分析的基本技术,了解多媒体信息处理技术的应用和发展概况,进一步培养学生解决多媒体信息的传输和处理中复杂问题的能力。本课程的具体教学目标如下:

(1) 熟悉多媒体及多媒体技术的基本概念及特征;了解声音的基本特性及主观感觉;熟悉音频、图像、视频信号数字化的过程,掌握均匀量化的原理;

(2) 掌握彩色三要素、三基色原理及混色方法等色度学基本知识;理解RGBYUVYIQYCbCrHSI/HSV等颜色空间的表示及转换;熟悉ITU-R BT.601建议的主要内容;掌握Matlab中用于图像处理基本函数的用法。

(3) 掌握数字图像增强的基本方法和技术;掌握二值图像的数学形态学处理的基本原理和常用方法;掌握图像的阈值化分割、边缘检测、区域分割等图像分割方法;掌握数字图像以及视频的无失真编码、预测编码、变换编码的基本原理、了解JPEGMPEG等常用的图像及视频编码标准;掌握数字水印的基本概念、数字图像水印的嵌入与提取方法、了解数字视频水印的嵌入和提取方案。

(4) 熟悉声学基本概念及度量参数;掌握人的三个主观听感要素:响度、音调、音色的概念;熟悉人的听觉特性和语音的发音机理;了解数字音频文件的多种格式,掌握WAVRIFF格式的结构;掌握语音信号时频域声学特征提取方法。

(5) 掌握数字音频压缩技术的原理;掌握线性预测编码、矢量量化、子带编码的原理,了解MPEG音频编码原理;了解基音频率与声调、说话人性别之间的关联;理解数字音频水印的原理,掌握基本的数字音频水印实现方法;理解声纹识别系统中的特征、分类模型的概念,掌握一种声纹识别系统的设计方法。

二、 课程目标与毕业要求的对应关系(明确本课程知识与能力重点符合标准哪几条毕业要求指标点)

毕业要求

指标点

课程目标

1、工程知识

1-2掌握多媒体基础知识,具备对音频/语音、视频/图象进行信号分析与处理能力

教学目标1

2、问题分析

2-3能正确运用多媒体技术原理分析复杂工程问题。

教学目标2

3、设计/开发解决方案

3-1能够综合考虑,形成对复杂问题的设计方案。

教学目标3

三、 课程教学内容及学时分配(含课程教学、自学、作业、讨论等内容和要求,指明重点内容和难点内容)(重点内容:«;难点内容:D

1、多媒体信息处理基础(7学时)

1.1多媒体的基本概念

1.1.1多媒体的基本概念

1.1.2多媒体与多媒体技术

1.2图像信息处理基础

1.2.1光的颜色与彩色三要素

1.2.2三基色的基本原理

1.2.3颜色空间模型及转换关系

1.2.4图像信号的数字化

1.3视频信号的数字化

1.4 Matlab在图像处理中的应用

1.4.1 Matlab简介

1.4.2 Matlab中图像文件的基本操作

1.5声学基础知识

1.5.1声波、声音与声学的基础概念

1.5.2声音的参数与度量

1.5.3室内声学基础

1.5.4人耳的听觉特性

1.5.5声音质量评价方法

1.6音频信号数字化处理

1.6.1音频信号的数字化

1.6.2过采样与噪声整形

1.6.3数字音频文件格式

1.6.4数字音频编辑软件

² 目标及要求

1)熟悉多媒体及多媒体技术的基本概念及特征。

2)了解声音的基本特性及主观感觉。

3)熟悉音频、图像、视频信号数字化的过程,掌握均匀量化的原理。

4)掌握彩色三要素、三基色原理及混色方法等色度学基本知识。

5)理解RGBYUVYIQYCbCrHSI/HSV等颜色空间的表示及转换。

6)熟悉ITU-R BT.601建议的主要内容。

7)了解MATLAB在图像处理和分析领域的应用。

8)熟悉声学基本概念及度量参数。

9)掌握人的三个主观听感要素:响度、音调、音色的概念。

(10)了解影响室内声学环境的因素以及混响的作用。

11)掌握人耳听觉范围和听觉掩蔽效应,了解听觉延时效应和双耳效应。

(12)熟悉评价声音质量的主客观指标。

13)熟悉资源交换文件格式RIFF的结构和WAV文件格式的基本结构,了解mp3/midi/ra/rm/wma/ape/au等音频文件格式。

(14)熟悉数字音频编辑软件如:cooledit/audition等的使用方法。

² 作业内容

1)媒体的概念与分类;

2)多媒体技术的基本概念及特征;

3)彩色三要素的物理含义,RGBHIS如何对颜色进行描述?

4)编写程序实现RGBHIS之间的转换;

5)复合数字编码与分量数字编码的基本原理及其优缺点;

6ITU-R BT.601建议的主要内容有哪些?有何实际意义?

7)人耳的听觉范围及等响度曲线的特点?

8)人耳区别不同人声及各类乐器依据的主要参量?

9)描述听觉掩蔽效应,思考听觉掩蔽效应的应用。

10)说明音频信号数字化的三个主要步骤及其功能。

11)过采样以及噪声整形技术为什么可以提高A/D转换器精度?

2、图像增强(6学时)

2.1引言

2.2图像的灰度变换

2.2.1灰度的线性变换

2.2.2灰度的非线性变换

2.2.3直方图均衡化

2.2.4直方图的规定化

2.3图像平滑

2.3.1模板操作和卷积运算

2.3.2邻域平均法

2.3.3中值滤波

2.3.4频域低通滤波

2.4图像锐化

2.4.1梯度算子

2.4.2 Sobel算子

2.4.3 Laplacian算子

2.4.4频域高通滤波

2.5图像的同态滤波

2.6伪彩色增强

² 目标及要求

1掌握数字图像增强的基本方法和技术;

2)掌握数字图像灰度的线性与非线性变换的方法及应用;

3)熟悉直方图均衡化、直方图规定化的步骤;

4)掌握图像平滑的基本方法,如邻域平均法、中值滤波法、低通滤波;

5)掌握图像锐化的基本方法,如梯度运算、Sobel算子、拉普拉斯算子、高通滤波;

6)了解图像的同态滤波;

7)了解伪彩色增强、假彩色增强的基本方法。

² 作业内容

1)图像增强的目的;

2)利用线性变换实现灰度动态范围的拉伸或压缩;

3)利用灰度直方图的均衡化和规定化技术实现图像增强;

4)图像的平均值滤波、中值滤波的适用范围有何区别、分别利用这两种滤波器进行图像去噪处理;

5)利用一阶微分算子对图像进行锐化处理;

6)利用同态滤波对图像进行对比度增强处理;

7)利用灰度分层法或灰度变换法将一幅灰度图像转换成彩色图像。

3、形态学图像处理(6学时)

3.1引言

3.1.1数学形态学的基本思想

3.1.2集合论基础

3.1.3数学形态学中的几个基本概念

3.2二值形态学基本运算

3.2.1腐蚀

3.2.2膨胀

3.2.3腐蚀与膨胀的对偶性

3.2.4开运算

3.2.5闭运算

3.3二值图像的形态学处理

3.3.1边缘提取

3.3.2区域填充

3.3.3骨架提取

3.3.4细化

3.3.5粗化

3.3.6形态学滤波

² 目标及要求

1)了解数学形态学的基本思想;

2)熟悉集合和子集的概念及表示方法,掌握集合间的关系及并、交、补、差等运算;

3)理解数学形态学中结构元素的概念及作用;

4)掌握膨胀、腐蚀、开、闭运算的物理含义,以及由上述各种基本运算导出的各种二值图像形态学处理算法。

² 作业内容

1)说明二值膨胀、腐蚀运算对图像处理的作用和特点,并通过编程实现之;

2)说明二值开、闭运算对图像处理的作用和特点,并通过编程实现之;

3利用形态学处理实现二值图像的骨架化;

4)利用形态学处理提取二值图像的内、外、形态学边缘;

1)利用形态学滤波实现图像的细化、粗化、以及区域的填充处理。

4、图像分割(6学时)

4.1图像分割的概念及分类

4.1.1图像分割的概念

4.1.2图像分割的依据和方法分类

4.2基于灰度阈值化的图像分割

4.2.1阈值化分割的原理

4.2.2全局阈值化分割

4.2.3局部阈值分割法

4.3基于边缘检测的图像分割

4.3.1边缘检测的基本原理和步骤

4.3.2梯度算子

4.3.3 Laplacian算子和LOG算子

4.3.4 Canny算子

4.4基于区域的图像分割

4.4.1区域生长法

4.4.2区域的分裂与合并法

² 目标及要求

1)了解图像分割的依据和方法分类;

2)掌握基于灰度阈值化的图像分割方法;

3)掌握边缘检测的基本原理,熟悉RobertsSobelPrewittLOGCanny等边缘检测算子;

4)了解轮廓跟踪的基本方法及步骤;

5)掌握基于区域生长法、区域分裂与合并法的图像分割方法。

² 作业内容

1)简述图像分割的依据、分割方法的分类;

2)分别利用迭代法、Otsu方法确定全局阈值,实现图像的分割;

3)分别利用Sobel算子、LOG算子、Canny算子进行边缘提取并比较各自的优缺点;

5、数字图像与视频压缩编码原理(6学时)

5.1数字图像与视频压缩编码概述

5.1.1数字图像与视频压缩的必要性和可能性

5.1.2数字图像与视频压缩编码的主要方法及分类

5.2无失真编码

5.2.1游程编码

5.2.2 Huffman编码

5.2.3算术编码

5.3预测编码

5.3.1图像差值信号的统计特性

5.3.2帧内预测编码

5.3.3帧间预测编码

5.4变换编码

5.4.1图像的频域统计特性

5.4.2变换编码的基本原理

5.4.3正交变换基的选择

5.4.4 DCT图像编码

² 目标及要求

1熟悉数字图像与视频编码的基本原理及常用方法;

2重点掌握霍夫曼(Huffman)编码、算术编码、预测编码和DCT编码的基本原理;

3掌握运动估计和运动补偿预测编码的基本原理。

² 作业内容

1)简述图像压缩的依据、原理、方法及其分类;

2)利用Huffman编码方法对单符号离散信源进行编码;

3)利用算术编码方法离散信源符号序列进行无失真信源编码,并比较算术编码和Huffman编码的优缺点;

4)说明预测编码的原理,并画出DPCM的原理框图;

5)通过编程,将一幅512´512256灰度级的图像分成40968´8的子块,并对每一块进行DCT变换,保留其中32个较大的变换系数实现2:1的压缩比;通过补零操作以及反变换恢复出512´512的图像,比较此图和原图的视觉质量。

6、数字图像与视频压缩编码标准(6学时)

6.1静止图像的编码标准

6.1.1 JPEG标准概述

6.1.2 JPEG基本编码系统

6.1.3基于DCT的渐进编码

6.1.4分级编码

6.2数字视频编码的标准进化过程

6.3 MPEG-1/MPEG-2视频编码标准

6.3.1 I帧、P帧、B

6.3.2时频码流的分层结构

6.3.3 MPEG-1/MPEG-2视频编解码原理

² 目标及要求

1)掌握JPEG基本系统的编解码原理;

2)理解MPEG-2视频编码中的“类”和“级”的含义;

3)理解I帧、P帧、B帧图像的编码特点,熟悉MPEG-2视频码流的分层结构;

² 作业内容

1JPEG标准采用了何种压缩算法?画出JPEG算法的原理框图,写出JPEG压缩算法的主要步骤;

2)解释帧重排的原因;

3)画出MPEG-1视频编码的原理框图,说明每一模块的功能;

7、数字水印技术(3学时)

7.1数字水印概述

7.1.1数字水印技术产生的背景和应用

7.1.2数字水印的基本特征

7.1.3数字水印系统的组成

7.1.4数字水印的分类

7.2数字图像水印算法

7.2.1最低有效位方法

7.2.2基于DCT域的方法

7.3数字视频水印的嵌入和提取方案

7.3.1基于未压缩的原始视频的水印方案

7.3.2基于视频编码的水印方案

7.3.3基于压缩视频码流的水印方案

² 目标及要求

1)了解数字水印的基本特征、分类和应用;

2)掌握水印数字系统的组成,数字水印的嵌入和提取的基本原理;

3)掌握最低有效位(LSB)法、基于DCT的数字图像水印嵌入和提取算法;

4)了解数字视频水印的嵌入和提取方案。

² 作业内容

1何为数字水印?可分成几类?

2)简述数字水印的嵌入和提取过程;

3)通过编程,实现数字图像DCT域水印的嵌入与提取。

8、数字音频压缩编码(3学时)

8.1数字音频编码概述

8.1.1音频信号的分类

8.1.2数字音频压缩编码的原理

8.1.3音频编解码器的性能指标

8.1.4数字音频编码技术的分类

8.2常用数字音频编码技术

8.2.1线性预测编码

8.2.2矢量量化原理

8.2.3 CELP编码

8.2.4感知编码

8.2.5子带编码

8.2.6无损音频编码

8.3 MPEG-1/MPEG-2音频编码标准

8.3.1 MPEG-1音频编码算法的特点

8.3.2 MPEG-2音频编码标准

8.3.3一些其他编码标准

² 目标及要求

1)掌握数字音频压缩技术的几类方法和压缩编码原理;

2)掌握线性预测编码、矢量量化、子带编码的原理。

3)了解MPEG-1MPEG-2音频编码器的原理

² 作业内容

1)音频编码技术通常分为哪几类,各有什么优缺点?

2)音频编解码器的主要性能指标有哪些?这些指标相互之间有何关系?

3)子带编码的基本思想是什么?进行子带编码有什么好处?

4)解释矢量量化与标量量化,举例说明;

5)请说明LPC-102.4kbits传输率的组成?

9、语音信号分析(5学时)

9.1语音信号数字化及预处理

9.1.1预滤波及采样量化

9.1.2预处理

9.2时域分析

9.3.1短时能量及短时平均幅度

9.3.2短时过零率

9.3.3短时相关分析

9.3.4短时平均幅度差

9.3频域分析

9.3.1短时傅里叶变换

9.3.2临界频带特征

9.4同态处理

9.4.1同态处理的基本原理

9.4.2复倒谱与倒谱

9.5线性预测分析

9.2.1线性预测基本原理

9.2.2预测参数的求解

9.2.3 LPC谱估计

9.6基音周期估计

9.6.1自相关法

9.6.2平均幅度差函数法

9.6.3倒谱法

9.6.4一些优化方法

² 目标及要求

1)掌握短时能量、短时过零率、基音频率等特征计算方法;

2)理解端点检测与基音检测之间的关系。

3)理解同态滤波与倒谱之间的关系及倒谱计算方法;

4)理解线性预测方法的原理;

5)了解基音检测的改善方法。

² 作业内容

1)已知采样频率,那么基音周期、基音频率与样本点数之间的运算方法?

2)对语音进行基音检测之前为什么要先做端点检测、加窗分帧处理?

3)画出一帧语音信号采用短时自相关法进行基音检测的过程,用示意图画出中间状态。

4)给出统计数据下,各年龄段、性别的人群基音频率的范围,分析产生该分布的原因。

10、音频数字水印技术(3学时)

10.1音频数字水印概述

10.1.1音频数字水印的应用背景

10.1.2音频数字水印方法概述

10.2音频数字水印基本原理

10.2.1音频数字水印的嵌入

10.2.2音频数字水印的提取

10.3几种典型的音频数字水印方法

10.3.1时域音频数字水印方法

10.3.2变换域音频数字水印方法

10.3.3压缩域音频数字水印方法

10.4音频数字水印评价标准

10.4.1感知透明性评价方法

10.4.2鲁棒性评价

10.4.3几种常见音频数字水印攻击

10.5实验示例

10.5.1水印的设计

10.5.2实验方法

10.3.3性能分析

² 目标及要求

1)掌握数字音频水印嵌入和提取的原理;

2)了解数字音频水印的应用领域;

3)掌握LSB的实现原理和方法;

4)理解变换域和压缩域的方法;

5)了解音频数字水印的攻击手段;

6)熟悉音频数字水印的评价标准。

² 作业内容

1)画出数字音频水印嵌入和提取的原理框图。

2)简述LSB方法实现音频数字水印的原理,以及该方法的优缺点。

3)通常数字音频水印的主要性能指标包括哪几方面?指标间是否有关联?

4)请列举音频数字水印的评价方法。

11、声纹识别方法(3学时)

11.1声纹识别概述

11.1.1什么是声纹识别

11.1.2声纹识别发展现状

11.1.3声纹识别应用

11.2声纹识别基本原理

11.3声纹识别中常用特征

11.3.1语音声纹特征概述

11.3.2线性预测系数(LPC

11.3.3线性预测倒谱系数(LPCC

11.3.4线性预测倒谱系数(LPCC

11.3.5 Mel频率倒谱系数(MFCC

11.4高斯混合模型

11.4.1高斯混合模型原理

11.4.2基于GMM的声纹识别

² 目标及要求

1)掌握声纹识别的原理;

2)了解声纹识别的应用领域;

3)掌握Mel频率倒谱系数的计算方法;

4)理解LPCLPCC的计算方法;

5)理解高斯混合模型的原理;

6)掌握声纹识别的实现方案流程。

² 作业内容

1)什么是声纹识别,声纹识别可以怎样分类?

2)声纹识别主要有哪些应用?

3)画出MFCC特征的计算框图。

4)画出基于高斯模型的声纹识别系统框图。

12、实验(18学时)

序号

项目名称

实验类型

学时分配

每组人数

必修/选修

1

图像增强和图像分割

综合性

9学时

1

必修

3

语音基音检测及应用

综合性

9学时

1

必修

四、教学方法

授课方式:a.理论课(讲授核心内容、总结、按顺序提示今后内容、答疑、公布习题和课外拓展学习等);b.课后练习(按照理论内容进行);c.实验环节(根据理论课教学内容,要求学生学会相应的Matlab命令和函数,编写相应的处理程序完成实验任务);d.办公室时间(学生无需预约,可来教师办公室就课程内、外内容进行讨论);e.答疑(全部理论课程和实验课程完成后安排12次集中答疑,答疑时间不包括在课程学时内,答疑内容包括讲授内容、习题、实验等);g.期中考查和期末闭卷考试。

课程要求:a.理论课:在理论课讲授环节中,应注意概念讲清讲透,并贯彻理论联系实际的原则,注意学生逻辑思维能力、工程观点和分析与解决问题能力的培养。根据本课程的特点,必须严格要求学生独立完成一定数量的简单算法编程实现;b.实验环节:要求学生学会通过C++MATLAB编程,完成综合性的多媒体信息处理实验,培养学生独立进行设计和分析问题的能力。

五、考核及成绩评定方式

考核方式

期中考试:考查;

期末考试:闭卷笔试;

平时成绩:课堂表现及作业;

实验成绩:实验表现和实验结果。

成绩评定方式:期末成绩50%,期中成绩20%,平时成绩10%,实验成绩20%

六、教材及参考书目

教材:

卢官明,焦良葆.多媒体信息处理,邮电出版社,2011

多媒体技术-音频部分讲义(自编,未出版,2016.2

参考书目:

R.C.Gonzalez, R.E.Woods, Digital Image Processing (2nded) Prentice Hall, 2002.

R.C.Gonzalez, R.E.Woods,S.L. Eddins, Digital Image Processing Using MATLAB,电子工业出版社,2004.

许录平.数字图像处理,科学出版社,2007.

卢官明,宗昉.数字音频原理及应用(第二版),机械工业出版社,2012


www.优德88.cpm 电子信息学院版权所有 CopyRight© 2017
苏州市十梓街1号(215006) 电话(传真): 0512-67871211