当前位置:文档之家› 多媒体技术及应用

多媒体技术及应用

第一章绪论

1.1 多媒体技术的基本概念

?媒体——信息表示和传输的载体。

媒体的分类:感觉媒体、表示媒体、表现媒体(显现媒体)、存储媒体、传输媒体

从人类感受信息的感觉器官角度来看,媒体可划分为视觉类、听觉类、触觉类和其他感觉类等几大类。

?感觉媒体(Perception Medium):人们的感觉器官能感觉到的信息的自然种类,如人类的语言、音乐,自然界的各种声音、图形图像等。

?表示媒体(Representation Medium):是为了加工、处理和传输感觉媒体而人为研究、构造出来的媒体,用以定义信息的特性。表示媒体以语音编码、图像编码和文本编码等形式来描述。

?显现媒体(Presentation Medium):指感觉媒体与电信号间相互转换用的一类媒体,即显现信息或获取信息的物理设备。如显示器、扬声器、打印机等输出类显现媒体,以及键盘、鼠标器、扫描仪、话筒和摄像机等输入类显现媒体。

?存储媒体(Storage Medium):只存储表示媒体数据(感觉媒体数字化后的代码)的物理设备,如光盘、磁盘、磁带等。

?传输媒体(Transmission Medium):指媒体传输用的异类物理载体,如同轴电缆、光缆、双绞线、无线电链路等。

多媒体技术——计算机交互式综合处理文本、图形、图像、声音和动画等多种媒体信息,使多种信息建立逻辑关系,集成为一个系统并具有交互性。

?多媒体技术特点:信息载体的多样性、集成性、实时性、交互性、数字化

?多媒体技术是一门综合的高新技术,它是微电子技术、计算机技术、通信技术等相关学科综合发展的产物。

?多媒体系统是一种趋于人性化的多维信息处理系统,它以计算机系统为核心,利用多媒体技术实现多媒体信息的采集、压缩编码、实时处理、存储、传输、解压缩、还原输出等综合处理能力,并提供友好的人际交互方式。

?具备多媒体信息处理能力的计算机被称为多媒体计算机。

多媒体信息在计算机中的基本形式:

?文本、图形、图像、动画、视频、音频

多媒体信息的组织方式:

?顺序文本

?超文本?超媒体

1.2 多媒体技术的产生与发展

1.2.1 多媒体计算机技术的发展历程

?启蒙发展阶段

?多媒体计算机技术最早起源于20世纪80年代中期。?1984年Apple公司研制Macintosh计算机,创造性使用了位映射(bitmap)、窗口(window)、图符(icon)

等技术,增加了图形处理功能,改善了人机交互界面,

方便了用户的操作。

?1985年,Microsoft公司推出了Windows,它是一个多任务的图形操作系统。

?1985年,计算机Amiga系统。

?1986年,荷兰Philips公司和日本Sony公司联合推出CD-I,同时公布该系统所采用的CD-ROM光盘的数据格式,这项技术对大容量存储设备光盘的发展产生了巨大的影响。

?1983年,开始研制交互式数字视频系统DVI。

?标准化阶段

?1990年10月,在微软公司召开多媒体开发工作者会议上提出MPC1.0标准,开始对多媒体计算机的软硬件系统的配置做出基本要求。

?1993年由IBM、Intel等数十家软硬件公司组成的多媒体个人计算机市场协会发布了多媒体个人机的性能标准MPC 2.0。

?1995年6月,该协会又宣布了新的多媒体个人机技术规范MPC 3.0。

?一些国际标准化组织还制定了一些与多媒体技术相关的一些国际标准。多灰度静态图像的数字压缩编码标准JPEG于1986年正式开始制订,1992年7月2日表决通过标准的第一部分。

?为了弥补传统JPEG压缩技术缺陷而制定的JPEG 2000标准的编码算法在2000年3月的东京会议被确定。

?第一个实用化的、适应于会议电视和可视电话要求的

H.261标准1984年提出。活动图像的编码压缩标准

?MPEG-1于1993年公布;

?1994年发表了MPEG-2标准, 该标准向下兼容MPEG-1, 向上兼容HDTV的图像质量;

?1999年公布了MPEG-4标准。

?另外,还有一些新的标准不断的被制定、发布和应用,如MPEG-7、MPEG-21标准等。这些标准基本上都得到了广泛的应用,极大的促进了多媒体技术的普及应用。

1.2.2 研究意义

?满足了人类信息交流的要求。

?多媒体技术的引入使各种信息系统提高了工作效率。多媒体技术应用

?教育和培训

?咨询和演示

?娱乐和游戏

?管理信息系统(MIS)

?视频会议系统

?计算机支持协同工作(CSCW)(如远程会诊系统、远程报纸共编系统)

?视频服务系统(如视频点播、视频购物等)

发展前景

?家庭教育和个人娱乐是目前国际多媒体市场的主流。

?销售、演示和MIS是多媒体技术应用的重要方面。

?多媒体通信和分布式多媒体系统是多媒体技术今后的发展方向。

?从长远观点来看,进一步提高多媒体计算机系统的智能性是不变的主题

1.3 多媒体技术研究的主要内容

?版本一:

?多媒体数据压缩/ 解压算法的研究

?多媒体信息存储技术

?多媒体网络通信技术

?多媒体专用芯片技术

?多媒体人机交互技术

?多媒体软件技术

1.3 多媒体技术研究的主要内容

?版本二:

?多媒体技术基础:媒体的基本特性和多媒体数据压缩/ 解压算法的研究

?多媒体软硬件平台技术

?多媒体操作系统技术

?多媒体信息管理技术:超媒体和多媒体数据库

?多媒体通信与分布应用技术

1.3 多媒体技术研究的主要内容

?版本三:

?媒体的基本特性和多媒体数据压缩/解压算法的研究?多媒体数据存储技术

?多媒体计算机硬件平台

?多媒体计算机软件平台

?多媒体开发和创作工具

?多媒体数据库

?超文本和超媒体

?多媒体通信与分布式多媒体系统

?多媒体操作系统技术

?多媒体的基础技术+多媒体信息处理技术

?从应用功能层面看

?从系统性能的层面看

数据压缩编码与解压缩技术是多媒体技术的关键技术第二章多媒体教学系统

2.1多媒体网络教室●功能

●分类

●硬件构成

功能

自由练习、视听教学、集体讨论、学生示范、个别辅导、语音教学、语音自学、双向对讲、电子白板、教学管理、操作控制、清除举手、黑屏解除、查看学生、自动查看、学生分组、网络考试、黑屏

★屏幕广播

将教师终端的屏幕内容实时传播给全部或部分学生终端屏幕上,并可在广播屏幕图象时实时广播教师的语音。方便的电子教鞭使教师的讲课更为生动;

★转播屏幕

可将某一学生终端的屏幕内容广播给其他学生观看,起到学生操作示范的作用。在转播学生屏幕的同时,可允许教师讲解或示范学生作讲解;

★屏幕监看

教师终端可随时监看学生终端的屏幕内容及操作。教师可同时监看4个学生终端或全屏清晰地监看某一学生;

★遥控辅导

教师终端屏幕显示远程学生终端的屏幕内容,并可直接远程控制学生终端,可给具体学生"手把手"地教学辅导;

★语音教学

将教师的语音或教师终端的多媒体音频实时传送到一个、多个或全部学生终端上播放,真正实现多媒体教室的教学效果;

★师生对讲

在教师和某一具体学生之间彼此通过语音来对讲交流,彼此均可在讲话的同时收听对方的发言;

★课堂讨论

对在线的学生可进行全体讨论或分组讨论,在全体讨论中可进行文字的讨论,同时教师可以语音提问,学生也可用语音回答和发言;

★文件传输

文件传输提供点对点式的FTP传输和文件分发两种方式的文件传输处理。教师可查看具体学生机上的所有文件,并可上传、下载、运行或删除学生机上的文件。文件分发可将教师机上的一个或同个文件同时分发给在线的全体或部分学生终端;

★网上影院

实时广播教师终端上的视频,如MPEG、VCD或教学演示光盘等,并可对视频进行相关控制,使部分或全体学生终端上实时同步播放视频和音频。

★网上消息

教师终端可给本课堂的部分或全体学生发送简短文字消息,给学生以简明的实时提醒。学生也可给教师发送问题或消息,并可查看教师曾发送过来的信息;★远程命令

教师可向学生终端发送黑屏锁定、远程复位、关闭计算机等命令,并可以让全体学生同时运行应用程序,如计算器、写字板、Winword等;

★远程配置

教师终端可以查看学生机的相关配置信息,如磁盘空间、内存、操作系统等,并可以统一配置学生机的使用权限、屏幕分辨率等设置。

分类

●纯软件方式

●软硬件结合方式

●纯硬件方式

一般系统硬件构成

●工作站计算机

●服务器计算机

●连网硬件

●多媒体网络教学系统

多媒体网络教室的逻辑构成

●计算机网络系统

●教学支持系统

?核心控制系统

?网络教学管理系统

●教学资源系统

●优点:

可使用交互性的CAI软件,能进行个别化学习,对环境要求不高,视觉效果好,可同时兼顾计算机教学、语音教学和CAI教学,设备利用率高,成本低。

●缺点:

结合黑板等常规教学手段比较困难,课堂纪律不好控制,另外在多媒体网络教室中,学生人数受计算机数量限制,当学生数量多于计算机数量时,教学效果将受影响。

常见多媒体网络教室系统

●HiClass多媒体教学系统●苦丁香多媒体教育网LS-MENet

●金山顶尖多媒体视听教学系统

●鹏博士多媒体辅助教学系统

●巨龙TOP98 HARD多媒体教学网

●WinSchool多媒体电脑教学系统

2.2多功能教室

1、系统功能

2、系统组成

3、优点和缺点

1、系统功能

●将计算机显示的高分辨率图形界面及视频设备播放的图像信号,投至大屏幕上,便于教师演示和讲解。

●无需前期制作,便可以将课件、文稿、图片、照片、书写胶片及立体实物等转换成高清晰度图像、投影至大屏幕上。

●可利用因特网进行现场教学,也能将该系统的教学实况通过网络实现远距离教学。

●可与有线电视网相连,接受有线电视网传送的电视教学节目及其他节目。

●可快速、直观教授实验、实现操作全过程。

●可同期录制教学全过程,用于制作教学片、课后讲评及教学交流。

●系统操作简单,使用者不需经过专业培训即能使用。

2、系统组成

●中央控制系统

●投影设备

●视频展示设备

●多媒体计算机

●视音频设备

●音响设备

视频展示台的工作原理

视频展示台的使用

视频展示台的使用1

视频展示台的使用2

视频展示台的使用3

教学银幕

(按银幕的材料分)

白布幕

木板幕

玻璃微珠幕

布基白塑幕

玻璃微珠定向幕

投射式银幕

金属银幕

教学银幕的使用

银幕距第一排学生的距离应为银幕宽度的1.3--1.5倍太近会使视者感觉画面不清晰,不稳定,容易产生疲劳 银幕距最后一排学生的距离应为银幕宽度的5倍,否则,视者不容易观察分析图像的细部,也容易产生疲劳 第一排最后边缘学生至银幕远边的视线与幕面的视角不应小于45度

幻灯投影设备之光轴与银幕中垂线的夹角应小于12度,否则图象会产生明显的梯形失真

银幕使用过程中要注意爱护,防止灰尘,污物,防止高温和受潮,防止暴晒,防止碰伤划伤

投影机

●CRT(Cathode Ray Tube)是阴极射线管。是应用较为广泛的一种显示技术。通常所说的三枪投影机就是由三个CRT投影管组成的投影机。CRT投影机显示的图像色彩丰富,还原性好,具有丰富的几何失真调整能力;缺点是亮度很低,操作复杂,体积庞大,对安装环境要求较高,并且价格昂贵,目前已经基本退出市场。

●LCD( Liquid Crystal Display)投影机是目前投影机市场上的主要产品。液晶是介于液体和固体之间的物质,本身不发光,工作性质受温度影响很大,其工作温度为-55度——+77度。投影机利用液晶的光电效应,即液晶分子的排列在电场作用下发生变化,影响其液晶单元的透光率或反射率,从而影响它的光学性质,产生具有不同灰度层次及颜色的图像。LCD投影机色彩还原较好、分辨率可达SXGA标准,体积小,重量轻,操作、携带极其方便,并且价格比较低廉,因此成为投影机市场上的主要产品。

●DLP(Digital Light Processor)数码光路处理器。DLP 投影机以DMD(Digital Micormirror Device)数字微镜作为成像器件。DLP投影机的技术是一种反射式投影技术。其特点是图像灰度等级提高,成像器件的总光效率大大提高,对比度非常出色,色彩锐利。缺点是目前DLP投影机的分辨率还难以做到XGA标准,图象均匀度有待提高,色彩略有偏差,技术有待进一步成熟小型液晶投影系统

小型液晶投影系统

小型液晶投影系统

优点:

●可以和各种视频设备组合,使用灵活

●高亮度、高色彩、高清晰度的投影效果

缺点:

●设备昂贵

●需要使用者掌握一定的操作技术:系统比起投影机、幻灯机结构复杂。

●不利于提供声音材料:小型液晶投影系统只能提供视觉信息

3、优点和缺点

●优点:适合使用演示性的CAI课件,能同时结合常规教学手段进行教学,对学生数量没有太大的限制,加之它还有具有其他功能,应用较广。

●缺点:比较难于体现新的教学思想,投影仪价格比较高。

2.3 微格教学系统

●①微格教室。现在一般配有多媒体计算机、视频展示台、话筒、摄像机、电视机。话筒和摄像机用来拾取模拟教师的声音和教学活动形象,如有条件,还可用另一台摄像机用来拾取模拟学生的学习反应情况。室内还设置一台电视机用来重放已记录的教学过程数字视频或录像,供同学们进行评价分析。多媒体计算机与视频展示台、话筒、摄像机、电视机相连,在多媒体计算机上通过相应管理系统控制管理这些设备。话筒和摄像机拾取的数据可直接以数字化视频的形式存储在计算机中。

●②控制室。一般配有多媒体计算机、视频采集卡、视频分配器、监视器等设备。从每间微格教室送来的模拟教师、模拟学生教学活动的两路视频信号一路经视频采集卡采集存储在控制室的中心计算机中,另一路则可经视频分配器把教学实况信号直接送到观摩室,供同步评述分析。

●③观摩室。装有电视机的普通电教室。把控制室中经视频切换器选择后的视频信号送到电视机上,即可实行同步播放教学实习的实况,供指导教师现场评述,使较多的学生观摩分析。

●④示范室。与各间微格教室、控制室组成一个闭路电视双向传播系统。在示范室可以选择收看任一间微格教室的教学训练活动的实况;也可以将示范室的教学活动情况同步传输到各间微格教室;示范室还可以作为学校闭路电视台的演播室,摄制新闻节目、教育

节目、艺术节目、采访节目、知识竞赛节目等。1.系统功能

①分组训练。

将师范生分组,到各自的微格教室,扮演各自的角色:模拟教师或模拟学生。

②交互学习。

小组与小组之间相互学习、讨论。

③示范教学。

在开展微格教学前,指导教师可在示范室播放、分析教学技能训练、模拟教学、优秀教师课堂教学视频,为受训学生提供典型示范。

③讲评教学。

教学训练操作完成后,指导教师与受训学生(模拟师生)一起在示范室内观看教学训练视频,指导教师对受训学生的教学技能进行分析、评价。

教学应用

●基本技能训练

●教育技术基本技能训练

●信息技术与课堂教学的整合训练

●基于探究式学习、发现式学习、协作化学习等新的教学模式的教学组织技能训练。

●用作视频直播教室

●其他应用

主要设备配置

●摄像头、摄像机及全方位云台

●拾音头

●音视频矩阵切换主机及节目编辑机、特技机

●其它设备

第三章多媒体硬件环境

3.1 光存储设备

3.2 音频接口

3.3 视频接口

3.4 多媒体I/O设备

●CD-DA 存放数字化的音乐节目

●CD-G 存放静止图像和音乐节目,用于存储卡拉OK 静止画面

●CD-V 存放模拟的电视图像和数字化的声音

●CD-ROM 存放数字化的文、图、声、象等

●CD-I 存放数字化的文、图、声、象(静止的)、动画等

●CD-I FMV 存放数字化的电影、电视等节目

●卡拉OK CD 存放数字化的卡拉OK节目

●Video CD 存放数字化的电影、电视等节目

●Photo-CD 存放的主要是照片、艺术品●Photo CD格式

柯达公司的相片图形影像专用格式,它也适合于数字音频。

●Karaoke CD格式

由日本的JVC公司于1992年开发而成,用以同光锋的激光唱盘卡拉OK播放器竞争,而后者曾垄断了亚洲市场。

●CD-V(CD-Video)的视频信号可直接输入给电视机●CD-G(CD-Graphic)用于存储卡拉OK静止画面

●Video CD格式

JVC公司-Philips联合采用的Karaoke CD格式(主要用于卡拉OK),用于提供动态控制功能,与VCR上所采用的功能一样,也称为白皮书视频。Video CD有三个标准,Video CD 1.0、Video CD 1.1 、Video CD 2.0。Video CD 2.0增加了两个主要功能,即节目菜单和播放高清晰度静止画面。

●CVD称为中国数字视频标准,主要采用了MPEG-2压缩技术(事实上CVD的图像质量要略低于MPEG-2标准)、变速率VRB编码技术、高清晰度图形字幕技术和多伴音技术。CVD在物理上与VCD没有本质的区别。

●SVCD(Super VCD)由我国原电子工业部提出,中国录制化标准委员会联合国内外著名公司及有关专家共同研制开发,基本要求是中国版权、国际标准。采用MPEG-2编码技术,是VCD、CVD的更新换代产品,其突出优点是图像水平清晰度从VCD的250线提高到350线,但光盘的存储时间从VCD的74分下降到了45分。

CD盘片的结构

CD盘片的结构

CD盘的光道结构

原版盘制作示意图

V-CD盘的整个制作过程

光学读出头的基本结构

CD盘的读出原理

DVD盘和CD盘之间的差别

单面单层光盘的结构

EVD和HDV

●EVD全称为新一代高密度数字激光视盘系统,与DVD及超级VCD相比较,技术优势明显,填补了国内高清晰度节目光盘存储播放方面的空白。2001年底,EVD通过信产部的技术鉴定,该技术标准由阜国电子主导开发。

●HVD由中关村高新技术企业凯诚高清电子技术公司研制出的、具有自主知识产权的高科技产品,不仅

能播放高清晰度数字节目,还能上网、游戏和进行文字处理。

●根据有机染料层的颜色及反射层材料的不同,CD-R 光盘有白金盘、金盘、钻石盘、蓝盘和绿盘之分。从特性上来说,白金盘具有较好的兼容性,低速到高速的刻录机都适用,另外价格很便宜;蓝盘在写入和读取数据时有较高的准确性;金盘有较好的抗光性。钻石盘有最高的认盘和读取速度,但要高速的刻录机方能很好的使用。

●CD-R光盘刻录格式

●ISO9660规范

●多段Photo CD

●混合模式与特殊模式CD规范

●通用光盘格式UDF规范

IS09660标准

IS09660标准,又称High Sierra标准。名称是―信息处理:CD-ROM信息交换的卷结构和文件结构―。该标准的要点包括:

●以黄皮书标准定义的物理格式为基础;

●利用CD-ROM的只读特性;

●尽量减少读取信息的搜索次数;

●适用于所有的操作系统;

●保证适用于所有的符号设备,包括日文、中文等;标准将可扩展到WORM(Write Once-Read Many)和可重写介质。

3.2 音频接口

典型音频卡的平面图

音频卡的接口

音频卡主要功能

●音频的录制:Speak in(麦克风)、Line in(立体声线路输入)

●播放:Line out、Speak out接音箱

●编辑与合成:剪辑和特殊效果处理

●MIDI:乐器数字接口。规定了计算机音乐程序、电子合成器和其它电子设备之间交换信息与控制信号的方法。通过软件,计算机可以直接对外部电子乐器进行控制和操作。

音乐合成功能和性能依赖于合成芯片。

合成方法:调频(FM)方式、波表(软波表或硬波表)。

●文语转换和语音识别:使用软件把计算机内的文本转换成声音和识别语音。

●CD-ROM接口:与CD-ROM音频输出相接可播放CD。CD-ROM接口提供了从CD-ROM的CD-DA的输出信号到声卡音源输入的通路,CD-ROM播放CD唱盘的音频时,将音频信号直接通过声卡的功放送到扬声器,通过调节声卡的音量控制,即可控制CD唱盘的音量。

●游戏接口:接游戏柄或电子乐器设备

●核心:DSP(数字声音处理器)、FM音乐合成器及MIDI控制器

●总线接口:ISA、PCI

●声道:2、4、6声道

3.3 视频接口

●视频信号的获取、处理与输出

●视频卡的种类、功能与工作原理

3.3.1 视频信号的获取、处理与输出

3.3.2 视频卡的种类、功能与工作原理

●电视接收卡

●视频转换/捕获卡

●视频编码卡

●MPEG解压卡

●视频流压缩卡

电视接收卡

视频转换/捕获卡

主要功能

●活动数字影像的显示、抓取录制、支持Microsoft Video for Windows;

●实时数字化PAL或NTSC视频信号,速率可达到30帧/秒

●可从录像机VCR、摄像机、LD、TV等视频源中抓取、存储输出图像,支持BMP、TGA等多种图形文件格式

●支持4:2:2YUV格式可达到64K中颜色

●支持分辨率可达到1024*768

●色度、饱和度、亮度、对比度及RGB三色比例可调●可控制和调整输入的声音信号

●播放视频时可进行多种视频效果处理,包括频闪、缩放影像、暴光、张贴、镜面映射和RGB颜色分离。视频编码卡

基本功能

●支持S-Video和复合视频输出

●内置闪烁滤波器用于稳定视频输出

●具有可控制的RGB彩色表,可增强视觉效果和满足特殊需要

●可同时输出VGA和视频信号

●可调整输出的垂直、水平线位及位置,色彩频率等。MPEG解压卡

视频流压缩卡/流媒体视频压缩卡

●能在互联网上提供视频流传送服务的压缩卡,可通过IP或ATM网络进行数字视频传送。

3.4 多媒体I/O设备

●手写板和手写笔

●数字化仪

●显示器

●触摸屏

●扫描仪

●数码相机

●摄像头

手写板和手写笔

数字化仪

显示器

一、显示器的分类:

●CRT显示器

●LCD(液晶)显示器

●PDP(等离子)显示器

●VFD(真空荧光)显示器

其中用的最多的还是CRT显示器和LCD显示器。

1、CRT显示器的分类:

(1)按显示色彩分:CRT分为单色显示器和彩色显示器。

(2)按屏幕大小分:14寸、15寸、17寸、20寸和21寸等。

(3)按显像管的类型分:球面管、平面直角管、柱面管、纯平管显示器。

(4)按调控方式分:模拟调节、数字调节再到OSD调节。

2、液晶显示器的分类:

●DSTN显示屏

●TFT显示屏

液晶显示器的尺寸主要有11.3寸、12.1寸、13.3寸、

14.1寸、15寸、17寸等。

二、CRT显示器的工作原理:

当显像管内部的电子枪阴极发出的电子束,经强度控制、聚集和加速后变成细小的电子流,再经过偏转线圈的作用向正确目标偏离,穿越荫罩的小孔或栅栏,轰击到荧光屏上的荧光粉时,荧光粉被激活,即可发出光来,R、G、B三色荧光被按不同比例强度的电子流点亮,就会产生各种色彩和图像。

三、CRT显示器的技术参数:

●彩色显示标准CGA——EGA——VGA——SVGA——XGA

CGA EGA VGA SVGA XGA 320*200 640*350 640*480 800*600

1024*768

●阴罩与点距、阴栅与栅距

阴极射线管CRT按结构可分为

阴罩式和阴栅式两大类。

●屏幕可视区域:平常我们所说的17寸、15寸实际上指显像管的尺寸。而实际可视区域(就是屏幕)远远到不了这个尺寸。14寸的显示器可视范围往往只有12寸;15寸显示器的可视范围在13.8寸左右;17寸显示器的可视区域大多在15-16寸之间。购买显示器时挑那些可视范围大的自然合算

●屏幕类型:球面管、平面直角管、柱面管、纯平管。

●逐行/隔行显示:显示管的电子枪扫描可分为隔行(Interlace)和逐行(non- Interlace)两种。

●点距:点距是同一像素中两个颜色相近的磷光粉象素间的距离。点距越小,显示图像越清晰细腻,分辨率和图像质量也就越高。如今家用显示器大多采用0.28mm点距,采用0.25mm有SONY的特丽珑和三菱的钻石珑,0.26mm(明基和部分飞利浦)和0.27mm 的也不少,采用0.22mm的高档显示器就属于专业应用了。屏幕越大,点距对视觉效果影响也越大。

●画面刷新率:即屏幕刷新的速度。画面刷新率也叫做垂直扫瞄频率,之所以叫做垂直是因为它的扫瞄方式是从画面上方第一条线一直扫到最下面一条线,由于方向是由上到下,所以叫做垂直扫瞄.这个数字代表一秒钟更新几次画面,单位是赫兹(Hz),采用70Hz 以上的刷新频率时才能基本消除闪烁,显示器最好稳定工作在允许的最高频率下,一般是85Hz。

●带宽:这是显示器非常重要的一个参数,能够决定

显示器性能的好坏。所谓带宽是显示器视频放大器通频带宽度的简称,一个电路的带宽实际上是反映该电路对输入信号的响应速度。带宽越宽,惯性越小,响应速度越快,允许通过的信号频率越高,信号失真越小,它反映了显示器的解像能力。

●行频和场频:行频指水平扫描频率,一般在50-90KHz 左右;场频指垂直扫描速度,即刷新频率,一般在60-100Hz左右。这两者都是越高越快越好。

●分辨率:分辨率就是构成图象的像素和。分辨率越高画面越细,字体也越小。

●调节方式:调节方式从早期的模拟式到现在的数码式调节可以说是越来越方便,功能也越来越强大了。数码式调节按调节界面分主要有三种:普通数码式、屏幕菜单式和飞梭单键式。各有特色,用户可根据自己的喜好来选择。

●TCO99:TCO99对显示器提出了更严格、更全面的环境保护,在用户使用舒适度等方面也提出了具体意见。现在的显示器基本上都能满足辐射、节电、环保等各方面的世界标准,而通过TCO95/99标准的显示器更是呈上升趋势。

显示器的质量认证标志:

EPA、CCIB、MPR-Ⅱ、TCO

数字电视18种格式

数字电视与模拟电视比较

触摸屏

●红外线触摸屏

●电阻式触摸屏

●电容式触摸屏

●表面声波触摸屏

●压力传感触摸屏

红外线触摸屏

电阻触摸屏

电容式触摸屏

表面声波触摸屏

扫描仪

●根据反射和透射分类

●根据光电传感器分类:

电荷耦合器件CCD和接触图像传感器CIS

●根据接口类型分类:SCSI、EPP (Enhancement Parallel Port)、USB、IEEE 1394

●根据扫描方式分类:

手持扫描仪、平面扫描仪、胶片扫描仪、滚筒扫描仪●基本工作原理

扫描仪的简单工作原理就是利用光电元件将检测到的光信号转换成电信号,再将电信号通过模拟/数字转换器转化为数字信号传输到计算机中

●技术指标:分辨率、色彩深度

电荷耦合器件CCD和接触图像传感器CIS

●CCD元件本身是整个扫描仪成像的核心,但光源发出的光必须经过镜片的反射和透镜的聚焦,这些光学器件的加入使整个扫描仪成本提高.

●CIS扫描仪是利用微小光源发出的光经扫描原稿反射后由感光器件直接接收而成像,CIS感光元件本身足以完成成像任务,不需要镜片和透镜的参与,因此产品的组装非常容易,成本较低。由于CIS扫描仪依靠直接接收反射光成像,技术含量相对较低,在扫描景深等方面表现较差。

●CCD型扫描仪的缺点是:需要一整套光学系统,包括照明冷光源和多个反光镜和光学镜头,通过复杂的光路在CCD传感器件表面成像。它的组成部件较为复杂,成本相对较高,扫描后对图像数据的处理也相对复杂。一般使用冷阴极管做光源,需要预热1分钟左右才能稳定发光。CCD扫描仪需要通过一系列透镜、反射镜成像,所以会产生色彩偏差和光学像差,一般需要通过扫描软件进行色彩校正。

●CIS型扫描仪的优点是:具有模块化设计,扫描光源、传感器、放大器集成为一体,结构、原理和光路都极为简单。由传感器直接从稿件表面获取图像,理论上不会产生色偏和像差,能获得最接近原稿的图像效果。能够降低设计制造成本,而且产品的体积可以设计得更薄、更小,CIS型扫描仪没有明显的等待时间。

●CIS型扫描仪的缺点是:不能使用镜头,只能压近原稿扫描,扫描精度较低。另外,它的光源只能用LED 发光二极管,这种光源无论在光色以及均匀度上都比较差,色域较CCD窄,获得的色彩不如CCD的丰富,而且光源的寿命比较短。

数码相机的性能指标

型号:C-820L(OLYMPUS)

4.数码相机与传统相机性能的比较

(1)外形传统相机:单反型、―傻瓜‖型

数码相机:单反型、―傻瓜‖型

(2)镜头分辨率数码相机与传统相机相同

(10-100对线/mm)

(3)像素

胶卷:600万-1500万

CCD :12万- 1.28万万

4.数码相机与传统相机性能的比较

(4)光圈传统相机:自动、手动

数码相机:自动、手动

(5)快门

传统相机:机械快门

数码相机:电子扫描快门、机械快门

(6)白平衡(校色)传统相机:印相时校色

数码相机:拍摄时校色(自动、手动)

数码相机存储介质

袖珍闪存卡CF(Compact Flash)、智能媒体卡SM (Smart Media)、记忆棒MS(Memory Stick)、Click!磁盘和微型硬盘MD(Micro Drive)等。

主要特点

●高像素小体积如科尼卡KD-400Z采用1 8 英寸的CCD器件,总像素已经达到413万,拍摄时有三档照片清晰度模式可供选择。

●镜头质量高有的数码相机配备了高质量的镜头,无论是旁轴还是单反,满足了高质量图片拍摄的要求。

●插槽结构使用更灵活内置记忆卡插槽有SD多媒体卡(SD MMC)或记忆棒(Memory Stick),还有的数码相机同时配备两个插槽,增强信息的交换。

●操作界面友好、操作简单方便在数码相机的彩色液晶显示屏可以选择自己喜欢的模式进行拍摄。

●常用功能键简洁易用很多相机取消了以往转盘式功能选择开关,如功能键、显示键和删除键。,以及通过十字键进行操作等,非常方便。

●另外,拍摄好的照片可以通过随机附带的USB电缆与计算机连接,通过计算机作进一步的加工处理,也可以通过互联网进行远距离传输。

摄像头

打印机

打印机是微机系统中常用的输出设备之一,根据打印机的工作原理可以将打印机分为:

●点阵式打印机

●喷墨打印机

●激光打印机

一、点阵打印机:点阵打印机又称为针式打印机,是利用印头内的点阵撞针,撞击打印色带,在打印纸上产生打印效果。

1、针式打印机的性能指标:

(1)打印头针数与寿命:常用的有9针和24针的打印头,打印头寿命一般为2亿点/针。

(2)打印速度:通常分别给出高速(草稿)和高密(仿信函体)打印方式下的打印符速度,单位为字/秒(CPS)。打印机速度有名义打印速度和平均打印速度之分,平均打印速度是评价打印机性能的一项很有意义的指标。在没有回车、换行的连续打印情况下,单位时间内所能打印的字符数(串行打印以字符/s表示)或行数(并行打印以行/s表示)。

(3)送纸方式:一般都有打印辊摩擦和齿孔牵引两种方式。有的打印机备有单页送纸器。

(4)走纸速度:走纸速度影响打印平均速度,单位用英寸/秒表示。

(5)字符集:指可供用户使用的字符种类。

(6)色带:色带有黑色和彩色之分。

(7)平均无故障时间:一般都高于4000小时。

(8)噪声:通常低于65分贝。

二、喷墨打印机:喷墨打印机的打印头由几百个非常细小的喷嘴组成,当打印头横向移动时,喷嘴可以按一定的方式喷出墨水,打到打印纸上形成字符和图象。

1、性能指标:

(1)打印精度DPI:是指打印机在每英寸打印的点数。

(2)打印速度PPM:是指打印机每分钟打印的页数。

(3)打印幅面:打印的纸张大小,一般有A3和A4两种。

三、激光打印机:激光打印机是利用电子照相转印技术进行印刷,当调制的激光束在感光鼓面上沿轴向横向扫描时,按照点阵组成字符的原理使鼓面感光,构成负电荷字符潜影。当鼓面经过带正电荷的墨粉时,曝光部位即吸附上墨粉,然后将墨粉转印到纸上,纸

上的墨粉经加热熔化形成永久性的字符、图形。

1、性能指标:

(1)速度:是指打印机每分钟打印的页数。

(2)分辨率:分辨率是指激光打印机在一定的区域内所能打出的点数。

四、各种打印机的性能比较:

(1)针式打印机

由于针式打印机结构简单,技术成熟,具有中等程度的分辨率和打印速度,使用灵活,性能价格比较好,运转、消耗费用最低,而且功能不断增长,在大幅面工程图纸打印、条形码打印和多份拷贝制作方面都具有非击打式不可取代的优点。所以针式打印机一直占据着统治地位。

针式打印机具有良好的性能价格比,功能强、操作简单,一次打印多份,易实现汉字打印及装配,维修方便等优点,但是打印噪声高、速度较慢、机械部分易磨损以及打印针易断等缺点。

(2)非击打式打印机:高打印速度,高分辨率字符和图形,高打印质量,产生混合图形的原文。高速的打印机能产生密集形的页原文,这是非击打式打印机的最大优点。非击打式打印机可以在不同的独立部分进行格式打印,包括原来打印格式、空格备份及压力敏感标识等。非击打式打印机的另一个大优点是工作宁静、噪声低。

非击打式打印机的主要缺点是无力打印多种格式,对于多份拷贝来说,非击打式打印机必须打印序列格式,击打式可以使用一次拷贝多份,而非击打式必须在超高速下工作才能赶上。击打式打印机通常具有调整跳行功能,非击打式打印机则没有,它不管每页打印一行或多行,都只能在恒速下工作。

从价格来说,除去喷墨打印机之外,通常非击打式打印机都高于或远高于针式打印机。

四、打印机的选购:打印精度、打印速度、打印幅面、价格。

计算机传输总线ISA——MCA——EISA——VESA——PCI——AGP

接口标准

●SCSI小型计算机系统接口

●USB通用串行总线接口标准

●IEEE 1394高速串行总线接口标准

又称火线(Fire Wire)串行传输接口。主要应用于需要高速数据传输的设备。

第四章文本处理技术

4.1 文本的基础知识

4.2 文本信息的采集方法4.3 文本信息处理

4.4 超文本标记语言

4.5 文本处理软件

4.1 文本的基础知识

?西文字符

?中文字符

?Unicode编码

?字符映射表

?文本与超文本文件

?常用文本文件的存储类型

Unicode编码

?Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。Unicode用数字0-0x10FFFF 来映射这些字符,最多可以容纳1114112个字符,或者说有1114112个码位。码位就是可以分配给字符的数字。UTF-8、UTF-16、UTF-32都是将数字转换到程序数据的编码方案。

?简单地说,Unicode扩展自ASCII字元集。在严格的ASCII中,每个字元用7位元表示,或者电脑上普遍使用的每字元有8位元宽;而Unicode使用全16位元字元集。这使得Unicode能够表示世界上所有的书写语言中可能用於电脑通讯的字元、象形文字和其他符号。Unicode最初打算作为ASCII的补充,可能的话,最终将代替它。考虑到ASCII是电脑中最具支配地位的标准,所以这的确是一个很高的目标。

字符映射表

?可以使用―字符映射表‖查看所选字体中可用的字符。―字符映射表‖可以显示下面的字符集:Windows、DOS 和Unicode。

?也可以使用―字符映射表‖查看和复制用―专用字符编辑器‖创建的专用字符。

超文本

?超文本——以节点为单位组织信息,在节点与节点之间通过表示它们之间关系的链加以连接,构成表达特定内容的信息网络。

文本的文件格式

1.TXT格式

通用文本格式。

2.RTF格式

富文本格式。

3.HTM/HTML格式

网页文本格式。

4.DOC/WPS

5.ASP/ASPX/PHP/JS

4.2 文本信息的采集方法

?键盘输入

?手写输入

?语音输入

?OCR输入

手写输入

语音输入

一、新建用户,建立自己的语音模型

二、语音输入

?启动IBM ViaV oice语音中心,在屏幕上方会出现一个工具条。

Office语音识别神奇的效率工具

Win Vista的语音识别系统

OCR输入

4.3 文本信息处理

?格式文本处理

?超文本处理

?特殊字符处理

4.4 超文本标记语言

?相关概念

?HTML文件

?HTML标签和属性

?超链接

?定义表格

?转义字符序列

?其他超文本标记语言

?http:超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。

?url:统一资源定位符(URL,英语Uniform / Universal Resource Locator 的缩写)也被称为网页地址,是因特网上标准的资源的地址(Address)。它最初是由蒂姆·伯纳斯-李发明用来作为万维网的地址的。

?Hyperlink:网页中链接其它网页的文本串.

https://www.doczj.com/doc/fe8783333.html,/html/index.asp

页面的标题

这是我的第一个页面。

这是粗体文本。

基本的HTML 标签

HTML 标签的属性

?HTML 标签拥有属性。属性为HTML 元素提供附加信息。

?属性总是以名称/值对的形式出现,比如:name="value"

?属性总是在HTML 元素的开始标签中规定。

属性例子:

? 定义HTML 文档的主体。

? 拥有关于背景颜色的附加信息。

HTML 表单用于搜集不同类型的用户输入

HTML 使用 (锚)标签来创建连接另一个文档的链接

表格

表格由

标签来定义。每个表格均有若干行(由 标签定义),每行被分割为若干单元格(由
标签定义)。字母td 指表格数据(table data),即数据单元格的内容。数据单元格可以包含文本、图片、列表、段落、表单、水平线、表格等等。

转义字符序列

?转义字符序列(Escape Sequence)也称字符实体(Character Entity)。在HTML中,定义转义字符串的原因有两个:第一个原因是像―<‖和―>‖这类符号已经用来表示HTML标签,因此就不能直接当作文本中的符号来使用。为了在HTML文档中使用这些符号,就需要定义它的转义字符串。当解释程序遇到这类字符串时就把它解释为真实的字符。在输入转义字符串时,要严格遵守字母大小写的规则。第二个原因是,有些字符在ASCII字符集中没有定义,因此需要使用转义字符串来表示.

如何显示空格?

通常情况下,HTML会自动截去多余的空格。不管你加多少空格,都被看做一个空格。比如你在两个字之间加了10个空格,HTML会截去9个空格,只保留一个。为了在网页中增加空格,你可以使用 表示空格。

XML语言

?可扩张标记语言(Extensible Markup Language,

XML)。它是一种比超文本标记语言(Hypertext Markup Language,HTML)更加灵活的一种Web文档格式。HTML使用预先定义的标签(tag)来描述网页中的文素(elements),而XML语言则允许网页开发人员定义标签。

Web.sitemap

xmlns="https://www.doczj.com/doc/fe8783333.html,/AspNet/SiteMap-Fi le-1.0" >

XML的4大特点

?良好的数据存储格式

?可扩展性

?高度结构化

?便于网络传输

XML的应用

?应用于客户需要与不同的数据源进行交互时。

?应用于将大量运算负荷分布在客户端,即客户可根据自己的需求选择和制作不同的应用程序以处理数据,而服务器只须发出同一个XML文件。

?应用于将同一数据以不同的面貌展现给不同的用户。

?应用于网络代理对所取得的信息进行编辑、增减以适应个人用户的需要。

虚拟现实造型语言VRML

?虚拟现实造型语言(Virtual Reality Modeling Language,VRML)是一种用来描述万维网页面上三维交互环境的文件格式。

体验三维世界需要有能接收和再现VRML 文件的浏览器。目前有两种类型,一种是插入型,把VRML浏览软件插入到HTML万维网浏览器;另一种是单独的VRML浏览器。.

DHTML

动态HTML(Dynamic HTML,简称DHTML),其实并不是一门新的语言,它只是HTML、CSS和客户端脚本的一种集成。

DHTML建立在原有技术的基础上,可分为三个方面:

?一是HTML(XHTML),也就是页面中的各种页面元素对象,它们是被动态操纵的内容;

?二是CSS,CSS属性也是动态操纵的内容,从而获得动态的格式效果;

?三是客户端脚本(例如JavaScript),它实际操纵Web页上的HTML和CSS。

?DHTML参考手册:

https://www.doczj.com/doc/fe8783333.html,/man/dhtmlcn/

4.5 文本处理软件

?文本处理软件概述

?WORD字处理软件

?常用的网页设计软件Frontpage

?典型的网页设计软件Dreamweaver

?网页设计软件的综合应用

第五章音频处理技术

5.1 音频基础知识

5.2 音频的数字化与编码

5.3 数字音频的采集与编辑

5.4 MIDI音乐

5.5 音频工具软件

5.1 音频基础知识

?声音是机械振动在弹性介质中的传播的机械波,振动越强,声音越大。

?参数:变化的速度有多快(频率)、产生的压力有多大(振幅)、何时开始(相位)

声音按频率分类

?低于20Hz的声音称为次音

?20Hz~ 20KHz范围的可听声为音频

?高于20KHz的声音称为超声(超音频)

?虽然人的发音器官发出的声音频率大约是80~3400 Hz,但人说话的信号频率通常为300~3000 Hz,人们把在这种频率范围的信号称为话音(speech)信号

?纯音:频率不变

?复音:由许多频率不同的信号组成

基频+复音

音频的分类

?波形音频

?CD音频

?MIDI音乐

数字音频的文件格式

?1.WA V波形文件:

?2.MP3/MP1/MP2格式

?3.MIDI/RMI文件

?4. WMA/ASF格式

?5.RA、RAM、RM格式

?6.VOC文件

?7.CD音频

5.2 音频的数字化与编码

?采样——每隔一个时间间隔在模拟声音波形上取一个幅度值,称为采样。

?量化——把采样得到的表示声音强弱的模拟电压用数字表示。

?量化数据位数(量化级)——每个采样点能够表示的数据范围。

?采样频率——对声音波形每秒钟进行采样的次数,即为采样时间间隔的倒数。

?在应用中,我们只对一定频率范围内的信号感兴趣,使可以对经滤波限带的音频信号采样。常见的音频采样频率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。

采样定理:

仅当采样频率>=2倍的原始信号频率时,才能保证采样后信号可被保真地恢复为原始信号。

采样定律用公式表示为

fs 3 2f或者Ts £T/2

其中f为被采样信号的最高频率。

?耳听觉的频率上限在20KHZ左右,根据采样理论,为了保证声音不失真,采样频率应在40KHZ左右。

?声音的数据量=(采样频率*每个采样位数*声道数)/8(Byte/s)

音频数据编码

音频编码标准

?G系列标准

?MPEG标准分为电话、调幅广播、高保真立体声3个音质层次

5.3 数字音频的采集与编辑

?线路输入是指录制随身听、MP3播放器等设备的声音,需用一根声音信号线把该设备的输出端与计算机声卡上的“线性输入”端口(Line in)相连。

?CD音频是指录制CD唱片上的声音,现在可以购买到现成的音频库,用此方法可以获得高质量的音频。?用All Sound Recorder XP等软件录制所有透过音效卡播放的音乐

?话筒主要用于录制声音,需要将话筒与计算机声卡上的“话筒”端口(MIC)相连。如果需要高质量的数字音频,录制时应选择采样频率高、量化位数高、立体声的音频数据,当然,相应它的数据量也大。实用中,需要在质量和数据量中进行综合考虑。在Windows 下常用的三种采样率是44.1khz、22.05 khz、11.025 khz,对应的量化位数是16位、8位、和4位。

?MIDI文件可用MIDI处理软件又常叫做音序器进行编写,还可接外部MIDI设备录制,如MIDI键盘中接受MIDI信号,并进行必要的音色转换。

声音的编辑

?可以对数字化声音数据进行播放、选裁、拷贝、删除、粘贴、声音混合粘贴等多种编辑。

?可以对数字化声音数据的参数进行修改,包括采样频率的修改(不改变声音的间距而改变声音的播放时间)和格式转换(不改变声音的播放时间而改变声音的间距)。

?可以对数字化声音数据进行效果处理,包括逆向播放、增减回声、增减音量、增减速度、声音的淡入淡出、交换左右声道等。

?可以对数字化声音数据进行图形化处理,即能按比例把实际的声音波形显示成图形,作了修改后,应能实时显示其变化。

5.4 MIDI音乐

?MIDI文件——存放MIDI信息的标准文件格式。文件中包含音符、定时和多达16个通道的演奏定义。文件包括每个通道的演奏音符信息:键、通道号、音长、音量和力度(击键时,键达到最低位置的速度)

?通道——MIDI可为16个通道提供数据。每个通道访问一个独立的逻辑合成器。

?音序器——是为MIDI作曲而设计的计算机程序或电子装置。音序器能够用来记录、播放、编辑MIDI

事件。

音乐合成

?20世纪80年代初应用调频(FM)音乐合成技术

?1984年开发出另一种更真实的音乐合成技术——波形表(wavetable)合成

? FM是使高频震荡波的频率按调制信号规律变化的一种调制方式。采用不同调制波频率和调制指数,可以方便地合成具有不同频谱分布的波形,再现某些乐器的音色。

5.5 音频工具软件

?常用的音频处理软件包括录音机、Cool Edit、Nero Wave edit、Cakewalk等。

第六章图形图像处理技术

6.1 颜色基础知识

6.2 位图和矢量图形

6.3 图像的数字化过程

6.4 数字图像处理与输出

6.5 数字图像分析

6.6 图形/图像文件

6.7 图形/图像处理软件

颜色模型

?常见模型:

?RGB 颜色模型

?CMYK (青色、洋红、黄色、黑色)

?HSB(HSV ,HSI) 颜色模型(色相、饱和度、亮度)?YUV 与YIQ 颜色模型

?CIE L*a*b 颜色模型

颜色模型

RGB 模型

?绝大多数可视光谱可用红色、绿色和蓝色(RGB) 三色光的不同比例和强度的混合来表示。在这三种颜色的重叠处产生青色、洋红、黄色和白色。

CMYK 模型

?理论上,纯青色(C)、洋红(M) 和黄色(Y) 色素合成,吸收所有颜色并生成黑色。这些颜色因此称为减色。由于所有打印油墨都包含一些杂质,因此这三种油墨实际生成土灰色,必须与黑色(K) 油墨合成才能生成真正的黑色。

?当白光照射到半透明油墨上时,色谱中的一部分被吸收,而另一部分被反射回眼睛。哪些光波反射到我们眼中,决定了我们能感知的颜色。

HSB (HSI)模型

?色相(色调)是从物体反射或透过物体传播的颜色——是人们眼看一种或多种波长的光时产生的彩色感觉。在0 到360 度的标准色轮上,按位置度量色相。在通常的使用中,色相由颜色名称标识,如红色、橙色或绿色。

?饱和度(有时称为彩度)是指颜色的强度或纯度——掺入白光的程度。饱和度表示色相中灰色分量所占的比例,它使用从0%(灰色)至100%(完全饱和)的百分比来度量。在标准色轮上,饱和度从中心到边缘递增。

?亮度是颜色的相对明暗程度,通常使用从0%(黑色)至100%(白色)的百分比来度量。

YUV与YIQ颜色模型

?YUV和YIQ模型用来表示彩色电视的图像。YUV模型与YIQ模型中的Y表示亮度,UV表示色差,U、V 是构成彩色的两个分量,在YIQ模型中构成彩色的两个分量是I、Q。

?欧洲彩色电视(PAL和SECAM)制使用YUV模型。YIQ颜色模型用于美国、加拿大等国采用的NTSC彩色电视制式。

CIE L*a*b颜色模型

?L*a*b 颜色模型设计目的是为了得到不依赖于具体设备的颜色标准,从而在实际使用中不论使用何种设备(如显示器、打印机、计算机或扫描仪)均能制作和输出完全一致的颜色。

?L*a*b 颜色由亮度或光亮度分量(L) 和两个色度分量组成:a 分量保存从绿色到红色所对应的色彩信息;

b 分量保存从蓝色到黄色所对应的色彩信息

颜色模型的色域

?色域是一个彩色系统能够显示或打印的颜色范围。

彩色空间的线性变换

YUV与RGB彩色空间变换

YIQ与RGB彩色空间变换

HSI(HSB)与RGB之间的转换

YCrCb与RGB彩色空间变换

图像按生成方法分类

?位图图像(bitmap image)

从现实世界中通过数字化设备获取的图像

?矢量图形(vector graphics)

计算机合成的图像(synthetic image)

位图图像

矢量图形

位图图像和矢量图形的区别与联系

?位图图像通常可使用扫描仪扫描印刷资料、数码相机直接拍摄,以及通过摄像机、录相机、激光视盘与视

频信号数字化卡一类设备把模拟的图像信号变成数字图像数据等方式获取。

位图图像使用像素来表现图像,适用于逼真照片或要求精细细节的图像。

显示速度快,占磁盘空间大。

?矢量图形由绘图软件绘制编辑而成,通过计算机指令来描述和控制,需要计算机花费时间解释执行对应的图形指令。

矢量图形没有像素点的概念,因而与图像分辨率没有关系,放大等变换后图像无失真。

缺点是因此不易表现图像颜色的细微层次变化,表现自然界景物的真实感较差。

图像的属性

?图像大小,也称图像分辨率(包括垂直分辨率和水平分辨率)

?颜色深度,指一幅图像中的最多使用的颜色数,用来度量在图像中有多少颜色信息来显示或打印像素。

图像的表示方法

–单色图像用一个矩阵来表示

–彩色图像用一组(一般是3个)矩阵来表示,矩阵的行数称为图像的垂直分辨率,列数称为图像的水平分辨率,矩阵中的元素是像素颜色分量的亮度值,使用整数表示,一般是8位至12位

图像的表示方法

?彩色图像的表示

图像尺寸

?在国际标准中,打印分辨率的单位是―像素/英寸‖。?一般对于打印分辨率,印刷行业有一个标准:300dpi。就是指用来印刷的图像分辨率,至少要为300dpi 才可以,低于这个数值印刷出来的图像不够清晰。

?如果打印或者喷绘,只需要72dpi 就可以了。

?根据150PPI计算的数码相机可冲洗最大照片的数据对照表(英寸)

500万像素有效4915200,像素2560X1920。可冲洗照片尺寸17X13,对角线21寸

130万像素有效1228800,像素1280X960。可冲洗照片尺寸9X6,对角线11寸

80万像素有效786432,像素1024X768。可冲洗照片尺寸7X5,对角线9寸

?由上表可以看出:

5寸照片(3X5),采用800X600分辨率

6寸照片(4X6),采用1024X768分辨率

7寸照片(5X7),采用1024X768分辨率

8寸照片(6X9),采用1280X960分辨率

相片尺寸

?1×1.5 英寸: 一寸 2.5×3.5(厘米) ; 小一寸 2.2×3.2(厘米) ; 大一寸3.3×4.8(厘米)

?1.5×2 英寸: 二寸 3.5×4.9(厘米) ; 小二寸 3.5×4.5(厘米) ; 大二寸3.5×5.3(厘米)

?5×3.5(5英寸3R)12.70×8.89 (厘米)

6.3 图像的数字化过程

?三步骤:采样、量化、压缩编码

?图像采样:将二维空间上连续的灰度或色彩信息转化为一系列有限的离散数值的过程。

?图像压缩编码:基于DCT变换的JPEG、基于小波变换的JPEG2000

压缩比大约30:1以上

6.4 数字图像处理与输出

(1)图像的处理

可进行亮度、对比度、色饱和度处理;噪声滤除处理;边缘增强、浮雕效应及平滑处理;画面特殊效果处理(如运动模糊、马赛克效果等);纹理效果处理等。

(2)图像的编辑

能进行图像的旋转、平移、缩放等几何变换;能进行图像的剪裁、拷贝、粘贴;能进行图像中的文字处理等。

(3)图像格式的转换

支持十几种图像文件格式。不同的图像文件格式有不同的特性,支持越多的图像文件格式,越能充分利用以各种格式存储的图像资源。

(4)图像的绘制

提供绘制各种形状如直线、曲线等各种几何图形的工具;提供橡皮、填充、刷子等基本的辅助工具;提供各种画笔,如铅笔、毛笔、喷枪等,并可选择设置笔头的形状和大小等

(5)图像的打印输出

RGB——CMYK颜色模式转换

6.5 数字图像分析

?图像分割

?图像测量

?图像识别

6.6 图形/图像文件

?图像说明部分:保存用于说明图像的高度、宽度、格式、颜色深度、调色板及压缩方式等信息。

?图像数据部分:描述图像每一个像素颜色的数据。图像文件的格式

1、BMP格式

2、GIF格式

3、JPG格式

4、TIF格式

5、PNG格式

6、PSD格式

图形文件的格式

1、EPS格式

2、DXF格式

3、PS格式

4、HGL格式

5、WMF格式

6、AI格式

6.7 图形/图像处理软件

?图形处理软件:

CorelDRAW、Adobe Illustrator、Macromedia Freehand、3ds max、AutoCAD

?图像处理软件

Photoshop、Image Ready、Painter、PhotoDraw、Photoshop的4个功用

?图像合成(选择操作、扣像)

?图形图像的绘制(选择工具、填充、渐变、铅笔、毛笔、钢笔、路径工具、文字)

?图像的特殊效果制作(滤镜)

?图像的修补(变换、调整、补丁修补工具)

实例

?画一个圆环(选择工具、多边形工具)

?换云(选择工具)——图片:沙丘、天空

?画一个交通警示牌(No Park)(图层)

?交错的圆环——奥运五环(图层)

?夜空繁星(毛笔——笔触选择)

?漫天枫叶(毛笔——笔触选择)

?立体圆柱、立体按钮、圆球(渐变)

?邮票边框、心形项链(画笔设置——笔尖间距)

?制作艺术字(文字工具、图层样式)

?处理旧照片(修补工具、蒙版应用)?飞翔天际(动感模糊滤镜)

?给文字加阴影(高斯模糊)

?雨景(添加杂色滤镜)

?圆球上的球字(球面化滤镜)

?边框制作(画笔描边-喷溅滤镜)

?立方体——冰块(3D变换滤镜)

第七章视频处理技术

7.1 视频基础知识

7.2 视频数字化

7.3 视频视频编码压缩

7.4 数字视频文件格式

7.5 视频的采集与编辑

7.6 视频处理技术

7.7 动画技术

7.1 视频基础知识

?模拟视频:是以连续的模拟信号方式存储、处理和传输的视频信息,所用的存储介质、处理设备以及传输网络都是模拟的。

?模拟视频的信号类型:

DTV数字电视标准

?数字电视(DTV)是继黑白电视盒彩色电视之后的第三代电视,是在拍摄、编辑、制作、播出、传输、接收等电视信号处理的全过程都使用数字技术的电视系统。

?数字电视标准:支持4:3和16:9宽高比的显示屏幕,把电视图像的清晰度分为普通清晰度电视PDTV、标准清晰度电视SDTV、高清晰度电视HDTV三个等级。

普通清晰度电视PDTV

?画面质量:VCD

?水平扫描线:200-300线

?兼容模拟电视

标准清晰度电视SDTV

?最高分辨率:640*480

?画面质量:DVD

?水平扫描线:400-600线

高清晰度电视HDTV

?1280×720(非交错式,场频为24、30或60),也即我们平常说的720P。

?1920×1080(交错式,场频60),也即我们平常说的1080I。

?1920×1080(非交错式,场频为24或30),也即我们平常说的1080P。

手机电视标准

?目前手机电视标准有三大派系:DMB、DVB-H、Media FLO,其中已商用的是DMB

数字视频

?可用计算机编辑处理

?再现性好

?适合于数字网络

视频数字化

模拟视频的数字化主要包括视频信号采样、彩色空间转换、量化等工作。

电视图像数字化的方法

电视图像数字化的方法主要有两种:

?先从复合彩色电视图像中分离出彩色分量YIQ或YUV,然后用三个A/D转换器分别对三个分量进行数字化。

?采用一个高速A/D转换器对复合彩色电视信号进行数字化,然后在数字域进行RGB或YUV彩色分离。

RGB和黑白电视信号不兼容,希望空中发射的信号转换成YUV信号。

当白光的亮度用Y来表示时,它和红、绿、蓝三色的关系可用如下方程描述:

Y=0.299R+0.587G+0.114B

选YIQ好处:

大量实验统计,人眼对红黄之间的颜色变化最敏感,而分辨蓝和紫之间颜色变化最不敏感。

所以把相角为123的橙色及其相反相角的303的青色定义为I轴。

与I正交的色度信号轴,通过33 — 0 —213 线,叫Q轴。

NTSC制的YIQ 与YUV的关系:

?I = V Cos33 - U Sin33

?Q = V Sin33 + U Cos33

视频信号的数字化过程

?视频采样

?隔行、逐行转换

?量化

?彩色空间转换

?编码、压缩

视频采样

?使用相同的采样频率对图像的亮度信号和色差信号进行采样(全采样)?对亮度信号和色差信号分别采用不同的采样频率进行采样(子采样)

?4:4:4

?4:2:2

?4:2:2

视频量化

视频数字化标准ITU-RBT.601

?为了在PAL、NTSC、SECAM标准的模拟视频之间确定共同的数字化参数,国际无线电咨询委员会CCIR 制定了彩色电视图像(模拟视频)数字化标准,称为CCIR 601标准,现在改为ITU-RBT.601标准。

?该标准规定了彩色电视图像转换成数字图像时使用的采样频率、采样格式以及RGB和YCbCr两个彩色空间之间的转换关系等。

数字视频的不同格式

7.2 视频数字化

7.3 视频视频编码压缩

7.4 数字视频文件格式

7.5 视频的采集与编辑

7.6 视频处理技术

7.7 动画技术

第八章多媒体数据压缩

8.1 数据压缩的基本原理和方法

8.2 音频的压缩

8.3 图像和视频的压缩

8.1 数据压缩的基本原理和方法

8.1.1 数据压缩技术的性能指标

8.1.2 数据冗余的类型与压缩方法分类

8.1.1 数据压缩技术的性能指标

?压缩比

?图像质量

?压缩和解压的速度

8.1.2 数据冗余的类型

?空间冗余——静态图像存在的最主要的一种数据冗余。一幅图像记录了画面上可见景物的颜色。同一景物表面上各采样点的颜色之间往往存在着空间连贯性,但是基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间连贯性,从而产生了空间冗余。我们可以通过改变物体表面颜色的像素存储方式来利用空间连贯性,达到减少数据量的目

的。如,在静态图像中有一块表面颜色均匀的区域,在此区域中所有点的光强和色彩以及饱和度都是相同的。

?时间冗余——序列图像表示中经常包含的冗余。在动态图像序列中,相邻的帧与帧之间在物理特征(亮度、颜色等)上存在较大的相近或相关性。(再如,相邻帧往往包含了相同的背景和移动物体)

?结构冗余——在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等。?知识冗余——有些图像的理解与某些知识有相当大的相关性。例如:人脸的图像有固定的结构。这类规律性的结构可由先验知识和背景知识得到,此类冗余就为知识冗余。

?视觉冗余——事实表明,人类的视觉系统对图像场的敏感性是非均匀和非线性的。然而,在记录原始的图像数据时,通常假定视觉系统是线性的和均匀的,从而产生视觉冗余。

?(人类的视觉系统的一般分辨率能力为106灰度级,而一般图像的量化采用的是108灰度级。)

?图像区域的相同性冗余——指在图像中两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储。

?纹理的统计冗余——有些图像纹理尽管不严格服从某一分布规律,但是在统计的意义上服从该规律。

?信息熵冗余——因码元编码长度的不经济而引起的数据冗余。

?信息量指不确定性的多少。信息熵指一组数据所携带的信息量。

8.1.2 压缩方法分类

分类一:

?可逆编码(无失真编码)——解码图像与原始图像严格相同,压缩比大约在2:1~5:1之间。如Huffman 编码、算术编码、行程长度编码等。

?不可逆编码(有失真编码)——压缩比可以从几倍到上百倍来调节。常用的有变换编码和预测编码。

分类二:(按数据编码的实现原理分)

?预测编码——利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。又可分为线性预测编码和非线性预测编码。通常用的方法是差分脉冲编码调制(DPCM)和自适应差分脉冲编码调制(ADPCM)。

?变换编码——通过消除统计冗余而进行数据压缩的编码方法,它通过将图像的亮度矩阵变换到系数空间(频域)上进行处理而实现。在时域空间上具有强相关的信号,反映在频域上是某些特定的区域内能量常常被集中在一起,只需将主要注意力放在相对小的区域上,从而实现压缩。

?量化与向量量化编码——对模拟信号进行数字化时需要经历一个量化的过程。一次量化多个点的做法,这种方法称为向量量化。例如每次量化相邻的两个点,将两个点用一个量化码字表示。向量量化对数据压缩能力实际上与预测方法相近。

?信息熵编码——根据信息熵原理,让出现概率大的用短的码字表达,反之用长的码字表示。最常见的方法如Huffman编码、Shannon编码以及算术编码。

?子带编码——将图像数据变换到频域后,按频域分带,然后用不同的量化器进行量化,从而达到最优的组合。

?模型编码——编码时首先将图像中的边界、轮廓、纹理等结构特征找出来,然后保存参数信息。解码时根据结构和参数信息进行合成,恢复原图像。具体方法有轮廓编码、域分割编码、分析合成编码、识别合成编码、基于知识的编码和分形编码等。

?基于神经网络的编码

?基于知识的编码——主要用于消除数据的知识冗余的一种失真的编码技术。

?混合编码

?行程编码

?词典编码

行程编码

?现实中有许多这样的图像,在一幅图像中具有许多颜色相同的图块。在这些图块中,许多行上都具有相同的颜色,或者在一行上有许多连续的象素都具有相同的颜色值。在这种情况下就不需要存储每一个象素的颜色值,而仅仅存储一个象素的颜色值,以及具有相同颜色的象素数目就可以,或者存储一个象素的颜色值,以及具有相同颜色值的行数。这种压缩编码称为行程编码,常用(r un l ength e ncoding,RLE)表示,具有相同颜色并且是连续的象素数目称为行程长度。

?用RLE编码方法得到的代码为:80315084180。代码中用黑体表示的数字是行程长度,黑体字后面的数字代表象素的颜色值。例如黑体字50代表有连续50个象素具有相同的颜色值,它的颜色值是8。

Z字形编排

Huffman编码

?根据可变长度最佳编码定理,应用霍夫曼算法而得到的一种编码方法。可以证明,在给定符号集和概率模型时,没有任何其他整数码比霍夫曼码有更短的平均码长。

编码方法:

(1)将符号按出现的概率由大到小排序。给最后的两个符号各赋给一个二进制码,概率大的赋0,概率小的赋1(反之也可)。

(2)把最后两个符号的概率加起来合成一个概率,再按大小重新排序。重新排序后重复步骤(1)的编码过程。

(3)重复步骤(2),知道最后只剩下两个概率为止。(4)将每个符号所对应的各分支赋的0、1值反向逆序排出,即得到各符号的编码。

算术编码

?算术编码的基本原理:将编码的信息表示成实数0和1之间的一个间隔,信息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。

?[例] 假设信源符号为{00, 01, 10, 11},这些符号的概率分别为{ 0.1, 0.4, 0.2, 0.3 },根据这些概率可把间隔[0, 1)分成4个子间隔:[0, 0.1), [0.1, 0.5), [0.5, 0.7), [0.7, 1),其中表示半开放间隔,即包含不包含。

编码过程

译码过程

8.2 音频的压缩

波形声音的表示与压缩编码

波形声音的主要参数

? 取样频率

? 量化位数

? 声道数目

? 使用的压缩编码方法

? 数码率(bit rate):指的是每秒钟的数据量,也称

比特率、码率

? 数字声音未压缩前,其计算公式为:

波形声音的码率=取样频率×量化位数×声道数

? 压缩编码以后的码率=压缩前的码率/ 压缩倍数

几种常见数字声音的主要参数

全频带声音的压缩编码

? 问题:数据量很大。如CD盘片上所存储的立体声高保真的全频。带数字音乐,1小时的数据量大约是635MB

? 目的与办法:降低存储成本和传输通信带宽,对数字波形声

音进行数据压缩? 波形声音数据压缩的可能性:声音信号中包含有大量的冗

余信息,再加上还可以利用人的听觉感知特性,因此,产生了

许多压缩算法

? 声音数据压缩算法的评价:压缩倍数高,声音失真小,算

法简单,编码器/解码器的成本低

? 第1代编码技术——PCM(脉冲编码调制)编码:依据声音波形本身的信息相关性进行数据压缩,代表性的应用是CD唱片

? 第2代压缩编码——感知声音编码(perceptual audio coding) :不但充分利用声音信息本身的相关性,而且还充分利用人耳的听觉特性,即使用―心理声学模型‖来达到大幅度压缩

数据的目的

?第2代压缩编码——感知声音编码的编码过程:

–第1阶段:通过时间/频率变换和心理声学分析,揭示原始声音中与人耳感知无关的信息

–第2阶段:通过量化和编码予以抑制

–第3阶段:使用熵编码消除声音信息中的统计冗余第2代全频带声音压缩编码标准

? MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:

–层1(Layer 1):编码简单,用于数字盒式录音磁带

–层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等

–层3(Layer 3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍

? MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1, 层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声

?杜比数字AC-3(Dolby Digital AC-3):美国杜比公司开发的多声道全频带声音编码系统,它提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和还原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。

? 音(视)频媒体的传输要求

?高带宽

?连续实时传输

?平稳传输,克服突发问题

? 传输音(视)频媒体的方式

?先下载,后播放(下载方式,需要等待很长时间,有很大的存储需求)

?边下载,边播放(流式传输方式,不需要下载完整个文件,只需经过几秒或十数秒的启动延时即可进行播放)

?流媒体技术:允许在窄带网上让用户一边下载一边收看(听)音视频连续媒体的技术

? 流媒体:使用流式传输技术的音/视频媒体

? 优点:

–等待时间大大缩短

–减少了对缓冲容量的需求

–降低了对网络带宽的要求

声音流媒体产品

?Real Networks公司的RA(Real Audio)数字音频?微软公司的WMA(Windows Media Audio)数字音频

?苹果公司的Quick Time

数字语音的压缩编码

? 语音:空气通过声道引起声门振动产生语音

带宽只有300~3400Hz

? 压缩方法

–波形编码(基于感觉模型的压缩方法)

? 特点:码率较高(64kb/s、32kb/s)、语音质量高、算法简单、易实现

? 应用:固定电话通信系统、多媒体文档

–参数编码或模型编码

? 特点:码率很低、声音质量较差

? 应用:保密通信

–混合编码

? 特点:中度码率(4.8-16 kb/s)、压缩比较高、

语音质量较好

? 应用:移动通信、IP电话

数字语音压缩编码方法的比较

波形编译码

?波形编译码的想法是,不利用生成话音信号的任何知识而企图产生一种重构信号,它的波形与原始话音波形尽可能地一致。

一般来说,这种编译码器的复杂程度比较低,数据速率在16 kb/s以上,质量相当高。低于这个数据速率时,音质急剧下降。

波形编译码——PCM

?最简单的波形编码是脉冲编码调制(p ulse c ode m odulation,PCM),它仅仅是对输入信号进行采样和量化。

?典型的窄带话音带宽限制在4 kHz,采样频率是8 kHz。如果要获得高一点的音质,样本精度要用12位,它的数据率就等于96 kb/s,这个数据率可以使用非线性量化来降低。

?它们的优点是编译码器简单,延迟时间短,音质高。但不足之处是数据速率比较高,对传输通道的错误比较敏感。

量化

?均匀量化

?无论对大的输入信号还是小的输入信号一律都采用相同的量化间隔。为了适应幅度大的输入信号,同时又要满足精度要求,就需要增加样本的位数。但是,对话音信号来说,大信号出现的机会并不多,增加的样本位数就没有充分利用

?非均匀量化

?对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔

波形编译码——DPCM

?在话音编码中,一种普遍使用的技术叫做预测技术,这种技术是企图从过去的样本来预测下一个样本的值。这样做的根据是认为在话音样本之间存在相关性。如果样本的预测值与样本的实际值比较接近,它们之间的差值幅度的变化就比原始话音样本幅度值的变化小,因此量化这种差值信号时就可以用比较少的位数来表示差值。这就是差分脉冲编码调制(d ifferential p ulse c ode m odulation,DPCM)的基础—对预测的样本值与原始的样本值之差进行编码。

?它是一种预测编码技术,是PCM编码的一种变形。PCM是对每个采样信号的整个幅度进行量化编码,因此它具有对任意波形进行编码的能力;DM是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成―0‖和―1‖这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为―正‖,则用―1‖表示;相反则用―0‖表示,或者相反。由于DM编码只须用1位对话音信号进行编码,所以DM编码系统又称为―1位系统‖。

文本预览
相关文档 最新文档