当前位置:文档之家› 高清格式及码率

高清格式及码率

高清格式及码率
高清格式及码率

模拟电视525/60i和625/50i NTSC和PAL制

数字信号PAL制720*576,逐行可表示为576P,隔行为576i。

NTSC720*480,逐行为480P,隔行为480i。

HDTV 1280*720 1920*1080

液晶和等离子电视不需要扫描,同时发光,都是逐行扫描的。

高清摄象机保留了隔行、逐行之分,还保留了PAL制50Hz频率和NTSC 60Hz频率的区别

帧频(每秒钟显示的逐行图像数量)或场频(每秒钟显示的隔行图像)也不相同。

720P 1280*720有5种帧频,分别为60P、50P、30P、25P、24P,还没有任何国家选择这种标准720/50P、720/25P。

1920*1080

1080i 1080P

1080/60i场频为60Hz,1080/50i,这两种格式都可称为1080i。

世界范围内统一采用了1080/24P的标准,数字电影摄像机的标准,

1080/24P的简称为1080P。

平板电视实际上可以认为没有1080i和1080P的区别,因为图象处理电路技术发展非常快,运算速度非常快,处理能力非常强,均具有倍线技术。1080/50i完美处理成1080/50P,1080/60i 处理成1080/60P,包括1080/24P的节目,更可非常轻松地处理为1080/50P或1080/60P。任何一台平板电视都有这种电路,稍微高档的平板电视处理效果都不错。

对于高清节目,720代表1280*720,1080代表1920*1080就可以了,因为即使是1080i的图象,平板电视也可处理成1080P的。对于平板电视,720P、1080i和1080P更没有意义,平板电视是逐行的有倍线技术,清晰度高低由分辨率决定的,按照高清国标要求至少要达到1280*720,当然是1920*1080的物理分辨率最佳了,需要720P、1080i和1080P概念的,就是高清摄象机,并不影响观看效果。

1080 60I,在液晶内部处理过后,就是1080 30P

H.264(也叫AVC或X.264)H.264是新一代的高清视频编码,大部分MKV格式的高清视频都是采用此编码,视频质量极佳。XviD和DivX编码的视频,通常文件扩展名是avi,视频清晰度明显比不上H.264,已经逐渐被H.264取代了。RMVB是有损压缩视频编码,视频质量与H.264不是一个档次的,优点是文件的体积压缩到很小,视频质量也不是十分糟糕。WMV-HD是微软专有的视频格式,兼容性不好,很多MP4或高清播放机不能播放;MPEG2虽然清晰度高,但文件体积高大,不便于收藏。

H.264视频编码建议码率

视频大小分辨率建议码率

480P 720X480 1800Kbps 0.33

720P 1280X720 3500Kbps 0.88

1080P 1920X1080 8500Kbps 2

600P 1024X600 0.59

XviD/DivX视频编码建议码率

视频大小分辨率建议码率

480P 720X480 1600Kbps

720P 1280X720 3000Kbps

RMVB视频编码建议码率

视频大小分辨率建议码率

480P 720X480 700Kbps

1024X576 1200Kbps

720P 1280X720 1600Kbps

码率计算公式:【码率】(kbps)=【文件大小(字节)】X8/【时间(秒)】/1024

31.17 1877 1516731511 1.41G 6M

用x264编码的话。。。相对来说只有VBR和ABR两种形态。。

VBR就是可变编码用Quality-based就是了。。。

ABR就是平均码率,也就是说最后出来的东西平均码率是你设置的那个。。。在用MC编码H.264的时候除了Quality-based以外其他3种都是ABR。。只是2-pass和3-pass对码率控制和编码质量比Bitreta-based要好一些。。

如果你想要的是CBR,那么答案是没有。。。再说ABR把多的码率分配在变化多的动作场景,

高清视频封装格式解析

高清视频封装格式解析 为了使得各位网友更加了解高清方面的知识,享受高清品质更完美的生活,ZOL推出了高清大讲堂,希望能够为网友提供一些关于生活中接触高清的相关时候能够游刃有余一些,在上一期为大家介绍了视频编码的问题,这次为大家介绍一下跟视频编码紧紧联系,跟我们也是接触最多的封装格式的问题。点击上一期《ZOL高清大讲堂:视频编码格式全面解析》 视频编码说到底是一种压缩视频的算法,而视频封装格式就是我们见到的成型的文件类型了,所以说,视频封装格式肯定是我们“熟悉的陌生人”。我们接触的视频,包括我们从网上下载了在影音软件或播放机中观看的视频以及我们手机、MP4等多种播放器材中的文件,在人们讨论中基本上谈到的某某手机能播放什么格式类型的影片,口中的这个格式就是指“封装格式”,就是已经成型的文件类型。我们天天会接触到他,但是并不一定了解他。今天希望大家看完这期的高清大讲堂能有所收获。 其实了解视频的封装格式对我们以后了解视频的播放是很有必要的。在上一期我们了解了视频的编码的方式有哪些,这是我们了解封装格式的一个前提,而本期的封装格式我们了解了以后会对于以后生活中选择播放器材以及甄别机器的播放性能都有一定的帮助。而且对于越来越娱乐化,无论是手机还是平板电脑亦或是电脑上面多媒体在生活中都成为主流的时候。我们多了解一些这方面的内容更是非常有必要。而在家庭娱乐中,如果你想让自己的家庭影院成为强大的“无所不播”的设备的话,更要打起精神看过来了。 视频封装格式如何理解? 笔者曾经随机的询问过各行各业各个年龄阶层文化水平的人,发现对于视频接触无论是多还是少的人很少有人能清楚的分清楚视频编码还有封装格式。主要原因笔者认为一方面是由

高清数字电视的格式标准720p

高清数字电视的格式标准720p 720P是美国电影电视工程师协会(SMPTE)制定的高等级高清数字电视的格式标准,有效显示格式为:1280×720.SMPTE(美国电影电视工程协会)将数字高清信号数字电视扫描线的不同分为1080P、1080I、720P(i是interlace,隔行的意思,p是Progressive,逐行的意思)。720P是一种在逐行扫描下达到1280×720的分辨率的显示格式。是数字电影成像技术和计算机技术的融合。 一、简介 数字电视的发展从1080i到720p再到1080p 1080i和720p同是国际认可的数字高清晰度电视标准。原NTSC国 家采用的是1080i/60Hz格式,与NTSC模拟电视场频相同。而欧洲以及中国等一些原PAL制国家则采用了1080i/50Hz模式,场频与PAL模拟电视相同。至于720p,则由于IT 厂商更深的渗透到了电视行业而成为了一个可选的标准,目前开始在以光盘为载体的HDTV 播放机领域拓展地盘。 二、发展实例 以日本数字电视标准为例,按照显示格式的不同,共分为以下5种规格: D1:480i格式,和NTSC模拟电视清晰度相同,行频为15.25kHz D2:480P格式,和逐行扫描DVD规格相同,行频为31.5kHz D3:1080i格式,分辨率为1920×1080i/60Hz,行频为33.75kHz D4:720p格式,分辨率为1280×720p/60Hz,行频为45kHz D5:1080p格式,分辨率为1920×1080逐行扫描,专业格式 其中以D3的1080i作为高清晰度电视的基本格式,但是也兼容720p格式的播放。而D5规格的1080p则作为高级的专业模式,普遍应用于电视台、电影制作。电视台发送的1080i 和720p电视信号都是由1080p信号源转换播出的。 可以看出,1080p是一个事实上存在的标准,但是1080p目前并不是民用领域使用的标准。1080p不是只有一种60Hz场频,其实真正应用得最多的是24Hz、25Hz、30Hz三种场频规格。我们知道电影是以每秒24幅的方式播放胶片的。以1080p/24Hz方式拍摄的数字图像可以无损失的传送到DLP/D-ILA等数字电影投影机上,以电影格式播放。1080p/24Hz是为电影准备的一种格式。

视频格式详解(RMVB,RM,WMV,ASF,AVI,MPEG1,MPEG2,MPEG4,MOV等)

视频格式详解 (RMVB,RM,WMV,ASF,AVI,MPEG1,MPEG2,MPEG4,MOV等) ( ●AVI格式:它的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Microsoft公司推出,随Windows3.1一起被人们所认识和熟知。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频,所以我们在进行一些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题,如果用户在进行AVI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。 ●nAVI格式:nAVI是newAVI的缩写,是一个名为ShadowRealm的地下组织发展起来的一种新视频格式(与我们上面所说的AVI格式没有太大联系)。它是由Microsoft ASF压缩算法的修改而来的,但是又与下面介绍的网络影像视频中的ASF视频格式有所区别,它以牺牲原有ASF视频文件视频“流”特性为代价而通过增加帧率来大幅提高ASF视频文件的清晰度。 ●DV-AVI格式:DV的英文全称是Digital Video Format,是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。目前非常流行的数码摄像机就是使用这种格式记录视频数据的。它可以通过电脑的IEEE 1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名一般是.avi,所以也叫DV-AVI格式。 ●MPEG格式:它的英文全称为Moving Picture Expert Group,即运动图像专家组格式,家里常看的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准,它采用了有损压缩方法减少运动图像中的冗余信息,说的更加明白一点就是MPEG 的压缩方法依据是相邻两幅画面绝大多数是相同的,把后续图像中和前面图像有冗余的部分

BMP图像格式详解

BMP格式图像文件详析 首先请注意所有的数值在存储上都是按“高位放高位、低位放低位的原则”,如12345678h放在存储器中就是7856 3412)。下图是导出来的开机动画的第一张图加上文件头后的16进制数据,以此为例进行分析。T408中的图像有点怪,图像是在电脑上看是垂直翻转的。在分析中为了简化叙述,以一个字(两个字节为单位,如424D就是一个字)为序号单位进行,“h”表示是16进制数。 424D 4690 0000 0000 0000 4600 0000 2800 0000 8000 0000 9000 0000 0100*1000 0300 0000 0090 0000 A00F 0000 A00F 0000 0000 0000 0000 0000*00F8 0000 E007 0000 1F00 0000 0000 0000*02F1 84F1 04F1 84F1 84F1 06F2 84F1 06F2 04F2 86F2 06F2 86F2 86F2 ...... BMP文件可分为四个部分:位图文件头、位图信息头、彩色板、图像数据阵列,在上图中已用*分隔。 一、图像文件头 1)1:图像文件头。424Dh=’BM’,表示是Windows支持的BMP 格式。

2)2-3:整个文件大小。4690 0000,为00009046h=36934。 3)4-5:保留,必须设置为0。 4)6-7:从文件开始到位图数据之间的偏移量。4600 0000,为00000046h=70,上面的文件头就是35字=70字节。 5)8-9:位图图信息头长度。 6)10-11:位图宽度,以像素为单位。8000 0000,为00000080h=128。 7)12-13:位图高度,以像素为单位。9000 0000,为00000090h=144。 8)14:位图的位面数,该值总是1。0100,为0001h=1。 二、位图信息头 9)15:每个像素的位数。有1(单色),4(16色),8(256色),16(64K色,高彩色),24(16M色,真彩色),32(4096M色,增强

中国电视标准频道表

中国电视频道频率划分表(单位:MHz) 频道号/频率范围图像载频伴音载频 VHF-L (Ⅰ) DS-1 48.5~56.5 49.75 56.25 DS-2 56.5~64.5 57.75 64.25 DS-3 64.5~72.5 65.75 72.25 DS-4 76.0~84.0 77.25 83.75 DS-5 84.0~92.0 85.25 91.75 Z-1 (A-1) Z-1 111~119 112.25 118.75 Z-2 119~127 120.25 126.75 Z-3 127~135 128.25 134.75 Z-4 135~143 136.25 142.75 Z-5 143~151 144.25 150.75 Z-6 151~159 152.25 158.75 Z-7 159~167 160.25 166.75 VHF-H (Ⅲ) DS-6 167~175 168.25 174.75 DS-7 175~183 176.25 182.75 DS-8 183~191 184.25 190.75 DS-9 191~199 192.25 198.75 DS-10 199~207 200.25 206.75 DS-11 207~215 208.25 214.75 DS-12 215~223 216.25 222.75 Z-2 (A-2) Z-8 223~231 224.25 230.75 Z-9 231~239 232.25 238.75 Z-10 239~247 240.25 246.75 Z-11 247~255 248.25 254.75 Z-12 255~263 256.25 262.75 Z-13 263~271 264.25 270.75 Z-14 271~279 272.25 278.75 Z-15 279~287 280.25 286.75 Z-16 287~295 288.25 294.75 Z-17 295~303 296.25 302.75 Z-18 303~311 304.25 310.75 Z-19 311~319 312.25 318.75 Z-20 319~327 320.25 326.75 Z-21 327~335 328.25 334.75 Z-22 335~343 336.25 342.75 Z-23 343~351 344.25 350.75

多媒体常见五种图像格式详解

多媒体常见五种图像格式详解 【摘要】:自此互联网以及PC的飞速发展,我们的日常生活已经高度的信息化了,多媒体应用技术也不断地深入到我们的生活中。图像、视频这些最直观的信息无时无刻的充斥着我们的眼球。这时我们需要在繁多的图像种类中辨别以及选择我们所要用到的图像种类来准确完整地传达信息。本文通过对多媒体常见的五种图像格式的详细介绍从而可以深刻的了解图像的格式特点及其应用。 【关键词】:多媒体互联网常见图像格式 一.引言 现在的互联网和多媒体技术的高速发展,多媒体的图形图像以其蕴含的信息量优美直观地显现于人们的视网膜中,给人们以绚丽丰富的视觉效果。但是多媒体图像又因其种类繁多而不能被人们所一一了解,甚至是最常见的图像格式也只是对其格式名略有耳闻。那么,本文将对多媒体常见的图像格式做一番简述,介绍它们的特性和不同点以及其实用性。 二.五种图像格式详解 1、BMP图像 BMP图像,即通常所说的位图(Bitmap),是最早应用于Windows操作系统,也是Windows操作系统中的标准图像文件格式,在Windows环境中运行的图形图像软件都支持BMP图像格式。因而这种格式的图像是最常见最简单的,像我们常用的桌面壁纸一般都是BMP格式图像。 BMP图像文件的文件结构一般认为包括了三部分:表头、调色板和图像像素数据,再细分的话,表头部分有分文件头和位图信息头。表头长度为54个字节,内容包括了BMP文件的类型、文件的大小、位图文件的保留字、位图数据距文件头的偏移量以及位图的尺寸等信息。调色板中有若干个表项相对应地定义一种颜色,从而说明位图中的颜色。只有全彩色BMP图像文件内没有调色板数据,其余不超过256种颜色的图像文件都必须设定调色板信息(电视节目制作中的图形图像格式)。图像像素数据每一个点代表一个像素值,它有着比较独特的记录方式:位图中的像素值是以在扫描行内从左到右、扫描行之间从下到上这样的顺序记录的。 BMP图像文件有下列3个特点:

FLV封装格式

FLV封装格式 FLV简介 (1) 总体及File Header结构 (1) Tag结构 (2) 音频TagData结构 (2) 视频TagData结构 (3) Script TagData结构 (4) 总结 (5) FLV简介 FLV全称是Flash Video,是互联网上使用极为广泛的视频封装格式。像爱奇艺,优酷等这类视频网站,都使用FLV封装视频。本文主要介绍FLV文件的组成结构。虽然网络上现成的介绍FLV 的帖子成百上千,但我还是觉得有必要自己也写一篇。一来自己写一遍可加强理解,二来网络上的帖子可能并不适合自己理解。最重要的是自己写的可随时修改,当发现内容有误或有新的理解时,可同步更新。特别强调,FLV文件结构中数值字段的字节序为大端。 总体及File Header结构 FLV由文件头(Flv Header)和文件体(Flv Body)组成。文件体又由一系列的Previous Tag Size& Tag对组成。见图1。PreviousTag Size表示前一Tag的数据大小。第1个Previous Tag Size 值为0,第2个Previous Tag Size值为Tag#1的数据大小,第3个Previous Tag Size值为Tag#2的数据大小,依此类推。 File Header结构如下图1.1所示:

Signatrue:文件标识,总为“FLV”。 Version:版本号,目前为1。 Flags:最高5位保留,第1位表示是否存在视频,第2位保留必须为0,第3位表示是否存在音频。例如:文件中同时有音视频,则Flags值为00000101b,即Flags值为5。 HeaderSize:file header所占空间大小,版本1中总为9。 Tag结构 Tag由Tag Header及Tag Data组成。见图2。 Type:Tag的类型。包括0x8(音频)、0x9(视频)、0x12(script data),其它值保留。DataSize:表示Tag Data段数据的大小。 Timestamp:表示Tag的时间戳。 Timestamp_ex:时间戳扩展字节,当Timestamp的3字节数值不够时使用。做为最高位字节。StreamID:表示stream id,总是0。 音频TagData结构 Tag有3种类型,包括0x8(音频)、0x9(视频)、0x12(script data)。每种类型的TagData结构都不同。下图3为音频TagData结构。

JPEG图像格式详解

JPEG图像格式详解 JPEG压缩简介 ------------- 1.色彩模型 JPEG的图片使用的是YCrCb颜色模型,而不是计算机上最常用的RGB.关于色彩模型,这里不多阐述.只是说明,YCrCb模型更适合图形压缩.因为人眼对图片上的亮度Y的变化远比色度C的变化敏感.我们完全可以每个点保存一个8bit的亮度值,每2x2个点保存一个Cr Cb值,而图象在肉眼中的感觉不会起太大的变化.所以,原来用RGB模型,4个点需要4x3=12字节.而现在仅需要4+2=6字节;平均每个点占12bit.当然JPEG格式里允许每个点的C值都记录下来;不过MPEG里都是按12bit一个点来存放的,我们简写为YUV12. [R G B]->[Y Cb Cr]转换 ------------------------- (R,G,B都是8bit unsigned) |Y||0.2990.5870.114||R||0| |Cb|=|-0.1687-0.33130.5|*|G|+|128| |Cr||0.5-0.4187-0.0813||B||128| Y=0.299*R+0.587*G+0.114*B(亮度) Cb=-0.1687*R-0.3313*G+0.5*B+128 Cr=0.5*R-0.4187*G-0.0813*B+128 [Y,Cb,Cr]->[R,G,B]转换 ------------------------- R=Y+ 1.402*(Cr-128) G=Y-0.34414*(Cb-128)-0.71414*(Cr-128) B=Y+ 1.772*(Cb-128) 一般,C值(包括Cb Cr)应该是一个有符号的数字,但这里被处理过了,方法是加上了128.JPEG里的数据都是无符号8bit的. 2.DCT(离散余弦变换) JPEG里,要对数据压缩,先要做一次DCT变换.DCT变换的原理,涉及到数学知识,这里我们不必深究.反正和傅立叶变换(学过高数的都知道)是差不多了.经过

视频封装格式详解

视频封装格式详解 所谓封装格式就是将已经编码压缩好的视频轨和音频轨按照一定的格式放到一个文件中,也 就是说仅仅是一个外壳,或者大家把它当成一个放视频轨和音频轨的文件夹也可以。说得通 俗点,视频轨相当于饭,而音频轨相当于菜,封装格式就是一个碗,或者一个锅,用来盛放 饭菜的容器。 比较常用的有以下封装格式 1 AVI AVI 容器-成熟的老技术 AVI是微软1992年推出用于对抗苹果Quicktime的技术,尽管国际学术界公认AVI已经属于 被淘汰的技术,但是由于windows的通用性,和简单易懂的开发API,还在被广泛使用。 AVI的文件结构、分为头部, 主体和索引三部分. 主体中图像数据和声音数据是交互存 放的。从尾部的索引可以索引跳到自己想放的位置。 AVI本身只是提供了这么一个框架,内部的图像数据和声音顺据格式可以是任意的编 码形式。因为索引放在了文件尾部,所以在播internet流媒体时已属力不从心。很简单的例 子,从网络上下载的片子,如果没有下载完成,是很难正常播放出来。另外一个问题是AVI 对高码率VBR音频文件支持不好。

VBR全称是Variable BitRate,就是动态比特率,可以根据当前的需要定义不同的比 特率,避免了浪费,并且提高了利用率。随之问题也就来了,因为容器里的图像和声音是分 开的,所以播放时需要一个图像和声音的同步过程,如果CBR音轨的话因为码率是定值,同 步不成为问题,可是VBR音轨是不断的在变换,而AVI没有时间戳去让VBR音轨和图像同 步,这样就会产生图像声音不同步的问题。后来VirtualDub提出了一种新的方法扩充了AVI 对VBR音频的兼容,但是在高码率时会产生丢失数据的问题,从而导致有损音效,这一点问 题到现在都没有比较完美的解决方法。并且更加令人遗憾的是,对TrueHD, DTS-HD等音 效更是完全不能支持。 2 ts和ps封装 因为HDDVD以及BD之争,尽管两家在编码上都统一采用MPEG2/VC-1/H.264,可在封装 格式上又有所分岐。DVD论坛官方所认可的HDDVD 使用的是PS封装,即Program Stream(程序流),这和之前DVD所采用的MPEG2 Program Stream封装是一样的,PS流 的后缀名是VOB以及EVO等。而BD在没有DVD论坛官方认证的情况下,自然不是PS封装, 而是使用了MPEG2的另一封装TS封装,即Transport Stream(传输流),TS流的后缀名为 TS。它们都是MPEG2系统部分的两个不同的语法结构,而在现在仅仅在作为封装使用。 TS流对于PS流来说更易传输,不过由于其性质,也更易出错,所以在以前一般存储方面都

超高清视频标准体系建设指南(2019版)全文及编制说明

超高清视频标准体系建设指南 (2019年版) 2019年12月

一、产业发展综述 超高清视频具有4K(3840×2160像素)或8K(7680×4320像素)分辨率,它具有更精细的图像细节,更强的信息承载能力,更广泛的应用范围,结合高帧率、高位深、广色域、高动态范围、三维声等技术,为消费升级、行业创新、社会治理提供新工具、新要素、新场景,将有力推动经济社会各领域的深刻变革。超高清视频产业具有产业链长、涉及范围广、跨领域综合性强等特性,正在形成全新和复杂的生态系统。 当前,视频技术从高清向超高清的演进,不仅引发了芯片、内容制播、显示、传输等产业链各环节的升级换代,而且驱动了广播电视、安防监控、教育医疗、工业制造等行业以视频为核心的服务转型。自2018年起我国超高清视频产业已达“万亿”级,据预测,到2022年,我国超高清视频产业总体规模将超过4万亿元。 超高清视频产业链重点环节主要包括核心元器件、内容制播、网络传输、终端呈现以及行业应用。其中核心元器件为超高清视频专用基础元器件;内容制播包含超高清视频的生产与播出;网络传输指超高清视频的传输渠道;终端呈现涉及电视机、机顶盒等产品;行业应用为超高清视频与各行业融合应用形成的新模式新业态。

图1超高清视频产业链 二、建设指南编制总体要求 以《超高清视频产业发展行动计划(2019-2022年)》为指导,从超高清视频产业发展实际出发,坚持标准先行,建立覆盖采集、制作、传输、呈现、应用等全产业链的超高清视频标准体系,加强标准的统筹规划,鼓励国家标准、行业标准和团体标准协同发展,深化标准国际交流与合作,促进我国超高清视频产业健康可持续发展。 (一)基本原则 ——系统布局,统筹推进。加强标准体系顶层设计,明确标准化的重点领域和方向,指导标准化工作分领域同步推进实施,加强超高清视频标准制定工作的整体协调。统筹国

JPEG图像格式详解

JPEG图像格式详解 JPEG 压缩简介 ------------- 1. 色彩模型 JPEG 的图片使用的是 YCrCb 颜色模型, 而不是计算机上最常用的 RGB. 关于色彩模型, 这里不多阐述. 只是说明, YCrCb 模型更适合图形压缩. 因为人眼对图片上的亮度 Y 的变化远比色度 C 的变化敏感. 我们完全可以每个点保存一个 8bit 的亮度值, 每 2x2 个点保存一个 Cr Cb 值, 而图象在肉眼中的感觉不会起太大的变化. 所以, 原来用 RGB 模型, 4 个点需要 4x3=12 字节. 而现在仅需要 4+2=6 字节; 平均每个点占 12bit. 当然 JPEG 格式里允许每个点的 C 值都记录下来; 不过 MPEG 里都是按 12bit 一个点来存放的, 我们简写为 YUV12. [R G B] -> [Y Cb Cr] 转换 ------------------------- (R,G,B 都是 8bit unsigned) | Y | | 0.299 0.587 0.114 | | R | | 0 | | Cb | = |- 0.1687 - 0.3313 0.5 | * | G | + |128| | Cr | | 0.5 - 0.4187 - 0.0813| | B | |128| Y = 0.299*R + 0.587*G + 0.114*B (亮度) Cb = - 0.1687*R - 0.3313*G + 0.5 *B + 128 Cr = 0.5 *R - 0.4187*G - 0.0813*B + 128 [Y,Cb,Cr] -> [R,G,B] 转换 ------------------------- R = Y + 1.402 *(Cr-128) G = Y - 0.34414*(Cb-128) - 0.71414*(Cr-128) B = Y + 1.772 *(Cb-128) 一般, C 值 (包括 Cb Cr) 应该是一个有符号的数字, 但这里被处理过了, 方法是加上了 128. JPEG 里的数据都是无符号 8bit 的. 2. DCT (离散余弦变换) JPEG 里, 要对数据压缩, 先要做一次 DCT 变换. DCT 变换的原理, 涉及到数学知识, 这里我们不必深究. 反正和傅立叶变换(学过高数的都知道) 是差不多了. 经过这个变换, 就把图片里点和点间的规律呈现出来了, 更方便压缩.JPEG 里是对每 8x8

MP4文件格式解析-----个人总结讲解

目录 1.引言 (1) 2.MP4中一些概念详解 (1) 3.MP4文件结构分析 (1) 3.1box结构 (1) 3.2MP4总体结构 (2) 3.3Movie box(moov) (3) 3.3.1Movie Header box(mvhd) (3) 3.3.2Trak box (4) 3.4Media box (6) 3.4.1Media header box(mdhd) (6) 3.4.2Hdlr box (7) 3.4.3Minf box (7) 3.5Sample Table Box(stbl) (8) 3.5.1Sample Description Box(stsd) (8) 3.5.2Time To Sample Box(stts) (8) 3.5.3Sample Size Box(stsz) (8) 3.5.4Sample To Chunk Box(stsc) (8) 3.5.5Sync Sample Box(stss) (9) 3.5.6Chunk Offset Box(stco) (9)

MP4文件格式解析总结 1.引言 MP4是一种常见的多媒体容器格式,对应MPEG-4标准,这种容器格式非常全面开放,被认为可以在其中嵌入任何形式的数据,各种编码的视频、音频等都可以。在MP4文件中,媒体的描述信息与媒体数据是分开的,并且媒体数据的组织也很自由,不一定要按照时间顺序排列。同时,MP4也支持流媒体,MP4目前被广泛用于封装h.264视频和AAC音频,是高清视频的代表。MP4格式的官方文件后缀名是“.mp4”,还有其他的以mp4为基础进行的扩展或者是缩水版本的格式。 2.MP4中一些概念详解 MP4文件格式中,所有的内容存在一个称为movie的容器中。一个movie可以由多个tracks组成。每个track就是一个随时间变化的媒体序列,track里的每个时间单位是一个sample,它可以是一帧视频,或者一段连续的压缩音频。sample按照时间顺序排列。其中一帧音频可以分解成多个音频sample,所以音频一般用sample作为单位,而不用帧。MP4文件格式的定义里面,用sample表示一个时间帧或者数据单元。 几个连续的sample就构成了一个chunk。 3.MP4文件结构分析 3.1box结构

视频文件格式详解

以下内容均来自网络。不是本人原创,属于转载内容。但对很多玩视频的人,意义重大。其中包含了很多关于电影相关的术语,一定要看完,才有用。 现在很多人下载电影很迷茫不知道怎么下不知道怎么选择接下来就介绍一下电影的一些知识. 首先我们来举个栗子 视频文件:Mr.and.Mrs.Smith.2005.XviD.AC3.WAF.avi 它表示电影名为Mr.and.Mrs.Smith;发布年:2005年;视频编码:XviD;音频编码:AC3;压缩组织:WAF;格式为AVI。字幕文件:Cht.gb5.srt 它表示SRT字幕;繁体中文GB5编码。注:CHT表示繁体中文,CHS:表示简体中文 接下来就是介绍各种常见的一些来源,格式和术语 一来源分类 1.CAM(枪版)——珍爱生命,远离枪版 CAM 通常是用数码摄像机从电影院盗录。有时会使用小三角架,但大多数时候不可能使用,所以摄像机会抖动。因此我们看到画面通常偏暗人物常常会失真,下方的字幕时常会出现倾斜。由于声音是从摄像机自带的话筒录制,所以经常会录到观众的笑声等声音。因为这些因素,图象和声音质量通常都很差。 举例说明:Journey.To.The.Center.Of.The.Earth.CAM.XViD-CAMERA(地心游记3D枪版) 2.TS(准枪版)——只比枪版好一点 TS 与CAM版的标准是相同的。但它使用的是外置音源(一般是影院座椅上为听力不好的人设的耳机孔)这个音源不能保证是好的音源,因为受到很多背景噪音的干扰。TS是在空的影院或是用专业摄像机在投影室录制,所以图象质量可能比CAM好。但画面的起伏很大。论坛上常出现的有一般TS版和经过修复清晰TS版 举例说明:Iron.Man.PROPER.TS.XviD-iLG(钢铁侠TS版) 3.TC(胶片版)——基本也可以忽略 TC使用电视电影机从胶片直接数字拷贝。画面质量还不错,但亮度不足,有些昏暗。很多时候制作TC使用的音源来自TS,因此音质很差,但画面质量远好过TS。如果不是太讲究的话TC版还是不错的选择。 举例说明:Madagascar.2005.TC.XviD.AC3.avi(马达加斯加TC版) 4.DVDSCR(预售版)——最差也要看这个

图像格式详细解析

YUV格式详解 1.什么是RGB? RGB是红绿蓝三原色的意思,R=Red、G=Green、B=Blue。 2.什么是YUV/YCbCr/YPbPr? 亮度信号经常被称作Y,色度信号是由两个互相独立的信号组成。视颜色系统和格式不同,两种色度信号经常被称作U和V或Pb和Pr或Cb和Cr。这些都是由不同的编码格式所产生的,但是实际上,他们的概念基本相同。在DVD中,色度信号被存储成Cb和Cr (C代表颜色,b代表蓝色,r代表红色)。 3.什么是4:4:4、4:2:2、4:2:0? 在最近十年中,视频工程师发现人眼对色度的敏感程度要低于对亮度的敏感程度。在生理学中,有一条规律,那就是人类视网膜上的视网膜杆细胞要多于视网膜锥细胞,说得通俗一些,视网膜杆细胞的作用就是识别亮度,而视网膜锥细胞的作用就是识别色度。所以,你的眼睛对于亮和暗的分辨要比对颜色的分辨精细一些。正是因为这个,在我们的视频存储中,没有必要存储全部颜色信号。既然眼睛看不见,那为什么要浪费存储空间(或者说是金钱)来存储它们呢? 像Beta或VHS之类的消费用录像带就得益于将录像带上的更多带宽留给黑—白信号(被称作“亮度”),将稍少的带宽留给彩色信号(被称作“色度”)。 在MPEG2(也就是DVD使用的压缩格式)当中,Y、Cb、Cr信号是分开储存的(这就是为什么分量视频传输需要三条电缆)。其中Y信号是黑白信号,是以全分辨率存储的。但是,由于人眼对于彩色信息的敏感度较低,色度信号并不是用全分辨率存储的。 色度信号分辨率最高的格式是4:4:4,也就是说,每4点Y采样,就有相对应的4点Cb和4点Cr。换句话说,在这种格式中,色度信号的分辨率和亮度信号的分辨率是相同的。这种格式主要应用在视频处理设备内部,避免画面质量在处理过程中降低。当图像被存储到Master Tape,比如D1或者D5,的时候,颜色信号通常被削减为4:2:2。

mp4文件结构解析

MPEG-4文件结构解析 目前MP4的概念被炒得很火,也很乱。最开始MP4指的是音频(MP3的升级版),即MPEG-2 AAC标准。随后MP4概念被转移到视频上,对应的是MPEG-4标准。而现在我们流行的叫法,多半是指能播放MPEG-4标准编码格式视频的播放器。但是这篇文章介绍的内容跟上面这些都无关,我们要讨论的是MP4文件封装格式,对应的标准为ISO/IEC 14496-12,即信息技术视听对象编码的第12部分:ISO基本媒体文件格式(Information technology Coding of audio-visual objects Part 12: ISO base media file format)。ISO/IEC组织指定的标准一般用数字表示,ISO/IEC 14496即MPEG-4标准。 MP4视频文件封装格式是基于QuickTime容器格式定义的,因此参考QuickTime的格式定义对理解MP4文件格式很有帮助。MP4文件格式是一个十分开放的容器,几乎可以用来描述所有的媒体结构,MP4文件中的媒体描述与媒体数据是分开的,并且媒体数据的组织也很自由,不一定要按照时间顺序排列,甚至媒体数据可以直接引用其他文件。同时,MP4也支持流媒体。MP4目前被广泛用于封装h.264视频和AAC音频,是高清视频的代表。 现在我们就来看看MP4文件格式到底是什么样的。 1、概述 MP4文件中的所有数据都装在box(QuickTime中为atom)中,也就是说MP4文件由若干个box组成,每个box有类型和长度,可以将box理解为一个数据对象块。box中可以包含另一个box,这种box称为container box。一个MP4文件首先会有且只有一个“ftyp”类型的box,作为MP4格式的标志并包含关于文件的一些信息;之后会有且只有一个“moov”类型的box(Movie Box),它是一种container box,子box包含了媒体的metadata信息;MP4文件的媒体数据包含在“mdat”类型的box(Midia Data Box)中,该类型的box也是container box,可以有多个,也可以没有(当媒体数据全部引用其他文件时),媒体数据的结构由metadata进行描述。 下面是一些概念: track表示一些sample的集合,对于媒体数据来说,track表示一个视频或音频序列。 hint track这个特殊的track并不包含媒体数据,而是包含了一些将其他数据track打包成流媒体的指示信息。 sample对于非hint track来说,video sample即为一帧视频,或一组连续视频帧,audio sample即为一段连续的压缩音频,它们统称sample。对于hint track,sample定义一个或多个流媒体包的格式。

中国最新的数字电视传输标准[详]

数字电视标准概述一、什么是数字电视 来自.szfuwa./bbs/ 数字电视(Digital TV)是从电视信号的采集、编辑、传播、接收整个广播链路数字化的数字电视广播系统。数字电视利用MPEG标准中的各种图像格式,把现行模拟电视制式下的图像、伴音信号的平均码率压缩到大约4.69―21Mbps,其图像质量可以达到电视演播室的质量水平,胶片质量水平,图像水平清晰度达到500―1200线以上,并采用AC―3声音信号压缩技术,传输5.1声道的环绕声信号。 二、数字电视的分类 按清图像晰度分类,数字电视包括数字高清晰度电视(HDTV)、数字标准清晰度电视(SDTV)和数字普通清晰度电视(LDTV)三种。HDTV的图像水平清晰度大于800线,图象质量可达到或接近35mm宽银幕电影的水平;SDTV的图像水平清晰度大于500线,主要是对应现有电视的分辨率量级,其图象质量为演播室水平;LDTV的图像水平清晰度为200-300线,主要是对应现有VCD的分辨率量级。 按信号传输方式分类,数字电视可分为地面无线传输数字电视(地面数字电视)、卫星传输数字电视(卫星数字电视)、有线传输数字电视(有线数字电视)三类。 按照产品类型分类,数字电视可分为数字电视显示器、数字电视机顶盒和一体化数字电视接收机。 按显示屏幕幅型比分类,数字电视可分为4∶3幅型比和16∶9幅型比两种类型。 三、数字电视系统的关键技术及标准 1、数字电视的信源编解码技术 视频编解码技术 数字电视尤其数字高清晰度电视与模拟电视相比,在实现过程中,最为困难的部分就是对视频信号的压缩。在1920×1080显示格式下,数字化后的码率在传输中高达995Mbit/s,这比现行模拟电视的传输信息量大得多。因而数字电视的图像不能象模拟电视的图像那样直接传输,而是要多一道压缩编码工序。视频编码技术主要功能是完成图像的压缩,使数字电视的信号传输量由995Mbit/s减少为20?30Mbit/s。 音频编解码技术 与视频编解码相同,音频编解码主要功能是完成声音信息的压缩。声音信号数字化后,信息量比模拟传输状态大得多,因而数字电视的声音不能象模拟电视的声音那样直接传输,而是要多一道压缩编码工序。

各种视频格式特点

各种视频格式特点 2007年12月30日星期日 23:23 AVI格式:它的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Microsoft公司推出,随Windows3.1一起被人们所认识和熟知。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。 这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大, 而且更加糟糕的是压缩标准不统一 MPEG格式:它的英文全称为Moving Picture Expert Group,即运动图像专家组格式, 家里常看的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准, 它采用了有损压缩方法减少运动图像中的冗余信息,说的更加明白一点就是MPEG的压缩方法依 据是相邻两幅画面绝大多数是相同的,把后续图像中和前面图像有冗余的部分去除, 从而达到压缩的目的(其最大压缩比可达到200:1)。目前MPEG格式有三个压缩标准, 分别是MPEG-1、MPEG-2、和MPEG-4,另外,MPEG-7与MPEG-21仍处在研发阶段。 MPEG-1:制定于1992年,它是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及 其伴音编码而设计的国际标准。也就是我们通常所见到的VCD制作格式。 使用MPEG-1的压缩算法,可以把一部120分钟长的电影压缩到1.2GB左右大小。这种视频格式的文件扩展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盘中的.dat 文件等。 MPEG-2:制定于1994年,设计目标为高级工业标准的图像质量以及更高的传输率。 这种格式主要应用在DVD/SVCD的制作(压缩)方面,同时在一些HDTV(高清晰电视广播)和 一些高要求视频编辑、处理上面也有相当的应用。使用MPEG-2的压缩算法, 可以把一部120分钟长的电影压缩到4到8GB的大小。这种视频格式的文件扩展名 包括.mpg、.mpe、.mpeg、.m2v及DVD光盘上的.vob文件等。 MPEG-4:制定于1998年,MPEG-4是为了播放流式媒体的高质量视频而专门设计的, 它可利用很窄的带度,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最 佳的图像质量。目前MPEG-4最有吸引力的地方在于它能够保存接近于DVD画质

医学图像格式分析与转换

医学图像格式分析与转换 本文分为三个部分——医学图像及其组成、医学图像格式和医学图像的格式转换。本文希望通过对深度学习的相关知识的介绍,最终达到医学图像分析的目的。 医学图像及其组成 由Michele Larobina和Loredana Murino发表的论文,对本文即将展开的讨论来说是一个很好的信息参考。Michele Larobina和Loredana Murino二人是意大利“生物架构和生物成像协会”(IBB)的成员。IBB是意大利“国家研究委员会”的组成部分,同时也是意大利最大的公共研究机构。我们的另一个参考信息资源是一篇题为《Working with the DICOM and NIfTI data standards in R》的论文。 ?什么是医学图像? 医学图像是反映解剖区域内部结构或内部功能的图像,它是由一组图像元素——像素(2D)或立体像素(3D)——组成的。医学图像是由采样或重建产生的离散性图像表征,它能将数值映射到不同的空间位置上。像素的数量是用来描述某一成像设备下的医学成像的,同时也是描述解剖及其功能细节的一种表达方式。像素所表达的具体数值是由成像设备、成像协议、影像重建以及后期加工所决定的。 ?医学图像的组成

医学图像组成医学图像有四个关键成分——像素深度、光度表示、元数据和像素数据。这些成分与图像大小和图像分辨率有关。 图像深度(又称比特深度或颜色深度)是用来编码每个像素信息的比特数。比如说,一个8比特的光栅可以有256个从0到255数值不等的图像深度。 “光度表示”解释了像素数据如何以正确的图像格式(单色或彩色图片)显示。为了说明像素数值中是否存在色彩信息,我们将引入“每像素采样数”的概念。单色图像只有一个“每像素采样”,而且图像中没有色彩信息。图像是依靠由黑到白的灰阶来显示的,灰阶的数目很明显取决于用来储存样本的比特数。在这里,灰阶数与像素深度是一致的。医疗放射图像,比如CT 图像和磁共振(MR)图像,是一个灰阶的“光度表示”。而核医学图像,比如正电子发射断层图像(PET)和单光子发射断层图像(SPECT),通常都是以彩色映射或调色板来显示的。 “元数据”是用于描述图形象的信息。它可能看起来会比较奇怪,但是在任何一个文件格式中,除了像素数据之外,图像还有一些其他的相关信息。这样的图像信息被称为“元数据”,它通常以“数据头”的格式被储存在文件的开头,涵盖了图像矩阵维度、空间分辨率、像素深度和光度表示等信息。

常用视频格式详解

常用视频格式详解 视频格式介绍: 所谓“知己知彼,方能百战不殆!”,熟悉了各种各样的视频格式,才能够为后来的视频格式的转换打好基础。下面就来详细地为给大家介绍一些常见的视频格式: 1.AVI格式 它的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Micr osoft公司推出,随Windows3.1一起被人们所认识和熟知。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,但是其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,因此经常会遇到高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windo ws媒体播放器又播放不了采用最新编码编辑的AVI格式视频。其实解决的方法也非常简单,我们将在后面的视频转换、视频修复部分中给出解决的方案。 2.DV-AVI格式 DV的英文全称是Digital Video Format,是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。目前非常流行的数码摄像机就是使用这种格式记录视频数据的。它可以通过电脑的IEEE 1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名一般也是.avi,所以我们习惯地叫它为DV-AVI格式。 3.MPEG格式 它的英文全称为Moving Picture Expert Group,即运动图像专家组格式,家里常看的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准,它采用了有损压缩方法从而减少运动图像中的冗余信息。MPEG的压缩方法说的更加深入一点就是保留相邻两幅画面绝大多数相同的部分,而把后续图像中和前面图像有冗余的部分去

相关主题
文本预览
相关文档 最新文档