当前位置:文档之家› 详解wave头格式(尽可能详细并附代码)

详解wave头格式(尽可能详细并附代码)

详解wave头格式(尽可能详细并附代码)
详解wave头格式(尽可能详细并附代码)

整理网上和读书时的资料,结合自己的实际经验,给出wav头格式的解释和源代码,既是对自己的总结,同时又服务大家。另外在给出几个实际例子,如果看了这篇文档还不能正确写出wave文件,那就要吊起来打了^_^。

——flywen 2010-10-13

参考网址一:https://www.doczj.com/doc/203105769.html,/sshcx/archive/2007/05/01/1593923.aspx

参考网址二:https://www.doczj.com/doc/203105769.html,/share/detail/15909594

WAVE 文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是"RIFF"。WAVE 文件由文件头和数据体两大部分组成。其中文件头又分为RIFF/WAV文件 标识段和声音数据格式说明段两部分。

常见的声音文件主要有两种,分别对应于单声道(11.025KHz 采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指:声音信号在"模→数"转换过程中单位时间内采样的次数。 采样值是指每一次采样周期内声音模拟信号的积分值。

[!21ki@][@21ki!]

对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。

WAVE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAVE文件是由样本组织而成的。在单声道WAVE文件中,声道0代表左声道,声道1代表右声道。在多声道WAVE文件中,样本是交替出现的。

参考网址一和二中都给出了wav的头定义,但有一个小区别,一中将这个44个字节作为一个大的头,给定在一个结构体中,而二中则是按照四个不同的chunk处理的,所以就给了四个结构体,后面我的代码也是根据二来写的,个人觉得这样比较清晰,不过这纯属个人感觉。

下面就是根据四个结构体写的代码,注意FACT不是必须的,可以不用写入头,不写的话就是44个字节,写的话wave的头是56个字节。

一:源代码(参考二中也有比较详细的读wave头的代码)

#if !defined(_WAV_INFO_)

#define _WAV_INFO_

// 一些和声音数据相关的宏

#define SAMPLE_RATE 22050 // sample rate,每秒22050个采样点 #define QUANTIZATION 0x10 // 16bit量化,

#define BYTES_EACH_SAMPLE 0x2 // QUANTIZATION / 8, 所以每个采样点、

// 是short,占个2个字节

#define CHANNEL_NUN 0x1 // 单声道

#define FORMAT_TAG 0x1 // 线性PCM

// 一个wave file包括四个CHUNK,除了FACT之外,其它是必须的,并且第一个RIFF是整个文件的头,// 所以别名为WAV_HEADER,而不是RIFF

/*------------------------Wave File Structure ------------------------------------ */ typedef struct RIFF_CHUNK{

char fccID[4]; // must be "RIFF"

unsigned long dwSize; // all bytes of the wave file subtracting 8,

// which is the size of fccID and dwSize char fccType[4]; // must be "WAVE"

}WAVE_HEADER;

// 12 bytes

typedef struct FORMAT_CHUNK{

char fccID[4]; // must be "fmt "

unsigned long dwSize; // size of this struct, subtracting 8, which

// is the sizeof fccID and dwSize unsigned short wFormatTag; // one of these: 1: linear,6: a law,7:u-law unsigned short wChannels; // channel number

unsigned long dwSamplesPerSec; // sampling rate

unsigned long dwAvgBytesPerSec; // bytes number per second

unsigned short wBlockAlign; // 每样本的数据位数(按字节算), 其值为:通道

// 数*每样本的数据位值/8,播放软件需要一次处

// 理多个该值大小的字节数据, 以便将其值用于

// 缓冲区的调整每样本占几个字节:

// NumChannels * uiBitsPerSample/8

unsigned short uiBitsPerSample; // quantization

}FORMAT;

// 24 bytes

// The fact chunk is required for all new WAVE formats.

// and is not required for the standard WAVE_FORMAT_PCM files

// 也就是说,这个结构体目前不是必须的,一般当wav文件由某些软件转化而成,则包含该Chunk

// 但如果这里写了,则必须是如下的结构,并且在四个结构体中的位置也要放在第三

typedef struct {

char fccID[4]; // must be "fact"

unsigned long id; // must be 0x4

unsigned long dwSize; // 暂时没发现有啥用

}FACT;

// 12 bytes

// 数据结构

typedef struct {

char fccID[4]; // must be "data"

unsigned long dwSize; // byte_number of PCM data in byte

}DATA;

// 8 bytes

/*------------------------Wave File Structure ------------------------------------ */

void WriteWaveHeader(FILE *fpwav,long length)

{

WAVE_HEADER WaveHeader;

FORMAT WaveFMT;

DATA WaveData;

FACT WaveFact;

memset(&WaveHeader, 0, sizeof(WAVE_HEADER));

memcpy(WaveHeader.fccID, "RIFF", 4);

memcpy(WaveHeader.fccType, "WAVE", 4);

// dwSize 是整个wave文件的大小(字节数,但不包括不包括HEADER中的前面两个结构:

// HEADER.fccID和HEAD.dwSize)

// WaveHeader.dwSize = length + 0x24; // 如果不写入fact,就是36个字节,

// 44- 8 = 36个 WaveHeader.dwSize = length + 0x30; // 如果写入fact,就是48 个bytes

memset(&WaveFMT, 0, sizeof(FORMAT));

memcpy(WaveFMT.fccID, "fmt ", 4);

WaveFMT.dwSize = 0x10;

WaveFMT.dwSamplesPerSec = SAMPLE_RATE;

WaveFMT.dwAvgBytesPerSec = CHANNEL_NUN * SAMPLE_RATE * BYTES_EACH_SAMPLE;

WaveFMT.wChannels = CHANNEL_NUN;

WaveFMT.uiBitsPerSample = QUANTIZATION;

WaveFMT.wFormatTag = FORMAT_TAG;

WaveFMT.wBlockAlign = BYTES_EACH_SAMPLE;

memset(&WaveFact, 0, sizeof(FACT));

memcpy(WaveFact.fccID, "fact", 4);

WaveFact.dwSize = length; // 这个值不知道什么意思

WaveFact.id = 0x4;

memset(&WaveData, 0, sizeof(DATA));

memcpy(WaveData.fccID, "data", 4);

WaveData.dwSize = length;

fwrite(&WaveHeader, sizeof(WAVE_HEADER), 1, fpwav);

fwrite(&WaveFMT, sizeof(FORMAT), 1, fpwav);

fwrite(&WaveFact, sizeof(FACT), 1, fpwav); // fact不是必须的

fwrite(&WaveData, sizeof(DATA), 1, fpwav);

}

void WriteWavfile(FILE *fp, short *pSpeechData, int length)

{

//write the header of wav

WriteWaveHeader(fp, length * BYTES_EACH_SAMPLE);

//write the data

fwrite(pSpeechData, sizeof(short), length, fp);

}

#endif

二:数据存储结构:

根据声音文件的声道和量化数的不同,在头之后的数据存储有不同的格式,如下面:https://www.doczj.com/doc/203105769.html,/share/detail/15909594

---------------------------------------------------------------------

| 单声道| 取样1 | 取样2 | 取样3 | 取样4 |

| | --------------------------------------------------------

| 8bit量化| 声道0 | 声道0 | 声道0 | 声道0 |

---------------------------------------------------------------------

| 双声道| 取样1 | 取样2 |

| |--------------------------------------------------------

| 8bit量化| 声道0(左) | 声道1(右) | 声道0(左) | 声道1(右) |

---------------------------------------------------------------------

| | 取样1 | 取样2 |

| 单声道|--------------------------------------------------------

| 16bit量化| 声道0 | 声道0 | 声道0 | 声道0 |

| | (低位字节) | (高位字节) | (低位字节) | (高位字节) |

---------------------------------------------------------------------

| | 取样1 |

| 双声道|--------------------------------------------------------

| 16bit量化| 声道0(左) | 声道0(左) | 声道1(右) | 声道1(右) |

| | (低位字节) | (高位字节) | (低位字节) | (高位字节) |

---------------------------------------------------------------------

图:Wav的data数据的bit位置可能的几种形式

三:各种头示例

常用语音编码的WAVE文件头格式剖析--各种编码

https://www.doczj.com/doc/203105769.html,/content/10/0812/10/722458_45443101.shtml

表18KHz采样、16比特量化的线性PCM语音信号的WAVE文件头格式表(共44字节)偏移地址字节数数据类型内容文件头定义为

00H 4 char "RIFF" char riff_id[4]="RIFF"

04H 4 long int 文件总长-8 long int size0=文总长-8

08H 8 char "WAVEfmt " char wave_fmt[8]

10H 4 long int 10 00 00 00H(PCM) long int size1=0x10

14H 2 int 01 00H int fmttag=0x01

16H 2 int int channel=1 或2

18H 4 long int 采样率long int samplespersec

1CH 4 long int 每秒播放字节数long int bytepersec

20H 2 int 采样一次占字节数int blockalign=声道数*量化数/8

22H 2 int 量化数int bitpersamples=8或16

24H 4 char "data" char data_id="data"

28H 4 long int 采样数据字节数long int size2=文长-44

2CH 到文尾char 采样数据

表28KHz采样、8比特A律量化的PCM语音信号的WAVE文件头格式表(共58字节)

偏移地址字节数数据类型内容文件头定义为

00H 4 char "RIFF" char riff_id[4]="RIFF"

04H 4 long int 文件总长-8 long int size0=文总长-8

08H 8 char "WAVEfmt " char wave_fmt[8]

10H 4 long int 12000000H(ALAW) long int size1=0x12

14H 2 int 06 00H int fmttag=0x06

16H 2 int 声道数int channel=1 或2

18H 4 long int 采样率long int samplespersec

1CH 4 long int 每秒播放字节数long int bytepersec

20H 2 int 采样一次占字节数int blockalign=0x01

22H 4 long int 量化数long int bitpersamples=8

26H 4 char "fact" char wave_fact="fact"

2AH 8 char 0400000000530700H定char temp

32H 4 char "data" char wave_data="data"

36H 4 long int 采样数据字节数lont int size2=文长-58

表38KHz采样、8比特U律量化的PCM语音信号的WAVE文件头格式表(共58字节)偏移地址字节数数据类型内容文件头定义为

00H 4 char "RIFF" char riff_id[4]="RIFF"

04H 4 long int 文件总长-8 long int size0=文总长-8

08H 8 char "WAVEfmt " char wave_fmt[8]

10H 4 long int 12000000H(ULAW) long int size1=0x12

14H 2 int 07 00H int fmttag=0x07

16H 2 int 声道数int channel=1 或2

18H 4 long int 采样率long int samplespersec

1CH 4 long int 每秒播放字节数long int bytepersec

20H 2 int 采样一次占字节数int blockalign=0x01

22H 4 long int 量化数long int bitpersamples=8

26H 4 char "fact" char wave_fact="fact"

2AH 8 char 0400000000530700H定char temp

32H 4 char "data" char wave_data="data"

36H 4 long int 采样数据字节数lont int size2=文长-58

表4ADPCM语音编码后的WAVE文件头格式表(共90字节)偏移地址字节数数据类型内容文件头定义为

00H 4 char "RIFF" char riff_id[4]="RIFF"

04H 4 long int 文件总长-8 long int size0=文总长-8

08H 8 char "WAVEfmt " char wave_fmt[8]

10H 4 long int 32000000H(ADPCM) long int size1=0x32

14H 2 int 02 00H int fmttag=0x02

16H 2 int 声道数int channel=1 或2

18H 4 long int 采样率long int samplespersec

1CH 4 long int 每秒播放字节数long int bytepersec

20H 2 int 采样一次占字节数int blockalign=声道数*量化数/8

22H 2 int 量化数int bitpersamples=4

24H 34 char 固定字节char temp1

46H 4 char "fact" char wave_fact="fact"

4AH 8 char 0400000004930600H定char temp2

52H 4 char "data" char wave_data="data"

56H 4 long int 采样数据字节数lont int size2=文长-90

5AH 到文尾采样数据

表5GSM语音编码后的WAVE文件头格式表(共60字节)

偏移地址字节数数据类型内容文件头定义为

00H 4 char "RIFF" char riff_id[4]="RIFF"

04H 4 long int 文件总长-8 long int size0=文总长-8

08H 8 char "WAVEfmt " char wave_fmt[8]

10H 4 long int 14000000H(GSM) long int size1=0x14

14H 2 int 31 00H int fmttag=0x31

16H 2 int 声道数int channel=1 或2

18H 4 long int 采样率long int samplespersec

1CH 4 long int 每秒播放字节数long int bytepersec

20H 8 char 4100000002004001H定char temp1

28H 8 char 6661637404000000H定char temp2

30H 4 char 40 E2 05 00H定char temp3

34H 4 char "data" char wave_data="data"

38H 4 long int 采样数据字节数lont int size2=文长-60

3CH 到文尾采样数据

表6SBC语音编码后的WAVE文件头格式表(共58字节)偏移地址字节数数据类型内容文件头定义为

00H 4 char "RIFF" char riff_id[4]="RIFF"

04H 4 long int 文件总长-8 long int size0=文总长-8

08H 8 char "WAVEfmt " char wave_fmt[8]

10H 4 long int 12000000H(SBC) long int size1=0x12

14H 2 int 71 00H int fmttag=0x71

16H 2 int 声道数int channel=1 或2

18H 4 long int 采样率long int samplespersec

1CH 4 long int 每秒播放字节数long int bytepersec

20H 2 int 采样一次占字节数int blockalign=0x25

22H 4 long int 量化数long int bitpersamples=16

26H 4 char "fact" char wave_fact="fact"

2AH 8 char 0400000076280400H定char temp

32H 4 char "data" char wave_data="data"

36H 4 long int 采样数据字节数lont int size2=文长-59

表7CELP语音编码后的WAVE文件头格式表(共58字节)偏移地址字节数数据类型内容文件头定义为

00H 4 char "RIFF" char riff_id[4]="RIFF"

04H 4 long int 文件总长-8 long int size0=文总长-8

08H 8 char "WAVEfmt " char wave_fmt[8]

10H 4 long int 12000000H(CELP) long int size1=0x12

14H 2 int 70 00H int fmttag=0x70

16H 2 int 声道数int channel=1 或2

18H 4 long int 采样率long int samplespersec

1CH 4 long int 每秒播放字节数long int bytepersec

20H 2 int 采样一次占字节数int blockalign=0x0C

22H 4 long int 量化数long int bitpersamples=16

26H 4 char "fact" char wave_fact="fact"

2AH 8 char 0400000060520700H定char temp

32H 4 char "data" char wave_data="data"

36H 4 long int 采样数据字节数lont int size2=文长-58

WAVEFORMATEX

typedef struct{WORD wFormatTag; WORD nChannels; DWORD nSamplesPerSec; DWORD nAvgBytesPerSec; WORD nBlockAlign; WORD wBitsPerSample; WORD cbSize; } WAVEFORMATEX;

具体参数解释如下:

wFormatTag:波形数据的格式,定义在MMREG.H文件中

nChannels:波形数据的通道数:单声道或立体声

nSamplesPerSec:采样率,对于PCM格式的波形数据,采样率有8.0 kHz,11.025kHz,22.05 kHz,44.1 kHz等

nAvgBytesPerSec:数据率,对于PCM格式的波形数据,数据率等于采样率乘以每样点字节数nBlockAlign:每个样点字节数

wBitsPerSample:采样精度,对于PCM格式的波形数据,采样精度为8或16

cbSize:附加格式信息的数据块大小

概念2、定义设备头结构

WAVEHDR定义了指向波形数据缓冲区的设备头。

WAVEHDR

typedef struct { LPSTR lpData; DWORD dwBufferLength; DWORD dwBytesRecorded; DWORD dwUser; DWORD dwFlags; DWORD dwLoops; struct wavehdr_tag * lpNext; DWORD reserved; } WAVEHDR;

lpData:波形数据的缓冲区地址

dwBufferLength:波形数据的缓冲区地址的长度

dwBytesRecorded:当设备用于录音时,标志已经录入的数据长度

dwUser:用户数据

dwFlags:波形数据的缓冲区的属性

dwLoops:播放循环的次数,仅用于播放控制中

lpNext和reserved均为保留值

注意:上述结构体以及我们在程序中所使用到的“HWAVEIN””HWAVEOUT”结构体均是系统已经存在的,我们只需要对其进行赋值即可。

常用音频格式

常用音频格式 1、WAV:是微软公司开发的一种声音格式文件,也叫波形声音文件,是最早的数字音频格式,对存储空间需求太大不便于交流和传播。 2、MIDI:又称作乐器数字接口,是数字音乐/电子合成乐器的统一国际标准。。 3、CD:CD存储采用了音轨的形式,记录的是波形流,是一种近似无损的格式。 4、MP3:全称是MPEG-1 Audio Layer3,它在1992年合并至MPEG规范中。MP3能以高音质、低采样率对数字音频文件进行压缩。 5、WMA:是微软在互联网音频、视频领域的力作。WMA格式是以减少数据流量但保持音质的方法来达到更高压缩率(可达到1:18)。 6、MP4:MP4的压缩比达到了1:15,体积较MP3小,但音质没有下降。? 7、DVDAudio:是新一代的数字音频格式,为音乐格式的DVD光碟。? 8、MD:Sony公司的MD(Mini Disc),立体声音乐。 ?9、RealAudio:是由RealNetworks公司推出的一种文件格式,可以实时传输音频信息,主要适用于网络上的在线播放。文件格式主要有RA、RM、RMX。 ?10、AIFF:是苹果公司开发的声音文件格式,被Macintosh平台和应用程序所支持。 ?11、MAC:Apple计算机公司所开发的声音文件格式,被Macintosh 平台和Macintosh应用程序所支持,支持某些压缩。 常用视频格式 ?1、MPEG/MPG/DAT:包括MPEG-1、MPEG-2或MPEG-4在内的多种视频格式。 ?2、AVI:音频视频交错(Audio Video Interleaved),由微软公司发表,调用方便、图像质量好,但文件体积过于庞大。 ?3、RA/RM/RAM:其图像质量比VCD差些。 ?4、MOV:MAC机中QuickTime提供2种标准图像和数字视频格式,即可以支持静态的PIC和JPG图像格式,动态的基于Indeo压缩法的MOV和基于MPEG压缩法MPG视频格式。 ?5、ASF:是微软推出的可以直接在网上观看视频节目的文件压缩格式。图像质量比VCD差一点点,但比同是视频“流”格式的RAM格式好。

常见视频文件格式有哪些

常见视频文件格式有哪些? 2006年11月23日10:28 AVI是音频视频交错(Audio Video Interleaved)的英文缩写,它是Microsoft公司开发的一种符合RIFF文件规范的数字音频与视频文件格式,原先用于Microsoft Video for Windows (简称VFW)环境,现在已被Windows 95/98、OS/2等多数操作系统直接支持。AVI格式允许视频和音频交错在一起同步播放,支持256色和RLE压缩,但AVI文件并未限定压缩标准,因此,AVI文件格式只是作为控制界面上的标准,不具有兼容性,用不同压缩算法生成的AVI文件,必须使用相应的解压缩算法才能播放出来。常用的AVI播放驱动程序,主要是Microsoft Video for Windows或Windows 95/98中的Video 1,以及Intel公司的Indeo Video。AVI文件目前主要应用在多媒体光盘上,用来保存电影、电视等各种影像信息,有时也出现在Internet上,供用户下载、欣赏新影片的精彩片断。 .MPEG/.MPG/.DAT---MPEG文件 MPEG文件格式是运动图像压缩算法的国际标准,它采用有损压缩方法减少运动图像中的冗余信息,同时保证每秒30帧的图像动态刷新率,已被几乎所有的计算机平台共同支持。MPEG标准包括MPEG视频、MPEG音频和MPEG系统(视频、音频同步)三个部分,前文介绍的MP3音频文件就是MPEG音频的一个典型应用,而Video CD (VCD)、Super VCD (SVCD)、DVD (Digital Versatile Disk)则是全面采用MPEG技术所产生出来的新型消费类电子产品。MPEG 压缩标准是针对运动图像而设计的,其基本方法是:在单位时间内采集并保存第一帧信息,然后只存储其余帧相对第一帧发生变化的部分,从而达到压缩的目的,它主要采用两个基本压缩技术:运动补偿技术(预测编码和插补码)实现时间上的压缩,变换域(离散余弦变换DCT)压缩技术实现空间上的压缩。MPEG的平均压缩比为50∶1,最高可达200∶1,压缩效率非常高,同时图像和音响的质量也非常好,并且在微机上有统一的标准格式,兼容性相当好。 这里值得注意的是DIVX。DIVX 视频编码技术可以说是一种对 DVD 造成威胁的新生视频压缩格式,也有人说它 是 DVD 杀手,它由 Microsoft mpeg4 v3 修改而来,使用了MPEG4的压缩算法。同时它也可以说是为了打破 ASF 的种种协定而发展出来的。而使用这种据说是美国禁止出口的编码技术MPEG4 压缩一部 DVD 只需要 2 张 CDROM。这样就意味着读者不需要额外购买DVD光驱也可以得到和它差不多的视频质量。而且播放这种编码,对机器的要求也不高,CPU的最低额度只要求在300MHZ 以上,而且在CPU类型的选择方面,不论你的芯是PII、CELERON还是PIII、AMDK6/2、AMDK6III、ATHALON,就是CYRIXx86也可以统吃拿下。在配置上64 兆内存和一个 8兆显存的显卡上,DIVX便可以流畅的播放了。 .RA/.RM/.RMVB---RealVideo文件 RealVideo文件是RealNetworks公司开发的一种新型流式视频文件格式,它包含在RealNetworks公司所制定的音频视频压缩规范RealMedia中,主要用来在低速率的广域网上实时传输活动视频影像,可以根据网络数据传输速率的不同而采用不同的压缩比率,从而实现影像数据的实时传送和实时播放。RealVideo除了可以以普通的视频文件形式播放之外,还可以与RealServer服务器相配合,在数据传输过程中边下载边播放视频影像,而不必像大多数视频文件那样,必须先下载然后才能播放。目前,Internet上已有不少网站利用RealVideo技术进行重大事件的实况转播。RMVB影片格式比原先的RM多了VB两字,在这里VB是VBR(Variable Bit Rate--可变比特率)的缩写。在保证了平均采样率的基础上,设定了一般为平均采样率两倍的最大采样率值,在处理较复杂的动态影像时也能得到比较良好的效果,处理一般静止画面时则灵活的转换至较低的采样率,有效的缩减了文件的大小! .MOV/.QT---QuickTime文件 QuickTime是Apple计算机公司开发的一种音频、视频文件格式,用于保存音频和视频信息,具有先进的视频和音频功能,被包括Apple Mac OS、Microsoft Windows 95/98/NT在内的所有主流电脑平台支持。QuickTime文件格式支持25位彩色,支持RLE、JPEG等领先的集成压缩技术,提供150多种视频效果,并配有提供了200多种MIDI兼容音响和设备的声音装置。新版的QuickTime进一步扩展了原有功能,包含了基于Internet应用的关键特性,能够通过Internet提供实时的数字化信息流、工作流与文件回放功能,此外,QuickTime还采用了一种称为QuickTime VR (简作QTVR)技术的虚拟现实(Virtual Reality, VR)技术,用户通过鼠标或键盘的交互式控制,可以观察某一地点周围360度的景像,或者从空间任何角度观察某一物体。QuickTime以其领先的多媒体技术和跨平台特性、较小的存储空间要求、技术细节的独立性以及系统的高度开放性,得到业界的广泛认可,目前已成为数字媒体软件技术领域的事实上的

几种常见音频视频音乐文件格式

几种常见音频视频音乐文件格式 1、.wmv WMV是微软推出的一种流媒体格式,它是在“同门”的ASF(Advanced Stream Format)格式升级延伸来得。在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。AVI文件将视频和音频封装在一个文件里,并且允许音频同步于视频播放。与DV D视频格式类似,AVI文件支持多视频流和音频流。WMV 不是仅仅基于微软公司的自有技术开发的。从第七版(WMV1)开始,微软公司开始使用它自己非标准MPEG-4 Par t 2。但是,由于WMV第九版已经是SMPTE的一个独立标准(421M,也称为VC-1),有理由相信WMV的发展已经不象MPEG-4那样是一个它自己专有的编解码技术。现在VC-1专利共享的企业有16家(2006年4月),微软公司也是MPEG-4 AVC/H.264专利共享企业中的一家。微软的WMV还是很有影响力的。可是由于微软本身的局限性其WMV 的应用发展并不顺利。第一, WM9是微软的产品它必定要依赖着Windows,Windows 意味着解码部分也要有PC,起码要有PC机的主板。这就大大增加了机顶盒的造价,从而影响了视频广播点播的普及。第二,WMV技术的视频传输延迟非常大,通常要10几秒钟,正是由于这种局限性,目前WMV也仅限于在计算机上浏览WM9视频文件。WMV-HD是由软件业的巨头微软公司所创立的一种视频压缩格式,一般采用.wmv为文件后缀名。其压缩率甚至高于MPEG-2标准,同样是2小时的HDTV节目,如果使用MPEG-2最多只能压缩至30GB,而使用WMV-HD这样的高压缩率编码器,在画质丝毫不降的前提下都可压缩到15GB以下。WMV-HD,基于WMV9标准,是微软开发的视频压缩技术系列中的最新版本,尽管WMV-HD是微软的独有标准,但因其在操作系统中大力支持WMV系列版本,从而在桌面系统得以迅速普及。在性能上,WMV-HD的数据压缩率与H.264一样,两者的应用领域也极其相似,因此在新一代主流视频编码标准霸主地位的争夺之中,双方展开了针锋相对的斗争,而斗争的焦点集中在下一代光盘规格“HD DVD”和数字微波广播电视等领域。一般采用.wmv为后缀的HDTV文件就是采用的WMV-HD压缩的。目前DVD论坛已经初步批准将MPEG-2、H.264和微软的WMA-HD作为下一代DVD即HD-DVD技术的强制执行 标准。 2、.MOV MOV即QuickTime影片格式,它是Apple公司开发的音频、视频文件格式,用于存储常用数字媒体类型,如音频和视频。当选择QuickTime (*.mov)作为“保存类型”时,动画 将保存为.mov 文件. 用格式工厂1.90可以转换 3、.mpeg MPEG1 MPEG1格式即我们通常所说的VCD视频格式。它可针对SIF标准分辨率的图像进行压缩,视频速度每秒可播放30帧,具有画质好、音质接近于CD等优点,不过对解码芯片的运算能力有较高要求。

音频编码及常用格式

音频编码及常用格式 音频编码标准发展现状 国际电信联盟(ITU)主要负责研究和制定与通信相关的标准,作为主要通信业务的电话通信业务中使用的语音编码标准均是由ITU负责完成的。其中用于固定网络电话业务使用的语音编码标准如ITU-T G.711等主要在ITU-T SG 15完成,并广泛应用于全球的电话通信系统之中。目前,随着Internet网络及其应用的快速发展,在2005到2008研究期内,ITU-T将研究和制定变速率语音编码标准的工作转移到主要负责研究和制定多媒体通信系统、终端标准的SG16中进行。 在欧洲、北美、中国和日本的电话网络中通用的语音编码器是8位对数量化器(相应于64Kb/s的比特率)。该量化器所采用的技术在1972年由CCITT (ITU-T的前身)标准化为G.711。在1983年,CCIT规定了32Kb/s的语音编码标准G.721,其目标是在通用电话网络上的应用(标准修正后称为G.726)。这个编码器价格虽低但却提供了高质量的语音。至于数字蜂窝电话的语音编码标准,在欧洲,TCH-HS是欧洲电信标准研究所(ETSI)的一部分,由他们负责制定数字蜂窝标准。在北美,这项工作是由电信工业联盟(TIA)负责执行。在日本,由无线系统开发和研究中心(称为RCR)组织这些标准化的工作。此外,国际海事卫星协会(Inmarsat)是管理地球上同步通信卫星的组织,也已经制定了一系列的卫星电话应用标准。 音频编码标准发展现状 音频编码标准主要由ISO的MPEG组来完成。MPEG1是世界上第一个高保真音频数据压缩标准。MPEG1是针对最多两声道的音频而开发的。但随着技术的不断进步和生活水准的不断提高,有的立体声形式已经不能满足听众对声音节目的欣赏要求,具有更强定位能力和空间效果的三维声音技术得到蓬勃发展。而在三维声音技术中最具代表性的就是多声道环绕声技术。目前有两种主要的多声道编码方案:MUSICAM环绕声和杜比AC-3。MPEG2音频编码标准采用的就是MUSICAM环绕声方案,它是MPEG2音频编码的核心,是基于人耳听觉感知特性的子带编码算法。而美国的HDTV伴音则采用的是杜比AC-3方案。MPEG2规定了两种音频压缩编码算法,一种称为MPEG2后向兼容多声道音频编码标准,简称MPEG2BC;另一种是称为高级音频编码标准,简称MPEG2AAC,因为它与MPEG1不兼容,也称MPEG NBC。MPEG4的目标是提供未来的交互多媒体应用,它具有高度的灵活性和可扩展性。与以前的音频标准相比,MPEG4增加了许多新的关于合成内容及场景描述等领域的工作。MPEG4将以前发展良好但相互独立的高质量音频编码、计算机音乐及合成语音等第一次合并在一起,并在诸多领域内给予高度的灵活性。

常用的音视频格式有哪几种

)常用的音视频格式有哪几种

————————————————————————————————作者:————————————————————————————————日期:

2)常用的音视频格式有哪几种? 常见得视频格式有五种: 一:A VI(未压缩)。 二:MOV/QT(Quick Time音频、视频文件格式)。 三:MPEG/MPE/DAT(MPEG文件格式,采用有损压缩,如MP3/VCD/SVCD/DVD是采用 MPEG 技术所产生的东东)。 四:RM(流式视频文件格式)。 五:ASF(它使用了MPEG4的压缩算法,可以在网上直接观看视频节目的文件压 缩格式)。 视频格式 有:.drc.dsm .dsv .dsa .dss.vob .ifo.d2v.flv.fli .flc .flic.ivf.mkv. mpg .mpeg .mpe .m1v .m2v .mpv2 .mp2v .dat .ts .tp .tpr .pva .ps s.mp4 .m4v .m4p .m4b .3gp .3gpp .3g2 .3gp2.ogm.mov .qt .amr. ratdvd.rt .rp .smi .smil.rm .ram .rmvb .rpm.roq.swf.smk .bik.wm v .wmp .wm .asf.avi.asx .m3u .pls .wvx .wax .wmx .mpcpl 音频格式 有.wav.wma.ra.ogg.mpc.m4a .aac.mpa .mp2 .m1a .m2a.mp3.mi

d .midi .rmi.mka.ac3 .dts.cda.au .snd.aif .aifc .aiff 常见的视频格式有.vob .ifo.(DVD格 式).mpg .mpeg .dat .mp4 .3gp .mov .rm .ram .rmvb .wmv .asf.a vi.asx 常见的音频格式有.mp3.wmv.wav.mid 回答者:chen3281 - 三级2007-3-23 10:27 视频文件有很多种类。所有的格式家起来上百种。下面说的是目前最主要的流派。 1 *. MPEG/.MPG/.DAT MPEG也是Motion Picture Experts Group 的缩写。这类格式包括了MPEG-1, MPEG-2 和MPEG-4在内的多种视频格式。MPEG-1相信是大家接触得最多的了,因为目前其正在被广泛地应用在VCD 的制作和一些视频片段下载的网络应用上面,大部分的VCD 都是用MPEG1 格式压缩的( 刻录软件自动将MPEG1转为.DAT格式) ,使用MPEG-1 的压缩算法,可以把一部120 分钟长的电影压缩到1.2 GB 左右大小。MPEG-2 则是应用在DVD 的制作,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用MPEG-2 的压缩算法压缩一部120 分钟长的电影可以压缩到5-8 GB 的大小

常见数字音频文件格式比较

常见数字音频文件格式比较 一、什么是文件格式 在计算机领域,文件格式说的是文件编码类型,文件的结构。例如ASCII文件,二进制文件,JPG图片文件,HTML文件,EXE文件等等。文件格式也是对文件编码方式,文件结构的一种约定,便于区分。如同一把钥匙开一把锁,不同的文件要用不同的方法去读,去显示,去写,去打开或运行。针对声音领域以下详细介绍一下音频格式。 二、音频格式 首先,明确一下数字音频的概念,它是指一个用来表示声音强弱的数据序列,由模拟声音经抽样、量化和编码后得到的。简单地说,数字音频的编码方式就是数字音频格式。音频格式最大带宽是20000Hz,速率介于40~50KHz之间。学过物理的人都知道,人耳所能听到的声音频率范围是[20Hz , 20000Hz],20000Hz以上人耳是听不到的,因此音频文件格式的最大带宽是20KHz,故采样速率需要介于40~50KHz之间。 三、常见数字音频格式 (1)*.CD CD格式音质比较音频格式。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。 (2)*.WA V “*.WA V”格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的W A V文件和CD格式一样,也是44.1KHz的采样频率,速率88K/秒,16位量化位数。可以说,W A V格式的声音文件质量和CD相差无几,也是目前PC 机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”W A V格式。 (3)*.MP3 MP3全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III)。它是当今较流行的一种数字音频编码和有损压缩格式,它设计用来大幅度地降低音频数据量,是一种有损压缩。 (4)*.WMA WMA (Windows Media Audio) 格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式,它和日本Y AMAHA公司开发的VQF格式一样,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右,WMA的另一个优点是内容提供商可以通过DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷贝保护。 (5)*.REAL RealAudio主要适用于在网络上的在线音乐欣赏,现在大多数的用户仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。real的的文件格式主要有这么几种:有RA (RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),还有更多。这些格式的特点是可以随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。

音频视频文件格式中文名称

中文名称:音频---视频文件格式 版本:原创 发行时间:2007年 地区:大陆 语言:普通话 简介: 音频---视频文件格式 一、影音文件 ●AVI格式:它的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Microsoft公司推出,随Windows3.1一起被人们所认识和熟知。所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频,所以我们在进行一些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题,如果用户在进行AVI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。 ●nAVI格式:newAVI的缩写,是一个名为ShadowRealm的地下组织发展起来的一种新视频格式(与我们上面所说的AVI格式没有太大联系)。它是由Microsoft ASF压缩算法的修改而来的,但是又与下面介绍的网络影像视频中的ASF视频格式有所区别,它以牺牲原有ASF 视频文件视频“流”特性为代价而通过增加帧率来大幅提高ASF视频文件的清晰度。 ●DV-AVI格式:其英文是Digital Video Format,是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。目前非常流行的数码摄像机就是使用这种格式记录视频数据的。它可以通过电脑的IEEE 1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名一般是.avi,所以也叫DV-AVI格式。 ●MPEG格式:其全称为Moving Picture Expert Group,即运动图像专家组格式,家里常看的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准,它采用了有损压缩方法减少运动图像中的冗余信息,说的更加明白一点就是MPEG的压缩方法依据是相邻两幅画面绝大多数是相同的,把后续图像中和前面图像有冗余的部分去除,从而达到压缩的目的(其最大压缩比可达到200:1)。目前MPEG格式有三个压缩标准,分别是MPEG-1、MPEG-2、和MPEG-4,另外,MPEG-7与MPEG-21仍处在研发阶段。MPEG-1:制定于1992年,它是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其伴音编码而设计的国际标准。也就是我们通常所见到的VCD制作格式。经过MPEG-1标准压缩后,视频数据压缩率为1/100-1/200,音频压缩率为1/6.5。MPEG-1提供每秒30帧352*240分辨率的图像,当使用合适的压缩技术时,具有接近家用视频制式(VHS)录像带的质量。MPEG-1允许超过70分钟的高质量的视频和音频存储在一张CD-ROM盘上。VCD采用的就是MPEG-1的标准,该标准是一个面向家庭电视质量级的视频、音频压缩标准。其文件扩展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盘中的.dat文件等 MPEG-2:制定于1994年,设计目标为高级工业标准的图像质量以及更高的传输率。其文件扩展名包括.mpg、.mpe、.mpeg、.m2v及DVD光盘上的.vob文件等。MPEG-2主要针对高清晰度电视(HDTV)的需要,传输速率为10Mbps,与MPEG-1兼容,适用于1.5-60Mbps 甚至更高的编码范围。MPEG-2有每秒30帧704*480的分辨率,是MPEG-1播放速度的四倍。它适用于高要求的广播和娱乐应用程序,如DSS卫星广播和DVD,MPEG-2是家用视频制式(VHS)录像带分辨率的两倍。

常见音频文件格式的特点

常见音频文件格式的特点。 要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采样和量化构成,人耳所能听到的声音,最低的频率是从20Hz起一直到最高频率20KHZ,20KHz以上人耳是听不到的,因此音频的最大带宽是20KHZ,故而采样速率需要介于40~50KHZ之间,而且对每个样本需要更多的量化比特数。音频数字化的标准是每个样本16位-96dB的信噪比,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。在音频文件的制作中,正是采用这一标准。 CD格式:正统血脉 当今世界上音质最好的音频格式是什么?当然是CD 了。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁

之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。注意:不能直接的复制CD格式的*.cda文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WAV,这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话,可以说是基本上无损抓音频。推荐大家使用这种方法。 WAV:无损 是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW 等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数,看到了吧,WAV格式的声音文件质量和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。

文件的常见储存格式

各种储存格式 文字: 、txt 纯文本文件,不携带字体,字形,颜色等文字修饰控制格式,一般文字处理软件都能打开它。 、doc 使用Microsoft Word创建的格式化文件,用于一般的图文排版。 、html 用超文本标记语言编写生成的文件格式,用于网页制作。 、pdf便携式文档格式,就是由Adobe系统公司开发的一种文件格式,主要应用于电子文档,出版等方面。 图形图像: 、jpg JPEG文件格式就是静态图像压缩的国际标准,就是应用广泛的图像压缩格式,多用于网络与光盘读物上。 、gif 支持透明背景图像,文件很小,色彩限定在256色以内,主要应用在网络上。 .bmp Microsoftpaaint的固定格式,文件几乎不压缩,占用磁盘空间大,普遍应用于Windows中。 动画: 、gif通过同时存储若干幅图像,进而形成连续的动画。主要用于网页。

、swf应用Macromedia公司的Flash制作的动画。具有缩放不失真、文件体积小等特点,它采用了流媒体技术,可以一边下载一边播放,目前被广泛应用于网络上。 音频: 、wav 该格式记录声音的波形,声音文件能够与原声基本一致,质量非常高,主要应用于许忠实记录原生的地方。 .mp3 一种压缩储存声音的文件格式,就是音频压缩的国际标准。特点就是声音失真小,文件小,目前网络上下载歌曲多为此格式。 、midiMIDI就是数字音乐/电子合成乐器的统一标准。MIDI文件储存的就是一系列指令、不就是波形,就是因为它需要的磁盘空间非常小,目前主要用于音乐制作。 视频: 、avi Microsft公司开发的一种数字音频与视频文件格式,主要应用在多媒体光盘上,用来保存电影、电视等各种影像信息。

常见的声音文件格式

多媒体知识全接触(七)常见的声音文件格式 第四篇声音(音频) 3.常见的声音文件格式 再接下来我们介绍七种目前最为流行的多媒体声音文件效果让你认识认识: ★ WAVE,扩展名为WAV:该格式记录声音的波形,故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价就是文件太大。 ★ MOD,扩展名MOD、ST3、XT、S3M、FAR、669等:该格式的文件里存放乐谱和乐曲使用的各种音色样本,具有回放效果明确,音色种类无限等优点。但它也有一些致命弱点,以至于现在已经逐渐淘汰,目前只有MOD迷及一些游戏程序中尚在使用。 ★ MPEG-3,扩展名MP3:现在最流行的声音文件格式,因其压缩率大,在网络可视电话通信方面应用广泛,但和CD唱片相比,音质不能令人非常满意。 ★ Real Audio,扩展名RA:这种格式真可谓是网络的灵魂,强大的压缩量和极小的失真使其在众多格式中脱颖而出。和MP3相同,它也是为了解决网络传输带宽资源而设计的,因此主要目标是压缩比和容错性,其次才是音质。 ★ Creative Musical Format,扩展名CMF:Creative公司的专用音乐格式,和MIDI差不多,只是音色、效果上有些特色,专用于FM声卡,但其兼容性也很差。 ★ CD Audio音乐CD,扩展名CDA:唱片采用的格式,又叫“红皮书”格式,记录的是波形流,绝对的纯正、HIFI。但缺点是无法编辑,文件长度太大。 ★ MIDI,扩展名MID:目前最成熟的音乐格式,实际上已经成为一种产业标准,其科学性、兼容性、复杂程度等各方面当然远远超过本文前面介绍的所有标准(除交响乐CD、Unplug CD外,其它CD往往都是利用MIDI制作出来的),它的General MIDI就是最常见的通行标准。作为音乐工业的数据通信标准,MIDI能指挥各音乐设备的运转,而且具有统一的标准格式,能够模仿原始乐器的各种演奏技巧甚至无法演奏的效果,而且文件的长度非常小。 总之,如果有专业的音源设备,那么要听同一首曲子的HIFI程度依次是: 原声乐器演奏 > MIDI > CD唱片 > MOD > 所谓声卡上的MIDI > CMF,而MP3及RA要看它的节目源是采用MIDI、CD还是MOD了。 另外,在多媒体材料中,存储声音信息的文件格式也是需要认识的,共有: WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干种。 ★ WAV文件:Microsoft公司的音频文件格式,它来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,即波形文件。Microsoft Sound System软件Sound Finder 可以转换AIF SND和VOD文件到WAV格式。 ★ VOC文件:Creative公司波形音频文件格式,也是声霸卡(sound blaster)使用的音频文件格式。每个VOC文件由文件头块(header block)和音频数据块(data block)组成。文件头包含一个标识版本号和一个指向数据块起始的指针。数据块分成各种类型的子块。如声音数据静音标识ASCII码文件重复的结果重复以及终止标志,扩展块等。 ★ MIDI文件:Musical Instrument Digital Interface(乐器数字接口)的缩写。它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,以规定计算机音乐程序电子合成器和其它电子设备之间交换信息与控制信号的方法。MIDI文件中包含音符定时和多达16个通道的乐器定义,每个音符包括键通道号持续时间音量和力度等信息。所以MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令。 ★ RMI文件:Microsoft公司的MIDI文件格式,它可以包括图片标记和文本。 ★ PCM文件:模拟音频信号经模数转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。在声霸卡提供的软件中,可以利用VOC-HDR 程序,为PCM格式的音频文件加上文件头,而形成VOC格式。Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。 ★ AIF文件:Apple计算机的音频文件格式。Windows的Convert工具同样可以把AIF格式的文件换成Microsoft的WAV格式的文件 【此文档部分内容来源于网络,如有侵权请告知删除,本文档可自行编辑和修改内容,感谢您的支持!】

常见音乐文件格式

常见音乐文件格式一览 经典的WA VE WA VE文件作为最经典的Windows多媒体音频格式,应用非常广泛,它使用三个参数来表示声音:采样位数、采样频率和声道数。 声道有单声道和立体声之分,采样频率一般有11025Hz(11kHz)、22050Hz(22kHz)和44 100Hz(44kHz)三种。WA VE文件所占容量=(采样频率×采样位数×声道)×时间/8(1字节=8bit)。 电脑音乐MIDI MIDI是Musical Instrument Data Interface的简称,它采用数字方式对乐器所奏出来的声音进行记录(每个音符记录为一个数字),然后,播放时再对这些记录通过FM或波表合成:FM合成是通过多个频率的声音混合来模拟乐器的声音;波表合成是将乐器的声音样本存储在声卡波形表中,播放时从波形表中取出产生声音。 龙头老大MP3 ∶的 ∶甚至112 MP3可谓是大名鼎鼎,它采用MPEG Audio Layer 3技术,将声音用110 压缩率压缩,采样率为44kHz、比特率为112kbit/s。 MP3音乐是以数字方式储存的音乐,如果要播放,就必须有相应的数字解码播放系统,一般通过专门的软件进行MP3数字音乐的解码,再还原成波形声音信号播放输出,这种软件就称为MP3播放器,如Winamp等。 网上霸主RA系列 RA、RAM和RM都是Real公司成熟的网络音频格式,采用了“音频流”技术,所以非常适合网络广播。在制作时可以加入版权、演唱者、制作者、Mail和歌曲的Title等信息。 RA可以称为互联网上多媒体传播的霸主,适合于网络上进行实时播放,是目前在线收听网络音乐最好的一种格式。 高压缩比的VQF VQF即TwinVQ是由Nippon Telegraph and Telephone同YAMAHA公司开发的一种音频压缩技术。 ∶左右甚至更 VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍,可以达到118 高。而像MP3、RA这些广为流行的压缩格式一般只有112 ∶左右。但仍然不会影响音质,当VQF以44kHz-80kbit/s的音频采样率压缩音乐时,它的音质会优于44kHz-128kbit/s的 MP3,以44kHz-96kbit/s压缩时,音乐接近44kHz-256kbit/s的MP3。 迷你光盘MD MD(即MiniDisc)是SONY公司于1992年推出的一种完整的便携音乐格式,它所采用的 ∶。MD又分为可录型MD(Recordable,有磁头和激压缩算法就是ATRAC技术(压缩比是15)

常见的音频文件格式的特点概述

常见的音频文件格式的特点概述 要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采样和量化构成,人耳所能听到的声音,最低的频率是从20Hz起一直到最高频率20KHZ,20KHz以上人耳是听不到的,因此音频的最大带宽是20KHZ,故而采样速率需要介于40~50KHZ 之间,而且对每个样本需要更多的量化比特数。音频数字化的标准是每个样本16位-96dB的信噪比,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。在音频文件的制作中,正是采用这一标准。 1 CD格式:天籁之音 当今世界上音质最好的音频格式是什么?当然是CD了。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型“中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda 文件“都是44字节长。注意:不能直接的复制CD格式的*.cda文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WAV,这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话,可以说是基本上无损抓音频。推荐大家使用这种方法。 2 WAV:无损的音乐 是微软公司开发的一种声音文件格式,它符合 PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。“*.WAV“格式支持MSADPCM、CCITTA LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数,看到了吧,WAV格式的声音文件质量和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识“WAV格式。 这里顺便提一下由苹果公司开发的AIFF(Audio Interchange File Format)格式和为UNIX系统开发的AU格式,它们都和和WAV非常相像,在大多数的音频编辑软件中也都支持它们这几种常见的音乐格式。 3 MP3:流行的风尚 MP3格式诞生于八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1"/“*.mp2“/“*.mp3“这3种声音文件。需要提醒大家注意的地方是:MPEG 音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取

常见音频格式

公 TD. om 常见音频格式大汇总 1.存在便是永恒 - WAV WAV是Microsoft Windows本身提供的音频格式,由于Windows本身的影响力,这个格式已经成为了事实上的通用音频格式。不客气地说,它实际上是Apple电脑的AIFF格式的克隆。通常我们使用WAV格式都是用来保存一些没有压缩的音频,但实际上WAV格式的设计是非常灵活(非常复杂)的,该格式本身与任何媒体数据都不冲突,换句话说,只要有软件支持,你甚至可以在WAV格式里面存放图像。之所以能这样,是因为WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据。在WINDOWS平台上通过ACM(Audio Compression Manager)结构及相应的驱动程序(在这里通常称为CODEC,编码/解码器),可以在WAV文件中存放超过20种的压缩格式,比如ADPCM、GSM、CCITT G.711、G.723等等,当然也包括MP3格式。 虽然WAV文件可以存放压缩音频甚至mp3,但由于它本身的结构注定了它的用途是存放音频数据并用作进一步的处理,而不是像mp3那样用于聆听。目前所有的音频播放软件和编辑软件都支持这一格式,并将该格式作为默认文件保存格式之一。这些软件包括:Sound Forge, Cool Edit Pro, WaveLab等等。由于WAV的支持实在是太广泛了,可以说,即使Windows退出历史舞台,WAV格式也不会消亡。 2.老当益壮– mp3 第二个要提到的就是改变了世界的mp3了。这个比喻相信大家都会同意。mp3是Fraunhofer-IIS研究所的研究成果。mp3是第一个实用的有损音频压缩编码。在mp3出现之前,一般的音频编码即使以有损方式进行压缩能达到4:1的压缩比例已经非常不错了。但是,mp3可以实现12:1的压缩比例,这使得mp3迅速地流行起来。mp3之所以能够达到如此高的压缩比例同时又能保持相当不错的音质是因为利用了知觉音频编码技术,也就是利用了人耳的特性,削减音乐中人耳听不到的成分,同时尝试尽可能地维持原来的声音质量。 衡量mp3文件的压缩比例通常使用比特率来表示。这个术语的英文是bps: bit per second,表示每1秒钟的音频可以用多少个二进制比特来表示。通常比特率越高,压缩文件就越大,但音乐中获得保留的成分就越多,音质就越好。由于比特率与文件大小音质的关系,所以后来又出现了vbr(Variant Bitrate 可变比特率)方式编码的mp3,这种编码方式的特点是可以根据编码的内容动态地选择合适的比特率,因此编码的结果是在保证了音质的同时又照顾了文件的大小,结果大受欢迎。其实mp3的编码标准本来就支持这种压缩方式,但是第一个将此功能实现的反而是一个第三方工具:曾经非常有名的Xing Technology公司(https://www.doczj.com/doc/203105769.html,,当年很多电脑上看VCD听mp3就靠这个公司的Xing Player)推出的Xing Encoder。 由于mp3是世界上第一个有损压缩的编码方案,所以可以说所有的播放软件都支持它,否则就根本没有生命力。在制作方面,也曾经产生了许多第三方的编码工具。不过随着后来Fraunhofer-IIS宣布对编码器征收版税之后很多都消失了。目前属于开放源代码并且免费的编码器是LAME (Lame Ain't Mp3 Encoder,https://www.doczj.com/doc/203105769.html,)。这个工具是公认的压缩音质最好的mp3压缩工具。另外,几乎所有的音频编辑工具都支持打开和保存mp3文件。最近,Fraunhofer-IIS对之前不收取版权费的mp3解码器也征收了版权费。此举大有Fraunhofer-IIS意识到mp3已经在没落,趁还能收到钱最后捞一把的意思。应该说,到了现在,MP3确实显现出疲态了。许多新一代的编码技术都已经能在相同的比特率下提供比MP3优越得多的音质。特别是音乐发烧友对mp3的音质更是嗤之以鼻。不过由于mp3的影响力实在是太大了,支持mp3的软件多如牛毛,更别提众多支持mp3的硬件播放器,如MPMAN,DiscMan,CD/VCD/DVD 机等等。一句话,它依然是世界上最流行的音频压缩技术,所以要它真正退出舞台相信还有好一段时间。 3.老树发新花 - mp3PRO 为了使mp3能在未来仍然保持生命力,Fraunhofer-IIS研究所连同Coding Technologies 公司还有法国的Thomson multimedia公司共同推出了mp3PRO。这种格式与之前的mp3相比最大的特点是能在低达64kbps的比特率下仍然能提供近似CD的音质(mp3是128K)。该技术称为SBR(Spectral Band Replication),它在原来mp3技术的基础上专门针对原来mp3技术中损失了的音频细节进行独立编码处理并捆绑在原来的mp3数据上,在播放的时候

相关主题
文本预览
相关文档 最新文档