java视频格式转换mp4-怎么转换视频格式到mp4
一、FLV格式构造
FLV文件由FLV Header和FLV Body构成。
FLV Header
FLV Body
总体格式:
类型
字节数
描述
FLV Header
文件标志
3
固定 F(0x46) L(0x4C) V(0x56)
FLV版本号
1
一般为0x01
内容标示
1
第0位和第2位,分别标识video和audio存在的情况。比如0x05, 00000101,代表既有视频,也有音频
FLV消息头长度
4
从File Header开始到File Body开始的字节数,版本1中总为9
FLV Body
Previous Tag size0 (4字节) 表示前一个Tag的长度
Tag1
Tag Header
Tyep(1字节)表示Tag类型,包括音频(0x08),视频(0x09)和script data(0x12),其他类型值被保留
DataSize(3字节)表示该Tag Data部分的大小
Timestamp(3字节)表示该Tag的时间戳
Timestamp_ex(1字节)表示是时间戳的扩展字节,当24位数值不够时,该字节最高位将时间戳扩展为32位数值
StreamID(3字节)表示stream id总数0
Tag Data
不同类型Tag的data部分结构各不相同,但header的结构是相同
Previous Tag size1 (4字节) 即Tag1的大小
Tag2
Previous Tag size2 (4字节) 即Tag2的大小
... ...
Tagn
Previous Tag sizen (4字节) 即Tagn的大小
二、FLV Header头部信息
头部分由以下几部分组成:
Signature(3 byte) + Version(1 byte) + Flags(1 byte) + DataOffset(4 byte)
字段名
字节数
描述
signature
3
固定FLV三个字符作为表示,0x46 0x4C 0x56
Version
1
表示FLV的版本号,一般都是1
Flags
1
内容标识,第0位和第2位,分别标识video和audio存在的情况。比如0x05, 00000101,代表既有视频,也有音频
DataOffset
4
表示FLV的header长度,这里可以看到固定是9
图示:
三、FLV BODY 文件内容部分
Body是由一个个Tag组成的,每个Tag下面有一块4个字节的空间,用于记录这个Tag的长度。这个后置的PreviousTagSize用于逆向读取处理,表示的是前面的Tag的大小。
FlV的组成由一系列的back-pointers + tag构成
tag组成:
字段名
字节数
描述
tag type
1
8为Audio,9为Video,18为Scripts
tag data size
3
表示tag data的长度,从stream id后算起
Timestreamp
3
时间戳
TimestampExtended
1
时间戳扩展字段
streamId
3
总是0
tagData
n
数据部分
四、Script的TagData内容
1、脚本Tag一般只有一个,是flv的第一个Tag,用于存放flv的信息,比如duration、audiodatarate、creator、width等;
2、所有数据都是以 数据类型 + (数据长度) + 数据的格式出现的,数据类型占1byte,数据长度看数据类型是否存在。
比如如下图:
type = 0x02 对应Stringsize = 0x0A = 10 长度value = 0x6F 0x6E....0x61 = onMetaData 正好是10个字节。
3、Tag Data结构包含两个AMF包。第一个AMF包装“onMetaData”标志java视频格式转换mp4,第二个AMF包封装一个数组类型,这个数组中包含了音视频信息项的名称和值。
上图为第二个AMF
type = 0x08 对应ECMA array type。类似Map, 后面4个字节为数组的个数(00000004,表示有4个键值对),然后是键值对,第一个2个字节的键名长度(0005java视频格式转换mp4,长度为5),接下来就是键名(0x7769647468 = "width")。
之后就是数据类型,然后根据类型来判断长度,键名过后是0x00,表示之后跟着8个字节的double类型,0x415387295596 = 704.000,这之间的相互转换可以自行百度“IEEE 754”
说明:
java中double通过IEEE754转long的方法
double b = 23.45;long value = Double.doubleToRawLongBits(b);
五、Video的TagData内容
type=0x09size=0x00001E=30。长度为30timestreamp=0x000000TimestampExtended = 0x00streamId = 0x000000
之后的数据就是 :视频信息+数据
0x17 前四位是帧类型Frame Type,后四位为编码ID(CodeId)
FrameType = 1 ; CodeId = 7
帧类型
编码ID
当CodeID = 7 (AVC(H.264))的情况,VideoTagHeader会多出4个字节的信息,AVCPacketType和CompositionTime。
AVCPacketType占1个字节
值
类型
0
AVCDecoderConfigurationRecord(AVC sequence header)
1
AVC NALU
2
AVC end of sequence (lower level NALU sequence ender is not required or supported)
AVCDecoderConfigurationRecord:包含着是H.264解码相关毕竟重要的SPS(序列参数集)和PPS(图像参数集)信息。在给AVC解码器推送数据流之前一定要把sps和pps信息送出,否则的话解码器不能正常解码。AVCDecoderConfigurationRecord在flv文件中一般出现一次,也就是第一个video Tag。
CompositionTime占3个字节
条件
值
AVCPacketType == 1
Composition time offset
AVCPacketType != 1
0
AVCDecoderConfigurationRecord格式:
0x01 + sps[1] + sps[2] + sps[3] + 0xFF + 0xE1 + sps size(2个字节) + sps + 01 + pps size(2个字节) + pps
如图所示:
sps[1] = 0x64sps[2] = 0x00sps[3] = 0x20sps size = 0x0019 = 25跳过25个字节后,是0x01pps size = 0x0005 跳过5个字节,就到了back-pointers。解析出sps和pps tag后,后面的video tag就是真正的视频数据内容。
六、Audio的TagData内容
与视频格式类似,前四位为音频格式,
接着2位为采样率
接着1位为采样的长度
七、FLV文件分析工具
工欲善其事必先利其器,所以有款强大的分析工具,对于提高效率是有多么重要,FlvAnalyzer就是一款强大的flv分析工具。图形界面如下,大家可以自行去网上下载。
本文到此结束,希望对大家有所帮助。