• 21
  • 11月

最近一直在看FFMPEG程序的WMA解码程序,主要要做一个解码算法的优法。

这里就简单做一个笔记吧。

在IMDCT或MDCT中,有一个叫s->inverse的变量,主要是对sin的值进行取反。一开始一直没弄懂,取反这个有什么意义。最后才明白,这个MDCT与IMDCT的计算函数有一定的通用性。当s->inverse为0时,计算的FFT为e^-jπ2w,而当s->inverse为1时,计算的为e^jπ2w,即傅立叶的反变换。

  • 11
  • 11月

偶然间,接触了一款DSP,认识了这么一个叫定点小数的东西。而之前接触到的却全是定点整数。

以8位为例,定点整数可以表达-128~127范围的数值。从右到左,每一位的权重分别为:2^0,2^1……2^6,最高位为符号位。而定点小数的表达范围则为-1 ~ 1-2^-7。从左到右,最高位为符号位,剩下位数的权得为:2^-1,2^-2……2^-7。

举个简单的例子,00010101,如果是定点整数,该值为16+4+1=21;如果是定点小数,该值为1/8+1/32+1/128=0.1640625。

那么,定点小数和定点整数,除了表达的数值外,在运算上会有什么区别呢?

先是位扩展。当8位扩至16位时,如果是定点整数,则在该数前补8个符号位。而如果是定点小数,则在该数后补8个0。再是16位到8位,定点整数则是丢弃高8BIT,定点小数则是丢弃低8BIT。因此,定点整数将会发生严重的溢出,而定点小数只会丢失部分精度。

在计算加减的时候,定点小数与定点整数没有太大的区别。在乘法上,就有一些区别了。比如说00000001 x 00000001。在定点整数的时候,由于1x1=1,因此结果为00000000 00000001。但是在定点小数时,由于00000001不再表示1,而是2^-7,因此,相乘的结果为 00000000 00000010,即2^-14。

也可以这么理解。由于定点小数的权重是由左向右的,由于两个带符号位的定点小数相乘,使得前面多出了一个符号位,因此需要左移一位来移出这个符号位。这样,从编码的字面值来看,定点小数相乘的结果是定点整数相乘结果的两倍。

那么定点小数究竟有什么好处呢?Hanny是这么理解的。在做乘法或乘加运算时,定点整数需要不断地移位来防止溢出,而定点小数则可直接实现。因为是小于1,所以定点小数在乘法运算过程永远不会溢出。

最后,今天是光棍节!55555

  • 3
  • 11月

话说,C语言中最精髓的就是指针的操作了。当然,本文不对C语言的指针做详细的描述。Hanny在这里只想小结一下KeilC中的指针类型。

在KeilC中,我们会常见到下述的指针定义方式:
char *ptr1;<br />
char code *ptr2;<br />
char data *ptr3;<br />
char xdata *ptr4;<br />
char *data ptr5;<br />
char code *data ptr6;<br />
char data *data ptr7;<br />
char xdata *data ptr8;<br />
char *xdata ptr9;<br />
char code *xdata ptr10;<br />
char data *xdata ptr11;<br />
char xdata *xdata ptr12;


看到这里,可能会有人有点乱了吧。其实要理清上面这一堆东西很简单。

首先,我们需要了解51的内存结构。简单地说,就是51包括data/idata、xdata、code三大块。定义指针时,*后面的修饰符是用来表示指针的存储位置。如:ptr5、ptr6、ptr7、ptr8存储在data区中,ptr9、ptr10、ptr11、ptr12存储在xdata中。ptr1、ptr2、ptr3、ptr4的存储位置则取决于KeilC中的设置(使用内存的模式)。

*之前的修饰符,则是用来表示指针所指向的数据的存储位置,即指针类型。ptr2、ptr6、ptr10的指针,指向一个存储在code中的数据。ptr3、ptr7、ptr11的指针,指向一个存储在data中的数据。ptr4、ptr8、ptr12的指针,指向一个存储在xdata中的数据。

ptr1、ptr5、ptr9这三个指针有一点点特殊。没有修饰类型这表示这是一个通用指针,它将用3Byte来表示。其中第一字节表示指针类型,后两个指针存放指针地址。而类型中,0xff表示指针存放在code中,0x00表示data/idata,0x01表示xdata。

综上所述,若一个指针为char xdata * xdata,如ptr12,则该指针表示一个存放在xdata中的指针,并且该指针指向一个xdata的数据。

在使用过程中,只要注意到了这些类型,应该是不会出什么问题的。

  • 10
  • 10月

总算有点看懂wma2wav(ffmpeg)中的IMDCT算法了。只是有点看懂。

wma2wav,其实就是从ffmpeg中将wma解码的程序提取了出来。IMDCT是其中的一个重要部份吧。小结了一下该程序对IMDCT的计算流程。

先是将IMDCT的式子进行分段移位,利用cos函数的对称性,将2N个点的IMDCT转换成N个点的DCT-IV算法。

然后对这N个点进行处理,以偶序列为实部,奇序列的逆序列为虚部,先进行预处理,然后就转换成N/2个点的FFT。计算完后,再进行相关的后处理,即可得到。

整个算法和http://www.ee.columbia.edu/~marios/mdct/mdct_giraffe.html中提到的imdtc4差不多。

花了几天时间终于弄明白这个预处理和后处理的推导流程。其实预处理和后处理的目的就是为了把表达示转换成标准DFT,这样就可以用FFT来进行计算了。仅此而已。

在FFT计算过程中,ffmpeg用的是按时间抽取的FFT算法,也就是先按位逆序来打乱顺序,然后计算,结果就是顺序的了。

  • 27
  • 9月

这几天,一直在看WMA解码的IMDCT及加窗重构部分。

经常了很多资料的查阅,终于对这一块有了一个初步的认识。

第一个认识就是:其实不管是MP3还是WMA解码,整个大的流程都是差不多的。先是一个Huffman解码,反量化,然后就是立体声合成,然后就是IMDCT及加窗,最后,MP3还有一个子带合成。

第二个认识就是重点看了IMDCT这一块了。其实大学时是有学过数字信号处理的。只是大学时感觉这门课好抽象,也没好好学好。现在,也算是一次补课的机会吧。

在音视频中,编码时一般我们会用一些“变换”来对样点进行处理,将时域信号转换到频域,以消除信号的相关性。因此,在解码过程中,需要用“逆变换”来将频域上的点转回时域,还原出原来的音视频信号。

傅立叶变换是整个信号处理的基础。DFT是离散傅立叶变换,它先将傅立叶信号在时域上进行离散,变成离散时间的傅立叶变换,然后在频域上再进行离散,就成了傅立叶变换了。

DCT,即离散余弦变换。它其实是离散傅立叶变换的一个简换,只有实部而没有虚部。DCT的变换公式有很多(8条),在JPEG图像压缩当中就有用到DCT变换。但是DCT变化有一个缺点:DCT变换是分块进行的,块与块之间不能平滑过度,可能会对音频信号带来噪声。

MDCT全称是改进的离散余弦变换。主要在DCT变换进行改进,对前后块进行混叠处理。也就是说2N的样点的输入,得到N的样点的输出。IMDCT则相反,N个样点的输入,得到2N的样点的输出。但是需要注意的是:假设原信号为
a, b, c。 MDCT(a, b) = A, MDCT(b, c) = B。 然后 IMDCT(A) = a1, b2,IMDCT(B) = b1, c2。然后再进行混叠,b1+b2才是b的输出样点。

加窗这一块暂时还没搞懂,还需要进一步学习。