鸿 网 互 联 www.68idc.cn

移植x264到vs2008之二

来源:互联网 作者:佚名 时间:2015-09-03 08:21
这里讲的是如何把汇编语言添加进来,而不是跑C代码。 1. 首先,要下载到yasm这个汇编语言编译工具,其编译命令可以在vs开发环境当中统一添加为如下格式: yasm.exe -I..\common\x86\ -f win32 -O2 -DPREFIX -o "$(IntDir)\$(InputName)".obj "$(InputPath)"

这里讲的是如何把汇编语言添加进来,而不是跑C代码。

1. 首先,要下载到yasm这个汇编语言编译工具,其编译命令可以在vs开发环境当中统一添加为如下格式:

yasm.exe -I..\common\x86\ -f win32 -O2 -DPREFIX -o "$(IntDir)\$(InputName)".obj "$(InputPath)"

注意:如果你的yasm的版本比较老,可能会有一些汇编语言的格式没法识别的问题。

2. 把相关的汇编语言源代码都添加到vs2008里面,注意:64位的汇编不用添加。添加汇编的源文件如下:

 

 

上述文件列表里面的vs_aligned.asm是我自己写的,待会叙述。

当然,还要添加MMX的宏定义到工程之中:HAVE_MMX。

上述步骤完成之后可能会有BIT_DEPTH这个宏在汇编文件中没有定义的现象,在汇编当中需要重新定义如下:

%ifndef BIT_DEPTH
%assign BIT_DEPTH 8
%endif

 

编译链接没有错误的情况下,运行,结果程序crash掉了。其原因在于:

GCC编译器会自动把堆栈16字节对齐,而vs的编译器则不会。而SSE的很多指令都要求地址是16字节对齐的,这样导致内存访问异常。

于是,在函数调用之前,需要自己对齐堆栈。

3. 十六字节对齐堆栈

    x264中有这样一段代码:

1                 /* No shortcuts here. The SSSE3 implementation of intra_mbcmp_x9 is fast enough. */
2 #ifndef VS_ASM_STACK_16ALIGNED
3                 /* No shortcuts here. The SSSE3 implementation of intra_mbcmp_x9 is fast enough. */
4      i_best = h->pixf.intra_mbcmp_x9_4x4( p_src_by, p_dst_by, cost_i4x4_mode-i_pred_mode );
5 #else
6      i_best = call_func_stack_align16_3((void* )(h->pixf.intra_mbcmp_x9_4x4), (void* )p_src_by, (void* )p_dst_by, (void* )(cost_i4x4_mode-i_pred_mode));
7 #endif

 上述代码,上面部分是x264原有的,下面的代码是我自己添加的。

 函数

call_func_stack_align16_3

声明如下:

int call_func_stack_align16_3 (void* p_func, void* p1, void* p2, void* p3);

实现如下:

 1  _call_func_stack_align16_3:
 2     push ebp
 3     mov  ebp, esp
 4     sub  esp, 12 + 16
 5     and  esp, ~15
 6     mov  ecx, [ebp+8]
 7     mov  edx, [ebp+12]
 8     mov  [esp], edx
 9     mov   edx,[ebp+16]
10     mov  [esp+4],edx
11     mov   edx,[ebp+20]
12     mov  [esp+8],edx
13         
14     call ecx
15     leave
16     ret

上述代码请自行理解。

x264代码中还有好些其它crash的地方,用同样的方法,按照参数个数的不同,依葫芦画瓢地修改相应的汇编代码,就可以解决crash的现象。

 

 

 

 

 

 

 

 

网友评论
<