1. 引言
1.1 起因
這周去見應用數學的畢設老師Z,閑聊時Z說另一個同學代碼里某個for循環要跑幾小時,但這個for循環里操作并不復雜,主要就是轉換和賦值。然后我就想,可不可以使用C/C++加速呢?
作為堅定的C/C++黨,正好也想學學python中使用C/C++,C/C++中使用asm匯編這些技術,索性在github上建了一個新倉庫Extend-Embed,專門學習怎樣在一種語言編寫的代碼中使用另一種語言。
這篇文章記錄怎樣通過MEX方式,在MATLAB中使用C/C++,最主要的參考資料是:Writing MATLAB C/MEX Code
1.2 環境
操作系統:Windows 7
MATLAB:R2013a
Visual Studio:Community 2013
2. 準備
2.1 基本概念
簡單粗暴地講,在MATLAB中使用C/C++就是三步走的流程:
- 編寫C/C++文件
- 用mex命令把C/C++文件編譯成MEX(Matlab Executable)文件
- 像普通MATLAB函數一樣直接使用
舉個例子,我們寫了一個hello.c,功能是輸出一句"Hello, world!",那么使用:
mex hello.c
后根據平臺不同會得到hello.mex或者hello.mexw64,然后使用:
hello
就會輸出一句”Hello, world!“
2.2 配置MEX
不得不說配置過程還是挺坑的。自己試驗加上網上查資料試了無數遍,終于發現配置過程要經常反其道而行之,也就是說按正常思路配置基本都要GG。最終選了一堆no反而配好了環境時:
輸入mex -setup,會詢問是否讓mex自己找編譯器,注意選擇y是不行的:
這時要選擇n,得到各種支持的編譯器名稱:
我安裝了Visual Studio Community 2013,所以選擇21。因為它給的默認路徑不對,所以選擇n后輸入正確路徑:
輸入路徑后選擇y確認,輸出信息里有Done就是配置成功了:
3. 混合編程
在MATLAB安裝目錄下有一個extern\examples\mex文件夾,里面有很多例子;也可以參考Writing MATLAB C/MEX Code。不過必須知道的新概念也就幾條,其它都可以邊用邊學,所以實際上手非常容易。
3.1 新概念
頭文件方面,使用MEX文件時都需要include “mex.h”。
main函數方面,入口不再是main函數,而是mexFunction,聲明格式如下:
void mexFunction(int nlhs, mxArray *plhs[],
int nrhs, const mxArray *prhs[])
其中mxArray是mex.h里自己定義的數據結構,直接看四個奇怪變量名的含義:
lhs = left hand side,rhs = right hand side
nlhs = 輸出變量的數量
plhs = 指向輸出變量的指針數組
nrhs = 輸入變量的數量
prhs = 指向輸入變量的指針數組(注意const)
用MEX方式實現了函數test,在MATLAB里面使用:
F = test(X, Y)
那么輸入方面,nrhs為2,prhs[0]是X,prhs[1]是Y;輸出方面,nlhs為1,plhs[0]是F。
需要注意的是兩件事:第一,要自己分配輸出的存儲空間;第二,要自己檢查輸入是否合法。這兩件事直接講不好講清楚,看后面的例子就很容易理解了。
此外,mex.h里提供了不少輔助函數,輸出信息用mexPrintf、mexErrMsgTxt,得到矩陣尺寸用mxGetM和mxGetN,得到指向矩陣數據的指針用mxGetPr,etc
3.2 例子
寫了一個discrete_cpp.cpp,功能是傳入一個矩陣A返回一個矩陣B,B和A的形狀相同,B中元素B(i, j)和A中元素A(i, j)的對應關系是:
- 若 A(i, j) 小于1/3,則 B(i, j) = 0
- 若 A(i, j) 大于等于1/3 且小于2/3,則 B(i, j) = 1
- 若 A(i, j) 大于2/3,則 B(i, j) = 2
類似于做了離散化。
#include "mex.h"
// 使用MEX必須包含的頭文件
int discrete(double d);
void mexFunction(int nlhs, mxArray *plhs[],
int nrhs, const mxArray *prhs[]){
if (nrhs != 1)
mexErrMsgTxt("Wrong number of input arguments.\n");
// 檢查輸入變量數量是否正確,否則報錯
if (nlhs > 1)
mexErrMsgTxt("Too many output argumnents.\n");
// 檢查輸出變量數量是否正確,否則報錯
#define A_IN prhs[0]
#define B_OUT plhs[0]
int M = mxGetM(A_IN);
int N = mxGetN(A_IN);
// 得到輸入矩陣A的行數和列數
B_OUT = mxCreateDoubleMatrix(M, N, mxREAL);
// 為輸出矩陣B分配存儲空間
double *A = mxGetPr(A_IN);
double *B = mxGetPr(B_OUT);
// 取得輸入矩陣A和輸出矩陣B的數據指針
for (int i = 0; i < M * N; ++i)
B[i] = discrete(A[i]);
// 調用discrete,根據A(i, j)計算B(i, j)
}
int discrete(double d) {
if (d < 1.0 / 3.0)
return 0;
else if (d < 2.0 / 3.0)
return 1;
return 2;
}
4. 測試
編寫discrete的MATLAB版本discrete_matlab.m:
function [ B ] = discrete_matlab( A )
[M, N] = size(A);
B = zeros(M, N);
for i = 1:M
for j = 1:N
if A(i, j) < 1/3
B(i, j) = 0;
elseif A(i, j) < 2/3
B(i, j) = 1;
else
B(i, j) = 2;
end
end
end
end
編寫測試腳本test_discrete:
MATRIX_M = 100;
MATRIX_N = 100;
MATRIX_NUMBER = 1000;
data = rand(MATRIX_M, MATRIX_N, MATRIX_NUMBER);
tic
for i = 1:MATRIX_NUMBER
discrete_cpp(data(:, :, i));
end
toc
tic
for i = 1:MATRIX_NUMBER
discrete_matlab(data(:, :, i));
end
toc
也就是生成MATRIX_NUMBER個MATRIX_M * MATRIX_N的隨機矩陣,然后分別用mex版本和普通matlab函數做discrete,看各自消耗的時間。
測試結果……第一行是MEX版本的時間,第二行是MATLAB版本的時間,可以看出MEX方式在數據量大時還是挺有優勢的。
所以這圖還真是各種生動形象:
5. 參考資料
- Writing MATLAB C-MEX Code:
http://www.docin.com/p-684614383.html - 解決"mex setup或mbuild setup找不到編譯器"問題
http://blog.csdn.net/sanqima/article/details/49514889