MD5 算法的程序設計和實現(xiàn)


MD5 算法概述

MD5,全名Message Digest Algorithm 5,為計算機安全領域廣泛使用的一種散列函數(shù),用以提供消息的完整性保護。MD5是一種信息摘要算法,主要是通過特定的hash散列方法將文本信息轉(zhuǎn)換成簡短的信息摘要,壓縮+加密+hash算法的結(jié)合體,是絕對不可逆的。MD5是輸入不定長度信息,輸出固定長度128-bits的算法。經(jīng)過程序流程,生成四個32位數(shù)據(jù),最后聯(lián)合起來。

MD5以512位分組來處理輸入的信息,且每一分組又被劃分為16個32位子分組,經(jīng)過了一系列的處理后,算法的輸出由四個32位分組組成,將這四個32位分組級聯(lián)后將生成一個128位散列值。MD5算法的過程分為四步:數(shù)據(jù)填充,設置初始值(標準向量),四輪循環(huán)運算,拼接結(jié)果。


結(jié)構(gòu)和模塊

image

數(shù)據(jù)結(jié)構(gòu)

采用32位無符號整數(shù)作為存儲單元,常量的整數(shù)部分是正弦(弧度)* 2 ^ 32;r指定每個輪班的數(shù)量;定義Left Rotatate 函數(shù)為 (x) << (c) | (x) >> (32 - (c))。

// Constants are the integer part of the sines of integers (in radians) * 2^32.
const uint32_t k[64] = {
0xd76aa478, 0xe8c7b756, 0x242070db, 0xc1bdceee ,
0xf57c0faf, 0x4787c62a, 0xa8304613, 0xfd469501 ,
0x698098d8, 0x8b44f7af, 0xffff5bb1, 0x895cd7be ,
0x6b901122, 0xfd987193, 0xa679438e, 0x49b40821 ,
0xf61e2562, 0xc040b340, 0x265e5a51, 0xe9b6c7aa ,
0xd62f105d, 0x02441453, 0xd8a1e681, 0xe7d3fbc8 ,
0x21e1cde6, 0xc33707d6, 0xf4d50d87, 0x455a14ed ,
0xa9e3e905, 0xfcefa3f8, 0x676f02d9, 0x8d2a4c8a ,
0xfffa3942, 0x8771f681, 0x6d9d6122, 0xfde5380c ,
0xa4beea44, 0x4bdecfa9, 0xf6bb4b60, 0xbebfbc70 ,
0x289b7ec6, 0xeaa127fa, 0xd4ef3085, 0x04881d05 ,
0xd9d4d039, 0xe6db99e5, 0x1fa27cf8, 0xc4ac5665 ,
0xf4292244, 0x432aff97, 0xab9423a7, 0xfc93a039 ,
0x655b59c3, 0x8f0ccc92, 0xffeff47d, 0x85845dd1 ,
0x6fa87e4f, 0xfe2ce6e0, 0xa3014314, 0x4e0811a1 ,
0xf7537e82, 0xbd3af235, 0x2ad7d2bb, 0xeb86d391 };
 
// r specifies the per-round shift amounts
const uint32_t r[] = {7, 12, 17, 22, 7, 12, 17, 22, 7, 12, 17, 22, 7, 12, 17, 22, 5,  9, 14, 20, 5,  9, 14, 20, 5,  9, 14, 20, 5,  9, 14, 20, 4, 11, 16, 23, 4, 11, 16, 23, 4, 11, 16, 23, 4, 11, 16, 23, 6, 10, 15, 21, 6, 10, 15, 21, 6, 10, 15, 21, 6, 10, 15, 21};
 
// leftrotate function definition
# define LEFTROTATE(x, c) (((x) << (c)) | ((x) >> (32 - (c))))

數(shù)據(jù)填充

對消息進行數(shù)據(jù)填充,使消息的長度對512取模得448,設消息長度為X,即滿足X mod 512=448。根據(jù)此公式得出需要填充的數(shù)據(jù)長度。填充方法:在消息后面進行填充,填充第一位為1,其余為0。填充完后,信息的長度就是512*N+448。之后,用剩余的位置(512-448=64位)記錄原文的真正長度,把長度的二進制值補在最后。這樣處理后的信息長度就是512*(N+1)。

// Fill Data
// append "1" bit to message
// append "0" bits until message length in bits ≡ 448 (mod 512)
// append length mod (2^64) to message
 for (newLen = initialLen + 1; newLen % (512/8) != 448/8; newLen++);
 
msg = (uint8_t*)malloc(newLen + 8);
memcpy(msg, initial_msg, initialLen);
msg[initialLen] = 0x80; // append the "1" bit; most significant bit is "first"
for (offset = initialLen + 1; offset < newLen; offset++)
msg[offset] = 0; // append "0" bits
 
// append the len in bits at the end of the buffer.
to_bytes(initialLen*8, msg + newLen);
// initialLen>>29 == initialLen*8>>32, but avoids overflow.
to_bytes(initialLen>>29, msg + newLen + 4);

設置初始值

MD5的哈希結(jié)果長度為128位,按每32位分成一組共4組。這4組結(jié)果是由4個初始值h_0h_3經(jīng)過不斷演變得到。MD5的官方實現(xiàn)中,h_0h_3的初始值如下(16進制):

  • h_0 = 0x67452301
  • h_1 = 0xefcdab89
  • h_2 = 0x98badcfe
  • h_3 = 0x10325476
h_0 01 23 45 67
h_1 89 AB CD EF
h_2 FE DC BA 98
h_3 76 54 32 10
// Initialize variables - simple count in nibbles:
h0 = 0x67452301;
h1 = 0xefcdab89;
h2 = 0x98badcfe;
h3 = 0x10325476;

循環(huán)運算

MD5所用到的函數(shù)有四種線性函數(shù)(&是與,|是或,~是非,^是異或)。如果X、Y和Z的對應位是獨立和均勻的,那么結(jié)果的每一位也應是獨立和均勻的。利用上面的四種操作,生成四個重要的計算函數(shù)。首先我們聲明中間變量a、b、c、d。這個循環(huán)的循環(huán)次數(shù)為512位分組的個數(shù)。每次循環(huán)執(zhí)行64不計算,上述4個函數(shù)每個16次,具體如下:

// These vars will contain the hash
uint32_t h0, h1, h2, h3;
 
// Message (to prepare)
uint8_t *msg = NULL;
size_t newLen, offset;
uint32_t w[16];
uint32_t a, b, c, d, i, f, g, temp;

// Process the message in successive 512-bit chunks:
// ForEach 512-bit chunk of message:
for(offset=0; offset<newLen; offset += (512/8)) {

    // break chunk into sixteen 32-bit words w[j], 0 ≤ j ≤ 15
    for (i = 0; i < 16; i++)
        w[i] = to_int32(msg + offset + i*4);

    // Initialize hash value for this chunk:
    a = h0;
    b = h1;
    c = h2;
    d = h3;

    // Main loop:
    for(i = 0; i<64; i++) {
        if (i < 16) {
            f = (b & c) | ((~b) & d);
            g = i;
        } else if (i < 32) {
            f = (d & b) | ((~d) & c);
            g = (5*i + 1) % 16;
        } else if (i < 48) {
            f = b ^ c ^ d;
         g = (3*i + 5) % 16;  
        } else {
            f = c ^ (b | (~d));
            g = (7*i) % 16;
        }
        temp = d;
        d = c;
        c = b;
        b = b + LEFTROTATE((a + f + k[i] + w[g]), r[i]);
        a = temp;
    }

    // Add this chunk's hash to result so far:
    h0 += a;
    h1 += b;
    h2 += c;
    h3 += d;
}

// cleanup
free(msg);

//var char digest[16] := h0 append h1 append h2 append h3
to_bytes(h0, digest);
to_bytes(h1, digest + 4);
to_bytes(h2, digest + 8);
to_bytes(h3, digest + 12);
}

數(shù)據(jù)處理

處理完所有的512位的分組后,得到一組新的h_0h_3的值,將這些值按h_0h_3的順序級聯(lián),就得到了想要的MD5散列值。輸出依然要考慮內(nèi)存存儲的大小端問題。

// benchmark
for (i = 0; i < 1000000; i++) {
    MD5((uint8_t*)msg, len, result);
}

結(jié)果

編譯運行MD5.c,得到可執(zhí)行文件,輸入字符串“IamLiuShuo-16340154”,并在miraclesalad嘗試對比結(jié)果,發(fā)現(xiàn)一致,實驗成功!

image
image

代碼

源代碼 on GitHub,滿意請 star?哦!


參考


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內(nèi)容

  • 這篇文章主要講述在Mobile BI(移動商務智能)開發(fā)過程中,在網(wǎng)絡通信、數(shù)據(jù)存儲、登錄驗證這幾個方面涉及的加密...
    雨_樹閱讀 2,643評論 0 6
  • 版本記錄 前言 在這個信息爆炸的年代,特別是一些敏感的行業(yè),比如金融業(yè)和銀行卡相關等等,這都對app的安全機制有更...
    刀客傳奇閱讀 3,184評論 0 11
  • 要分析理財?shù)氖裁粗档觅I能不能做,我是從如下幾個方面去看的,市場機會,用戶需求,然后配合相關功能看是否能真正滿...
    昱全yuquan閱讀 691評論 1 5
  • 1. 可我偏偏不信鬼。 上周突然一下,沒有任何人預計到災難會這么發(fā)生在我的身上。朋友第一時間送我去距離家不遠的醫(yī)院...
    肉都給我吃閱讀 530評論 11 2
  • 我的職業(yè)是一名機器人教師。在我剛來到這個公司的時候,既興奮也惶恐。興奮于公司是新成立的,每一樣制度或者工作規(guī)則都不...
    Yc_筆跡閱讀 231評論 1 1