本文轉載自原碼, 反碼, 補碼 詳解
本篇文章講解了計算機的原碼, 反碼和補碼. 并且進行了深入探求了為何要使用反碼和補碼, 以及更進一步的論證了為何可以用反碼, 補碼的加法計算原碼的減法. 論證部分如有不對的地方請各位牛人幫忙指正! 希望本文對大家學習計算機基礎有所幫助!
機器數和真值
在學習原碼, 反碼和補碼之前, 需要先了解機器數和真值的概念.
機器數
一個數在計算機中的二進制表示形式, 叫做這個數的機器數。機器數是帶符號的,在計算機用一個數的最高位存放符號, 正數為0, 負數為1.
比如,十進制中的數 +3 ,計算機字長為8位,轉換成二進制就是 00000011
。如果是 -3 ,就是 10000011
。那么,這里的 00000011
和 10000011
就是機器數。
真值
因為第一位是符號位,所以機器數的形式值就不等于真正的數值。例如上面的有符號數 10000011
,其最高位 1 代表負,其真正數值是 -3 而不是形式值131(10000011
轉換成十進制等于 131)。所以,為區別起見,將帶符號位的機器數對應的真正數值稱為機器數的真值。
例:0000 0001 的真值 = +000 0001 = +1,1000 0001 的真值 = –000 0001 = –1
原碼, 反碼, 補碼的基礎概念和計算方法
在探求為何機器要使用補碼之前, 讓我們先了解原碼, 反碼和補碼的概念.對于一個數, 計算機要使用一定的編碼方式進行存儲. 原碼, 反碼, 補碼是機器存儲一個具體數字的編碼方式.
原碼
原碼就是符號位加上真值的絕對值, 即用第一位表示符號, 其余位表示值. 比如如果是 8 位二進制:
[+1]原 = 0000 0001
[-1]原 = 1000 0001
第一位是符號位. 因為第一位是符號位, 所以 8 位二進制數的取值范圍就是:
[1111 1111 , 0111 1111] 即 [-127 , 127]
原碼是人腦最容易理解和計算的表示方式.
反碼
反碼的表示方法是: 正數的反碼是其本身,負數的反碼是在其原碼的基礎上, 符號位不變,其余各個位取反。
[+1] = [00000001]原 = [00000001]反
[-1] = [10000001]原 = [11111110]反
可見如果一個反碼表示的是負數, 人腦無法直觀的看出來它的數值. 通常要將其轉換成原碼再計算.
補碼
補碼的表示方法是: 正數的補碼就是其本身, 負數的補碼是在其原碼的基礎上, 符號位不變, 其余各位取反, 最后 +1. (即在反碼的基礎上 +1)
[+1] = [00000001]原 = [00000001]反 = [00000001]補
[-1] = [10000001]原 = [11111110]反 = [11111111]補
對于負數, 補碼表示方式也是人腦無法直觀看出其數值的. 通常也需要轉換成原碼在計算其數值.
為何要使用原碼, 反碼和補碼
在開始深入學習前, 我的學習建議是先"死記硬背"上面的原碼, 反碼和補碼的表示方式以及計算方法.
現在我們知道了計算機可以有三種編碼方式表示一個數. 對于正數因為三種編碼方式的結果都相同:
[+1] = [00000001]原 = [00000001]反 = [00000001]補
所以不需要過多解釋. 但是對于負數:
[-1] = [10000001]原 = [11111110]反 = [11111111]補
可見原碼, 反碼和補碼是完全不同的. 既然原碼才是被人腦直接識別并用于計算表示方式, 為何還會有反碼和補碼呢?
首先, 因為人腦可以知道第一位是符號位, 在計算的時候我們會根據符號位, 選擇對真值區域的加減. (真值的概念在本文最開頭). 但是對于計算機, 加減乘數已經是最基礎的運算, 要設計的盡量簡單. 計算機辨別"符號位"顯然會讓計算機的基礎電路設計變得十分復雜! 于是人們想出了將符號位也參與運算的方法. 我們知道, 根據運算法則減去一個正數等于加上一個負數, 即: 1-1 = 1 + (-1) = 0 , 所以機器可以只有加法而沒有減法, 這樣計算機運算的設計就更簡單了.
于是人們開始探索 將符號位參與運算, 并且只保留加法的方法. 首先來看原碼:
// 計算十進制的表達式: 1 - 1 = 0
1 - 1 = 1 + (-1) = [00000001]原 + [10000001]原 = [10000010]原 = -2
如果用原碼表示, 讓符號位也參與計算, 顯然對于減法來說, 結果是不正確的.這也就是為何計算機內部不使用原碼表示一個數。
為了解決原碼做減法的問題, 出現了反碼:
// 計算十進制的表達式: 1 - 1 = 0
1 - 1 = 1 + (-1) = [0000 0001]原 + [1000 0001]原= [0000 0001]反 + [1111 1110]反 = [1111 1111]反 = [1000 0000]原 = -0
發現用反碼計算減法, 結果的真值部分是正確的. 而唯一的問題其實就出現在"0"這個特殊的數值上. 雖然人們理解上 + 0和 -0 是一樣的, 但是 0 帶符號是沒有任何意義的. 而且會有 [0000 0000]原
和 [1000 0000]原
兩個編碼表示 0.
于是補碼的出現, 解決了0的符號以及兩個編碼的問題:
1-1 = 1 + (-1) = [0000 0001]原 + [1000 0001]原 = [0000 0001]補 + [1111 1111]補 = [0000 0000]補=[0000 0000]原
這樣 0 用 [0000 0000]
表示, 而以前出現問題的 -0 則不存在了.而且可以用[1000 0000]
表示 -128:
(-1) + (-127) = [1000 0001]原 + [1111 1111]原 = [1111 1111]補 + [1000 0001]補 = [1000 0000]補
-1-127 的結果應該是 -128, 在用補碼運算的結果中, [1000 0000]補
就是 -128. 但是注意因為實際上是使用以前的-0的補碼來表示 -128, 所以 -128 并沒有原碼和反碼表示 (對 -128 的補碼表示 [1000 0000]補
算出來的原碼是[0000 0000]原
, 這是不正確的)
使用補碼, 不僅僅修復了 0 的符號以及存在兩個編碼的問題, 而且還能夠多表示一個最低數. 這就是為什么 8 位二進制, 使用原碼或反碼表示的范圍為 [-127, +127], 而使用補碼表示的范圍為 [-128, 127].
故機器的存儲是使用補碼, 所以對于編程中常用到的 32 位 int 類型, 可以表示范圍是: [-2^31, 2^31-1] 因為第一位表示的是符號位.而使用補碼表示時又可以多保存一個最小值。