JavaScript 浮點數陷阱及解法

JavaScript 浮點數陷阱及解法

眾所周知,JavaScript 浮點數運算時經常遇到會 0.0000000010.999999999 這樣奇怪的結果,如 0.1+0.2=0.30000000000000004、1-0.9=0.09999999999999998,很多人知道這是浮點數誤差問題,但具體就說不清楚了。本文幫你理清這背后的原理以及解決方案,還會向你解釋JS中的大數危機和四則運算中會遇到的坑。

浮點數的存儲

首先要搞清楚 JavaScript 如何存儲小數。和其它語言如 Java 和 Python 不同,JavaScript 中所有數字包括整數和小數都只有一種類型 — Number。它的實現遵循 IEEE 754 標準,使用 64 位固定長度來表示,也就是標準的 double 雙精度浮點數(相關的還有float 32位單精度)。計算機組成原理中有過詳細介紹,如果你不記得也沒關系。

這樣的存儲結構優點是可以歸一化處理整數和小數,節省存儲空間。

64位比特又可分為三個部分:

  • 符號位S:第 1 位是正負數符號位(sign),0代表正數,1代表負數
  • 指數位E:中間的 11 位存儲指數(exponent),用來表示次方數
  • 尾數位M:最后的 52 位是尾數(mantissa),超出的部分自動進一舍零

64 bit allocation

實際數字就可以用以下公式來計算:

$ V = (-1)^{S}\times M \times 2^{E} $

注意以上的公式遵循科學計數法的規范,在十進制是為0<M<10,到二進行就是0<M<2。也就是說整數部分只能是1,所以可以被舍去,只保留后面的小數部分。如 4.5 轉換成二進制就是 100.1,科學計數法表示是 1.001*2^2,舍去1后 M = 001。E是一個無符號整數,因為長度是11位,取值范圍是 0~2047。但是科學計數法中的指數是可以為負數的,所以再減去一個中間數 1023,[0,1022]表示為負,[1024,2047] 表示為正。如4.5 的指數E = 1025,尾數M為 001。

最終的公式變成:

$ V = (-1)^{S}\times (M+1) \times 2^{E-1023} $

所以 4.5 最終表示為(M=001、E=1025):

4.5 allocation map

(圖片由此生成 http://www.binaryconvert.com/convert_double.html)

下面再以 0.1 例解釋浮點誤差的原因, 0.1 轉成二進制表示為 0.0001100110011001100(1100循環),1.100110011001100x2^-4,所以 E=-4+1023=1019;M 舍去首位的1,得到 100110011...。最終就是:

0.1 allocation map


轉化成十進制后為 0.100000000000000005551115123126,因此就出現了浮點誤差。

為什么 0.1+0.2=0.30000000000000004

計算步驟為:

// 0.1 和 0.2 都轉化成二進制后再進行運算
0.00011001100110011001100110011001100110011001100110011010 +
0.0011001100110011001100110011001100110011001100110011010 =
0.0100110011001100110011001100110011001100110011001100111

// 轉成十進制正好是 0.30000000000000004

為什么 x=0.1 能得到 0.1?

恭喜你到了看山不是山的境界。因為 mantissa 固定長度是 52 位,再加上省略的一位,最多可以表示的數是 2^53=9007199254740992,對應科學計數尾數是 9.007199254740992,這也是 JS 最多能表示的精度。它的長度是 16,所以可以使用 toPrecision(16) 來做精度運算,超過的精度會自動做湊整處理。于是就有:

0.10000000000000000555.toPrecision(16)
// 返回 0.1000000000000000,去掉末尾的零后正好為 0.1

// 但你看到的 `0.1` 實際上并不是 `0.1`。不信你可用更高的精度試試:
0.1.toPrecision(21) = 0.100000000000000005551

大數危機

可能你已經隱約感覺到了,如果整數大于 9007199254740992 會出現什么情況呢?
由于 M 最大值是 1023,所以最大可以表示的整數是 2^1024 - 1。這就是能表示的最大整數。但你并不能這樣計算這個數字,因為從 2^1024 開始就變成了 Infinity

> Math.pow(2, 1023)
8.98846567431158e+307

> Math.pow(2, 1024)
Infinity

那么對于 (2^53, 2^63) 之間的數會出現什么情況呢?

  • (2^53, 2^54) 之間的數會兩個選一個,只能精確表示偶數
  • (2^54, 2^55) 之間的數會四個選一個,只能精確表示4個倍數
  • ... 依次跳過更多2的倍數

下面這張圖能很好的表示 JavaScript 中浮點數和實數(Real Number)之間的對應關系。我們常用的 (-2^53, 2^53) 只是最中間非常小的一部分,越往兩邊越稀疏越不精確。

floating-point numbers map to real numbers

在淘寶早期的訂單系統中把訂單號當作數字處理,后來隨意訂單號暴增,已經超過了
9007199254740992,最終的解法是把訂單號改成字符串處理。

要想解決大數的問題你可以引用第三方庫 bignumber.js,原理是把所有數字當作字符串,重新實現了計算邏輯,缺點是性能比原生的差很多。所以原生支持大數就很有必要了,現在 TC39 已經有一個 Stage 3 的提案 proposal bigint,大數問題有問徹底解決。

toPrecision vs toFixed

數據處理時,這兩個函數很容易混淆。它們的共同點是把數字轉成字符串供展示使用。注意在計算的中間過程不要使用,只用于最終結果。

不同點就需要注意一下:

  • toPrecision 是處理精度,精度是從左至右第一個不為0的數開始數起。
  • toFixed 是小數點后指定位數取整,從小數點開始數起。

兩者都能對多余數字做湊整處理,也有些人用 toFixed 來做四舍五入,但一定要知道它是有 Bug 的。

如:1.005.toFixed(2) 返回的是 1.00 而不是 1.01

原因: 1.005 實際對應的數字是 1.00499999999999989,在四舍五入時全部被舍去!

解法:使用專業的四舍五入函數 Math.round() 來處理。但 Math.round(1.005 * 100) / 100 還是不行,因為 1.005 * 100 = 100.49999999999999。還需要把乘法和除法精度誤差都解決后再使用 Math.round??梢允褂煤竺娼榻B的 number-precision#round 方法來解決。

解決方案

回到最關心的問題:如何解決浮點誤差。首先,理論上用有限的空間來存儲無限的小數是不可能保證精確的,但我們可以處理一下得到我們期望的結果。

數據展示類

當你拿到 1.4000000000000001 這樣的數據要展示時,建議使用 toPrecision 湊整并 parseFloat 轉成數字后再顯示,如下:

parseFloat(1.4000000000000001.toPrecision(12)) === 1.4  // True

封裝成方法就是:

function strip(num, precision = 12) {
  return +parseFloat(num.toPrecision(precision));
}

為什么選擇 12 做為默認精度?這是一個經驗的選擇,一般選12就能解決掉大部分0001和0009問題,而且大部分情況下也夠用了,如果你需要更精確可以調高。

數據運算類

對于運算類操作,如 +-*/,就不能使用 toPrecision 了。正確的做法是把小數轉成整數后再運算。以加法為例:

/**
 * 精確加法
 */
function add(num1, num2) {
  const num1Digits = (num1.toString().split('.')[1] || '').length;
  const num2Digits = (num2.toString().split('.')[1] || '').length;
  const baseNum = Math.pow(10, Math.max(num1Digits, num2Digits));
  return (num1 * baseNum + num2 * baseNum) / baseNum;
}

以上方法能適用于大部分場景。遇到科學計數法如 2.3e+1(當數字精度大于21時,數字會強制轉為科學計數法形式顯示)時還需要特別處理一下。

能讀到這里,說明你非常有耐心,那我就放個福利吧。
遇到浮點數誤差問題時可以直接使用

https://github.com/dt-fe/number-precision

完美支持浮點數的加減乘除、四舍五入等運算。非常小只有1K,遠小于絕大多數同類庫(如Math.js、BigDecimal.js),100%測試全覆蓋,代碼可讀性強,不妨在你的應用里用起來!

參考

數學公式無法正常顯示,請查看原文:camsong/blog 轉載請注明出處。
想不想加入阿里巴巴一起玩 ES7,React,FRP 等最新技術,歡迎簡歷到 neosoyn@gmail.com

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,963評論 6 542
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,348評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 178,083評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,706評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,442評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,802評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,795評論 3 446
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,983評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,542評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,287評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,486評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,030評論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,710評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,116評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,412評論 1 294
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,224評論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,462評論 2 378

推薦閱讀更多精彩內容