一、關于高并發
高并發是指在同一個時間點,有很多用戶同時訪問URL地址,比如:淘寶的雙11、雙12,就會產生高并發。又如貼吧的爆吧,就是惡意的高并發請求,也就是DDOS攻擊,再屌絲點的說法就像玩LOL被ADC暴擊了一樣,那傷害你懂的。
1
高并發會來帶的后果
服務端:導致站點服務器/DB服務器資源被占滿崩潰,數據的存儲和更新結果和理想的設計是不一樣的,比如:出現重復的數據記錄,多次添加了用戶積分等。
用戶角度:尼瑪,這么卡,老子來參加活動的,刷新了還是這樣,垃圾網站,再也不來了!
我的經歷:在做公司產品網站的過程中,經常會有這樣的需求,比如搞個活動專題、抽獎、簽到、積分競拍等等,如果沒有考慮到高并發下的數據處理,那就Game Over了,很容易導致抽獎被多抽走,簽到發現一個用戶有多條記錄等等,各種超出正常邏輯的現象,這就是做產品網站必須考慮的問題,因為這些都是面向大量用戶的,而不是像做ERP管理系統、OA系統那樣,只是面向員工。
下面我進行實例分析,簡單粗暴,動態分析,純屬本人經驗分享,如有說錯或者更好的建議,請留言,大家一起成長。
2
并發下的數據處理
通過表設計,如:記錄表添加唯一約束,數據處理邏輯使用事物防止并發下的數據錯亂問題。通過服務端鎖進程防止包并發下的數據錯亂問題。這里主要講述的是在并發請求下的數據邏輯處理的接口,如何保證數據的一致性和完整性,這里的并發可能是大量用戶發起的,也可能攻擊者通過并發工具發起的并發請求。
例子1:通過表設計防止并發導致數據錯亂
需求點:
【簽到功能】一天一個用戶只能簽到一次,簽到成功后用戶獲取到一個積分。
已知表:
1、用戶表,包含積分字段;
2、高并發意淫分析(屬于開發前的猜測):在高并發的情況下,會導致一個用戶簽到記錄會有多條,或者用戶簽到后不止加一積分。
我的設計:首先根據需求我會添加一張簽到記錄表,重點來了,這張表需要把用戶唯一標識字段(ID,Token)和簽到日期字段添加為唯一約束,或者唯一索引,這樣就可以防止并發的時候插入重復用戶的簽到記錄。然后再程序代碼邏輯里,先執行簽到數據的添加(這里可以防止并發,添加成功后再進行積分的添加,這樣就可以防止重復地添加積分了。最后我還是建議所有的數據操作都寫在一個sql事務里面, 這樣在添加失敗,或者編輯用戶積分失敗的時候可以回滾數據。
例子2:事務+通過更新鎖,防止并發導致數據錯亂;或者事物+Update的鎖表機制
需求點:【抽獎功能】抽獎一次消耗一個積分,抽獎中獎后編輯剩余獎品總數,剩余獎品總數為0,或者用戶積分為0的時候無法進行抽獎。
已知表:用戶表,包含積分字段 獎品表,包含獎品剩余數量字段。
高并發意淫分析(屬于開發前的猜測):在高并發的情況下,會導致用戶參與抽獎的時候積分被扣除,而獎品實際上已經被抽完了。
我的設計:在事物里,通過WITH(UPDLOCK)鎖住商品表,或者Update 表的獎品剩余數量和最后編輯時間字段,來把數據行鎖住,然后進行用戶積分的消耗,都完成后提交事物,失敗就回滾。 這樣就可以保證,只有可能存在一個操作在操作這件商品的數量,只有等到這個操作事物提交后,其他的操作這個商品行的事物才會繼續執行。
例子3:通過程序代碼防止包并發下的數據錯亂問題
需求點:【緩存數據到cache里】,當緩存不存在的時候,從數據庫中獲取并保存在cache里,如果存在從cache里獲取,每天10點必須更新一次,其他時間點緩存兩個小時更新一次 到10點的時候,凡是打開頁面的用戶會自動刷新頁面。
問題點:這里有個邏輯用戶觸發緩存的更新,用戶刷新頁面,當緩存存在的時候,會取到最后一次緩存更新時間,如果當前時間大于十點,并且最后緩存時間是10點前,則會從數據庫中重新獲取數據保存到cache中。 還有客戶端頁面會在10點時候用js發起頁面的刷新,就是因為有這樣的邏輯,導致10點的時候有很多并發請求同時過來,然后就會導致很多的sql查詢操作,理想的邏輯是,只有一個請求會去數據庫獲取,其他都是從緩存中獲取數據。(因為這個sql查詢很耗服務器性能,所以導致在10點的時候,突然間數據庫服務器壓力暴增)
解決問題:C#通過(鎖)lock,在從數據讀取到緩存的那段代碼前面加上鎖,這樣在并發的情況下只會有一個請求是從數據庫里獲取數據,其他都是從緩存中獲取。
3
訪問量大的數據統計接口
需求:用戶行為數據統計接口,用來記錄商品展示次數,用戶通過點擊圖片,或者鏈接,或者其他方式進入到商品詳情的行為次數。
問題點:這接口是給前端ajax使用,訪問量會很大,一頁面展示的時候就會有幾十件商品的展示,滾動條滾到到頁面顯示商品的時候就會請求接口進行展示數據的統計,每次翻頁又會加載幾十件。
意淫分析:設想如果同時有1W個用戶同時在線訪問頁面,一個次拉動滾動條屏幕頁面展示10件商品,這樣就會有10W個請求過來,服務端需要把請求數據入庫。在實際線上環境可能還會超過這個請求量,如果不經過進行高并發設計處理,服務器分分鐘給跪了。
解決問題:我們通過nodejs寫了一個數據處理接口,把統計數據先存到redis的list里。(使用nodejs寫接口的好處是,nodejs使用單線程異步事件機制,高并發處理能力強,不會因為數據邏輯處理問題導致服務器資源被占用而導致服務器宕機) 然后再使用nodejs寫了一個腳本,腳本功能就是從redis里出列數據保存到mysql數據庫中。這個腳本會一直運行,當redis沒有數據需要同步到數據庫中的時候,sleep,讓在進行數據同步操作。
4
高并發的下的服務器壓力均衡,合理站點架設,DB部署
以下我所知道的:
服務器代理nginx,做服務器的均衡負載,把壓力均衡到多臺服務器;
部署集群MySQL數據庫, Redis服務器,或者MongoDB服務器,把一些常用的查詢數據,并且不會經常的變化的數據保存到其他NoSQL DB服務器中,來減少數據庫服務器的壓力,加快數據的響應速度;
數據緩存,Cache;
在高并發接口的設計中可以使用具有高并發能力的編程語言去開發,如:nodejs做web接口;
服務器部署,圖片服務器分離,靜態文件走CDN;
DBA數據庫的優化查詢條件,索引優化;
消息存儲機制,將數據添加到信息隊列中(redis list),然后再寫工具去入庫
腳本合理控制請求,如,防止用戶重復點擊導致的ajax多余的請求,等等。
5
并發測試神器推薦
Apache JMeter
Microsoft Web Application Stress Tool
Visual Studio 性能負載
二、關于高并發架構
為了讓業務可以流暢地運行并且給用戶一個好的交互體驗,我們需要根據業務場景預估達到的并發量等因素,來設計適合自己業務場景的高并發處理方案。
在電商相關產品開發的這些年,我有幸遇到了并發下的各種坑,這一路摸爬滾打過來有著不少的血淚史,這里進行總結,作為自己的歸檔記錄,同時分享給大家。
1
服務器架構
業務從發展的初期到逐漸成熟,服務器架構也是從相對單一到集群,再到分布式服務。
一個可以支持高并發的服務少不了好的服務器架構,需要有均衡負載,數據庫需要主從集群,NoSQL緩存需要主從集群,靜態文件需要上傳CDN,這些都是能讓業務程序流暢運行的強大后盾。
服務器這塊多是需要運維人員來配合搭建,具體我就不多說了,點到為止。
大致需要用到的服務器架構如下:
服務器:
均衡負載(如:nginx,阿里云SLB)
資源監控
分布式
數據庫:
主從分離,集群
DBA 表優化,索引優化,等
分布式
NoSQL:
Redis
主從分離,集群
MongoDB
主從分離,集群
memcache
主從分離,集群
CDN:
html
css
js
image
2
并發測試
高并發相關的業務,需要進行并發的測試,通過大量的數據分析評估出整個架構可以支撐的并發量。
測試高并發可以使用第三方服務器或者自己測試服務器,利用測試工具進行并發請求測試,分析測試數據得到可以支撐并發數量的評估,這個可以作為一個預警參考,俗話說知己自彼百戰不殆。
第三方服務:
阿里云性能測試
并發測試工具:
Apache JMeter
Visual Studio性能負載測試
Microsoft Web Application Stress Tool
3
實戰方案
1)通用方案
日用戶流量大,但是比較分散,偶爾會有用戶高聚的情況;
場景: 用戶簽到,用戶中心,用戶訂單等。
服務器架構圖:
說明:
場景中的這些業務基本是用戶進入APP后會操作到的,除了活動日(618、雙11等),這些業務的用戶量都不會高聚集,同時這些業務相關的表都是大數據表,業務多是查詢操作,所以我們需要減少用戶直接命中DB的查詢;優先查詢緩存,如果緩存不存在,再進行DB查詢,將查詢結果緩存起來。
更新用戶相關緩存需要分布式存儲,比如使用用戶ID進行hash分組,把用戶分布到不同的緩存中,這樣一個緩存集合的總量不會很大,不會影響查詢效率。
方案如:
用戶簽到獲取積分:
計算出用戶分布的key,Redis,hash中查找用戶今日簽到信息
如果查詢到簽到信息,返回簽到信息
如果沒有查詢到,DB查詢今日是否簽到過,如果有簽到過,就把簽到信息同步Redis緩存。
如果DB中也沒有查詢到今日的簽到記錄,就進行簽到邏輯,操作DB添加今日簽到記錄,添加簽到積分(這整個DB操作是一個事務)
緩存簽到信息到Redis,返回簽到信息
注意這里會有并發情況下的邏輯問題,如:一天簽到多次,發放多次積分給用戶。
用戶訂單:
這里我們只緩存用戶第一頁的訂單信息,一頁40條數據,用戶一般也只會看第一頁的訂單數據
用戶訪問訂單列表,如果是第一頁讀緩存,如果不是讀DB
計算出用戶分布的key,Redis,hash中查找用戶訂單信息
如果查詢到用戶訂單信息,返回訂單信息
如果不存在就進行DB查詢第一頁的訂單數據,然后緩存redis,返回訂單信息
用戶中心:
計算出用戶分布的key,Redis hash中查找用戶訂單信息
如果查詢到用戶信息,返回用戶信息
如果不存在進行用戶DB查詢,然后緩存redis,返回用戶信息
其他業務:
上面例子多是針對用戶存儲緩存,如果是公用的緩存數據需要注意一些問題,如:公用的緩存數據需要考慮并發下的可能會導致大量命中DB查詢,可以使用管理后臺更新緩存,或者DB查詢的鎖住操作。
以上例子是一個相對簡單的高并發架構,并發量不是很高的情況可以很好的支撐,但是隨著業務的壯大,用戶并發量增加,我們的架構也會進行不斷的優化和演變,比如對業務進行服務化,每個服務有自己的并發架構,自己的均衡服務器,分布式數據庫,NoSQL主從集群,如:用戶服務、訂單服務。
2)消息隊列
秒殺、秒搶等活動業務,用戶在瞬間涌入產生高并發請求。
場景:定時領取紅包等。
服務器架構圖:
說明:
場景中的定時領取是一個高并發的業務,像秒殺活動用戶會在到點的時間涌入,DB瞬間就接受到一記暴擊,hold不住就會宕機,然后影響整個業務;
像這種不是只有查詢的操作并且會有高并發的插入或者更新數據的業務,前面提到的通用方案就無法支撐,并發的時候都是直接命中DB;
設計這塊業務的時候就會使用消息隊列的,可以將參與用戶的信息添加到消息隊列中,然后再寫個多線程程序去消耗隊列,給隊列中的用戶發放紅包;
方案如:
定時領取紅包;
一般習慣使用 redis的 list;
當用戶參與活動,將用戶參與信息push到隊列中;
然后寫個多線程程序去pop數據,進行發放紅包的業務;
這樣可以支持高并發下的用戶可以正常的參與活動,并且避免數據庫服務器宕機的危險。
附加:通過消息隊列可以做很多的服務。
如:定時短信發送服務,使用sset(sorted set),發送時間戳作為排序依據,短信數據隊列根據時間升序,然后寫個程序定時循環去讀取sset隊列中的第一條,當前時間是否超過發送時間,如果超過就進行短信發送。
3)一級緩存
高并發請求連接緩存服務器超出服務器能夠接收的請求連接量,部分用戶出現建立連接超時無法讀取到數據的問題;
因此需要有個方案當高并發時候時候可以減少命中緩存服務器;
這時候就出現了一級緩存的方案,一級緩存就是使用站點服務器緩存去存儲數據,注意只存儲部分請求量大的數據,并且緩存的數據量要控制,不能過分的使用站點服務器的內存而影響了站點應用程序的正常運行,一級緩存需要設置秒單位的過期時間,具體時間根據業務場景設定,目的是當有高并發請求的時候可以讓數據的獲取命中到一級緩存,而不用連接緩存NoSQL數據服務器,減少NoSQL數據服務器的壓力。
比如APP首屏商品數據接口,這些數據是公共的不會針對用戶自定義,而且這些數據不會頻繁的更新,像這種接口的請求量比較大就可以加入一級緩存;
服務器架構圖:
合理地規范和使用NoSQL緩存數據庫,根據業務拆分緩存數據庫的集群,這樣基本可以很好支持業務,一級緩存畢竟是使用站點服務器緩存所以還是要善用。
4)靜態化數據
高并發請求數據不變化的情況下如果可以不請求自己的服務器獲取數據那就可以減少服務器的資源壓力。
對于更新頻繁度不高,并且數據允許短時間內的延遲,可以通過數據靜態化成JSON、XML、HTML等數據文件上傳CDN,在拉取數據的時候優先到CDN拉取,如果沒有獲取到數據再從緩存,數據庫中獲取,當管理人員操作后臺編輯數據再重新生成靜態文件上傳同步到CDN,這樣在高并發的時候可以使數據的獲取命中在CDN服務器上。
CDN節點同步有一定的延遲性,所以找一個靠譜的CDN服務器商也很重要。
5)其他方案
對于更新頻繁度不高的數據,APP、PC瀏覽器,可以緩存數據到本地,然后每次請求接口的時候上傳當前緩存數據的版本號,服務端接收到版本號判斷版本號與最新數據版本號是否一致,如果不一樣就進行最新數據的查詢并返回最新數據和最新版本號,如果一樣就返回狀態碼告知數據已經是最新。減少服務器壓力:資源、帶寬。
經作者同意授權轉載
來源:SFLYQ的博客
原文:http://blog.thankbabe.com/2016/09/14/high-concurrency-scheme/