之前用 Django 做過(guò)一個(gè)小的站點(diǎn),感覺(jué)Django太過(guò)笨重,于是就準(zhǔn)備換一個(gè)比較輕量級(jí)的 Web 框架來(lái)玩玩。Web.py 作者已經(jīng)掛掉,項(xiàng)目好久沒(méi)有更新,所以不準(zhǔn)備用它。而 Flask 也是一個(gè)成熟的輕量級(jí) Web 框架,在 github 上有眾多的 Star 和 Fork,文檔和擴(kuò)展也很豐富,值得學(xué)習(xí)。
學(xué)習(xí)一個(gè)框架最好的方式就是用框架做一個(gè)項(xiàng)目,在實(shí)戰(zhàn)中理解掌握框架。這里我用 Flask 框架,使用 Mysql 數(shù)據(jù)庫(kù)做了一個(gè)論壇系統(tǒng)。麻雀雖小,五臟俱全,論壇效果圖如下:

下面是論壇的基本功能:
- 完整的用戶模塊(注冊(cè)、登錄,更改、找回密碼、信息修改、站內(nèi)消息通知);
- 豐富的論壇模塊(創(chuàng)建、回復(fù)話題,站內(nèi)搜索,markdown支持,@user 提醒);
- 強(qiáng)大的后臺(tái)管理,支持屏蔽用戶、話題、評(píng)論,支持各種條件搜索話題、評(píng)論;
本博客將會(huì)用一系列文章,記錄論壇系統(tǒng)搭建的過(guò)程,希望對(duì)剛?cè)腴TWeb開(kāi)發(fā)的同學(xué)有所幫助。
我們經(jīng)常聽(tīng)說(shuō) Django, Flask 這些 python 語(yǔ)言的Web 框架
,那么框架到底是什么,Web框架和Web服務(wù)器(Nginx, Apache等)有什么區(qū)別?離開(kāi)框架還能用 Python 搭建Web站點(diǎn)嗎?要解決這些疑問(wèn),我們有必要來(lái)理解下 Web 服務(wù)器的工作原理,以及 Web 框架的本質(zhì)。
Web 服務(wù)器
當(dāng)我們?cè)跒g覽器輸入U(xiǎn)RL后,瀏覽器會(huì)先請(qǐng)求DNS服務(wù)器,獲得請(qǐng)求站點(diǎn)的 IP 地址。然后發(fā)送一個(gè)HTTP Request(請(qǐng)求)給擁有該 IP 的主機(jī),接著就會(huì)接收到服務(wù)器給我們的 HTTP Response(響應(yīng)),瀏覽器經(jīng)過(guò)渲染后,以一種較好的效果呈現(xiàn)給我們。這個(gè)過(guò)程中,正是Web服務(wù)器在幕后默默做貢獻(xiàn)。
簡(jiǎn)單來(lái)說(shuō),Web服務(wù)器是在運(yùn)行在物理服務(wù)器上的一個(gè)程序,它永久地等待客戶端(主要是瀏覽器,比如Chrome,F(xiàn)irefox等)發(fā)送請(qǐng)求。當(dāng)收到請(qǐng)求之后,它會(huì)生成相應(yīng)的響應(yīng)并將其返回至客戶端。Web服務(wù)器通過(guò)HTTP協(xié)議與客戶端通信,因此也被稱為HTTP服務(wù)器。
Web服務(wù)器的工作原理并不復(fù)雜,一般可分成如下4個(gè)步驟:建立連接、請(qǐng)求過(guò)程、應(yīng)答過(guò)程以及關(guān)閉連接
。
- 建立連接:客戶機(jī)通過(guò)TCP/IP協(xié)議建立到服務(wù)器的TCP連接。
- 請(qǐng)求過(guò)程:客戶端向服務(wù)器發(fā)送HTTP協(xié)議請(qǐng)求包,請(qǐng)求服務(wù)器里的資源文檔。
- 應(yīng)答過(guò)程:服務(wù)器向客戶機(jī)發(fā)送HTTP協(xié)議應(yīng)答包,如果請(qǐng)求的資源包含有動(dòng)態(tài)語(yǔ)言的內(nèi)容,那么服務(wù)器會(huì)調(diào)用動(dòng)態(tài)語(yǔ)言的解釋引擎負(fù)責(zé)處理“動(dòng)態(tài)內(nèi)容”,并將處理得到的數(shù)據(jù)返回給客戶端。由客戶端解釋HTML文檔,在客戶端屏幕上渲染圖形結(jié)果。
- 關(guān)閉連接:客戶機(jī)與服務(wù)器斷開(kāi)。
下面我們實(shí)現(xiàn)一個(gè)簡(jiǎn)單的 Web 服務(wù)器。運(yùn)行示例程序后,會(huì)監(jiān)聽(tīng)本地端口 8000,在瀏覽器訪問(wèn) http://localhost:8000 就能看到響應(yīng)內(nèi)容。而我們的程序也能夠打印出客戶端發(fā)來(lái)的請(qǐng)求內(nèi)容,如下圖:

這里Request 和 Response 都需要遵守 HTTP 協(xié)議,關(guān)于 HTTP 協(xié)議的詳細(xì)內(nèi)容,可以讀讀《HTTP 權(quán)威指南》,或者看我整理的HTTP 部分內(nèi)容。
雖然說(shuō)web服務(wù)器的主要工作是根據(jù)request返回response,但是實(shí)際中的 Web 服務(wù)器遠(yuǎn)遠(yuǎn)比上面示例的復(fù)雜的多,因?yàn)橐紤]的因素實(shí)在是太多了,比如:
- 緩存機(jī)制:講一些經(jīng)常被訪問(wèn)的頁(yè)面緩存起來(lái),提高響應(yīng)速度;
- 安全:防止黑客的各種攻擊,比如 SYN Flood 攻擊;
- 并發(fā)處理:如何響應(yīng)不同客戶端同時(shí)發(fā)起的請(qǐng)求;
- 日志:記錄訪問(wèn)日至,方便做一些分析。
目前在UNIX和LINUX平臺(tái)下使用最廣泛的免費(fèi) Web 服務(wù)器有Apache和 Nginx 。
Web 應(yīng)用程序
Web 服務(wù)器接受 Http Request,返回 Response,很多時(shí)候 Response 并不是靜態(tài)文件,因此需要有一個(gè)應(yīng)用程序根據(jù) Request 生成相應(yīng)的 Response。這里的應(yīng)用程序主要用來(lái)處理相關(guān)業(yè)務(wù)邏輯,讀取或者更新數(shù)據(jù)庫(kù),根據(jù)不同 Request 返回相應(yīng)的 Response。注意這里并不是 Web 服務(wù)器本身來(lái)做這件事,它只負(fù)責(zé) Http 協(xié)議層面和一些諸如并發(fā)處理,安全,日志等相關(guān)的事情。
應(yīng)用程序可以用各種語(yǔ)言編寫(Java, PHP, Python, Ruby等),這個(gè)應(yīng)用程序會(huì)從Web服務(wù)器接收客戶端的請(qǐng)求,處理完成后,再返回響應(yīng)給Web服務(wù)器,最后由Web服務(wù)器返回給客戶端。整個(gè)架構(gòu)如下:

以 Python 為例,使用Python開(kāi)發(fā)Web,最原始和直接的辦法是使用CGI標(biāo)準(zhǔn),在1998年這種方式很流行。首先確保 Web 服務(wù)器支持CGI及已經(jīng)配置了CGI的處理程序,然后設(shè)置好CGI目錄,在目錄里面添加相應(yīng)的 python 文件,每一個(gè) python 文件處理相應(yīng)輸入,生成一個(gè) html 文件即可,如下例:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
print "Content-type:text/html"
print # 空行,告訴服務(wù)器結(jié)束頭部
print '<html>'
print '<head>'
print '<meta charset="utf-8">'
print '</head>'
print '<body>'
print '<h2>Hello Word! 我是一個(gè)CGI程序</h2>'
print '</body>'
print '</html>'
這樣在瀏覽器訪問(wèn)該文件就可以得到一個(gè)簡(jiǎn)單的 Hello World 網(wǎng)頁(yè)內(nèi)容。直接通過(guò) CGI 寫 Web 應(yīng)用程序看起來(lái)很簡(jiǎn)單,每一個(gè)文件處理輸入,生成html。但是實(shí)際開(kāi)發(fā)中,可能會(huì)遇到許多不方便的地方。比如:
- 每個(gè)獨(dú)立的CGI腳本可能會(huì)重復(fù)寫數(shù)據(jù)庫(kù)連接,關(guān)閉的代碼;
- 后端開(kāi)發(fā)者會(huì)看到一堆 Content-Type 等和自己無(wú)關(guān)的 html 頁(yè)面元素;
Web 框架
早期開(kāi)發(fā)站點(diǎn)確做了許多重復(fù)性勞動(dòng),后來(lái)為了減少重復(fù),避免寫出龐雜,混亂的代碼,人們將 Web 開(kāi)發(fā)的關(guān)鍵性過(guò)程提取出來(lái),開(kāi)發(fā)出了各種 Web 框架。有了框架,就可以專注于編寫清晰、易維護(hù)的代碼,無(wú)需關(guān)心數(shù)據(jù)庫(kù)連接之類的重復(fù)性工作。
其中一種比較經(jīng)典的Web框架采用了 MVC 架構(gòu),如下圖所示:

用戶輸入 URL,客戶端發(fā)送請(qǐng)求,控制器(Controller)
首先會(huì)拿到請(qǐng)求,然后用模型(Models)
從數(shù)據(jù)庫(kù)取出所有需要的數(shù)據(jù),進(jìn)行必要的處理,將處理后的結(jié)果發(fā)送給 視圖(View)
,視圖利用獲取到的數(shù)據(jù),進(jìn)行渲染生成 Html Response返回給客戶端。
以 python web 框架 flask 為例,框架本身并不限定我們用哪種架構(gòu)來(lái)組織我們的應(yīng)用,不過(guò) flask 可以很好地支持以 MVC 方式組織應(yīng)用。
控制器:flask 可以用裝飾器來(lái)添加路由項(xiàng),如下:
@app.route('/')
def main_page():
pass
模型:主要用來(lái)取出需要的數(shù)據(jù),如下面函數(shù)中操作:
@app.route('/')
def main_page():
"""Searches the database for entries, then displays them."""
db = get_db()
cur = db.execute('select * from entries order by id desc')
entries = cur.fetchall()
return render_template('index.html', entries=entries)
視圖:flask 利用 jinja2 來(lái)渲染頁(yè)面,下面的模版文件指定了頁(yè)面的樣式:
{% for entry in entries %}
<li>
<h2>{{ entry.title }}</h2>
<div>{{ entry.text|safe }}</div>
</li>
{% else %}
<li><em>No entries yet. Add some!</em></li>
{% endfor %}
Web 服務(wù)器網(wǎng)關(guān)接口
我們知道Python有著許多的 Web 框架,而同時(shí)又有著許多的 Web 服務(wù)器(Apache, Nginx, Gunicorn等),框架和Web服務(wù)器之間需要進(jìn)行通信,如果在設(shè)計(jì)時(shí)它們之間不可以相互匹配的,那么選擇了一個(gè)框架就會(huì)限制對(duì) Web 服務(wù)器的選擇,這顯然是不合理的。
那么,怎樣確保可以在不修改Web服務(wù)器代碼或網(wǎng)絡(luò)框架代碼的前提下,使用自己選擇的服務(wù)器,并且匹配多個(gè)不同的網(wǎng)絡(luò)框架呢?答案是接口,設(shè)計(jì)一套雙方都遵守的接口就可以了。對(duì)python來(lái)說(shuō),就是WSGI
(Web Server Gateway Interface,Web服務(wù)器網(wǎng)關(guān)接口)。其他編程語(yǔ)言也擁有類似的接口:例如Java的Servlet API和Ruby的Rack。
Python WSGI的出現(xiàn),讓開(kāi)發(fā)者可以將 Web 框架與 Web 服務(wù)器的選擇分隔開(kāi)來(lái),不再相互限制。現(xiàn)在,你可以真正地將不同的 Web 服務(wù)器與Web框架進(jìn)行混合搭配,選擇滿足自己需求的組合。例如,可以使用 Gunicorn 或Nginx/uWSGI來(lái)運(yùn)行Django、Flask或web.py應(yīng)用。

下一篇我們將會(huì)仔細(xì)分析 WSGI 接口標(biāo)準(zhǔn),然后一起來(lái)寫一個(gè)簡(jiǎn)單的 WSGI Web 服務(wù)器。
更多閱讀
自己動(dòng)手開(kāi)發(fā)網(wǎng)絡(luò)服務(wù)器(一)
自己動(dòng)手開(kāi)發(fā)網(wǎng)絡(luò)服務(wù)器(二)
自己動(dòng)手開(kāi)發(fā)網(wǎng)絡(luò)服務(wù)器(三)
Web服務(wù)器網(wǎng)關(guān)接口實(shí)現(xiàn)原理分析
Python最佳實(shí)踐指南:Web 應(yīng)用
淺談Python web框架
Python CGI編程
Django vs Flask vs Pyramid: Choosing a Python Web Framework
PEP 333 -- Python Web Server Gateway Interface v1.0
WSGI簡(jiǎn)介
Model-View-Controller (MVC) Explained -- With Legos