好文章要讓更多的人知道!!本文轉(zhuǎn)載自:開源社區(qū)原文鏈接:https://www.kysq.com/article/a33fc5e02b.html
目標
本教程講解如何防御最常見的安全威脅:SQL 注入、操縱 GET 和 POST 變量、緩沖區(qū)溢出攻擊、跨站點腳本攻擊、瀏覽器內(nèi)的數(shù)據(jù)操縱和遠程表單提交。
前提條件
本教程是為至少有一年編程經(jīng)驗的 PHP 開發(fā)人員編寫的。您應(yīng)該了解 PHP 的語法和約定;這里不解釋這些內(nèi)容。有使用其他語言(比如 Ruby、Python 和 Perl)的經(jīng)驗的開發(fā)人員也能夠從本教程中受益,因為這里討論的許多規(guī)則也適用于其他語言和環(huán)境。
安全性快速簡介
Web 應(yīng)用程序最重要的部分是什么?根據(jù)回答問題的人不同,對這個問題的答案可能是五花八門。業(yè)務(wù)人員需要可靠性和可伸縮性。IT 支持團隊需要健壯的可維護的代碼。最終用戶需要漂亮的用戶界面和執(zhí)行任務(wù)時的高性能。但是,如果回答 “安全性”,那么每個人都會同意這對 Web 應(yīng)用程序很重要。
但是,大多數(shù)討論到此就打住了。盡管安全性在項目的檢查表中,但是往往到了項目交付之前才開始考慮解決安全性問題。采用這種方式的 Web 應(yīng)用程序項目的數(shù)量多得驚人。開發(fā)人員工作幾個月,只在最后才添加安全特性,從而讓 Web 應(yīng)用程序能夠向公眾開放。
結(jié)果往往是一片混亂,甚至需要返工,因為代碼已經(jīng)經(jīng)過檢驗、單元測試并集成為更大的框架,之后才在其中添加安全特性。添加安全性之后,主要組件可能會停止工作。安全性的集成使得原本順暢(但不安全)的過程增加額外負擔或步驟。
本教程提供一種將安全性集成到 PHP Web 應(yīng)用程序中的好方法。它討論幾個一般性安全主題,然后深入討論主要的安全漏洞以及如何堵住它們。在學(xué)完本教程之后,您會對安全性有更好的理解。
主題包括:
SQL 注入攻擊
操縱 GET 字符串
緩沖區(qū)溢出攻擊
跨站點腳本攻擊(XSS)
瀏覽器內(nèi)的數(shù)據(jù)操縱
遠程表單提交
Web 安全性 101
在討論實現(xiàn)安全性的細節(jié)之前,最好從比較高的角度討論 Web 應(yīng)用程序安全性。本節(jié)介紹安全哲學(xué)的一些基本信條,無論正在創(chuàng)建何種 Web 應(yīng)用程序,都應(yīng)該牢記這些信條。這些思想的一部分來自 Chris Shiflett(他關(guān)于 PHP 安全性的書是無價的寶庫),一些來自 Simson Garfinkel(參見 參考資料),還有一些來自多年積累的知識。
規(guī)則 1:絕不要信任外部數(shù)據(jù)或輸入
關(guān)于 Web 應(yīng)用程序安全性,必須認識到的第一件事是不應(yīng)該信任外部數(shù)據(jù)。外部數(shù)據(jù)(outside data) 包括不是由程序員在 PHP 代碼中直接輸入的任何數(shù)據(jù)。在采取措施確保安全之前,來自任何其他來源(比如 GET 變量、表單 POST、數(shù)據(jù)庫、配置文件、會話變量或 cookie)的任何數(shù)據(jù)都是不可信任的。
例如,下面的數(shù)據(jù)元素可以被認為是安全的,因為它們是在 PHP 中設(shè)置的。
清單 1. 安全無暇的代碼
$myUsername?= ‘tmyer’;
$arrayUsers?=array(’tmyer’, ‘tom’, ‘tommy’);
define(”GREETING”, ‘hello there’ .$myUsername);
但是,下面的數(shù)據(jù)元素都是有瑕疵的。
清單 2. 不安全、有瑕疵的代碼
$myUsername?=$_POST['username'];//tainted!
$arrayUsers?=array($myUsername, ‘tom’, ‘tommy’);//tainted!
define(”GREETING”, ‘hello there’ .$myUsername);//tainted!
為什么第一個變量 $myUsername 是有瑕疵的?因為它直接來自表單 POST。用戶可以在這個輸入域中輸入任何字符串,包括用來清除文件或運行以前上傳的文件的惡意命令。您可能會問,“難道不能使用只接受字母 A-Z 的客戶端(JavaScript)表單檢驗?zāi)_本來避免這種危險嗎?”是的,這總是一個有好處的步驟,但是正如在后面會看到的,任何人都可以將任何表單下載到自己的機器上,修改它,然后重新提交他們需要的任何內(nèi)容。
解決方案很簡單:必須對 $_POST['username'] 運行清理代碼。如果不這么做,那么在使用 $myUsername 的任何其他時候(比如在數(shù)組或常量中),就可能污染這些對象。
對用戶輸入進行清理的一個簡單方法是,使用正則表達式來處理它。在這個示例中,只希望接受字母。將字符串限制為特定數(shù)量的字符,或者要求所有字母都是小寫的,這可能也是個好主意。
清單 3. 使用戶輸入變得安全
$myUsername?= cleanInput($_POST['username']);//clean!
$arrayUsers?=array($myUsername, ‘tom’, ‘tommy’);//clean!
define(”GREETING”, ‘hello there’ .$myUsername);//clean!
function?cleanInput($input){
$clean?=strtolower($input);
$clean?= preg_replace(”/[^a-z]/”, “”,$clean);
$clean?=substr($clean,0,12);
return$clean;
}
規(guī)則 2:禁用那些使安全性難以實施的 PHP 設(shè)置
已經(jīng)知道了不能信任用戶輸入,還應(yīng)該知道不應(yīng)該信任機器上配置 PHP 的方式。例如,要確保禁用 register_globals。如果啟用了 register_globals,就可能做一些粗心的事情,比如使用 $variable 替換同名的 GET 或 POST 字符串。通過禁用這個設(shè)置,PHP 強迫您在正確的名稱空間中引用正確的變量。要使用來自表單 POST 的變量,應(yīng)該引用 $_POST['variable']。這樣就不會將這個特定變量誤會成 cookie、會話或 GET 變量。
要檢查的第二個設(shè)置是錯誤報告級別。在開發(fā)期間,希望獲得盡可能多的錯誤報告,但是在交付項目時,希望將錯誤記錄到日志文件中,而不是顯示在屏幕上。為什么呢?因為惡意的黑客會使用錯誤報告信息(比如 SQL 錯誤)來猜測應(yīng)用程序正在做什么。這種偵察可以幫助黑客突破應(yīng)用程序。為了堵住這個漏洞,需要編輯php.ini 文件,為 error_log 條目提供合適的目的地,并將 display_errors 設(shè)置為 Off。
規(guī)則 3:如果不能理解它,就不能保護它
一些開發(fā)人員使用奇怪的語法,或者將語句組織得很緊湊,形成簡短但是含義模糊的代碼。這種方式可能效率高,但是如果您不理解代碼正在做什么,那么就無法決定如何保護它。
例如,您喜歡下面兩段代碼中的哪一段?
清單 4. 使代碼容易得到保護
//obfuscated code
$input?= (isset($_POST['username']) ?$_POST['username']:”);
//unobfuscated code
$input?= ”;
if?(isset($_POST['username'])){
$input?=$_POST['username'];
}else{
$input?= ”;
}
在第二個比較清晰的代碼段中,很容易看出 $input 是有瑕疵的,需要進行清理,然后才能安全地處理。
規(guī)則 4:“縱深防御” 是新的法寶
本教程將用示例來說明如何保護在線表單,同時在處理表單的 PHP 代碼中采用必要的措施。同樣,即使使用 PHP regex 來確保 GET 變量完全是數(shù)字的,仍然可以采取措施確保 SQL 查詢使用轉(zhuǎn)義的用戶輸入。
縱深防御不只是一種好思想,它可以確保您不會陷入嚴重的麻煩。
既然已經(jīng)討論了基本規(guī)則,現(xiàn)在就來研究第一種威脅:SQL 注入攻擊。
防止 SQL 注入攻擊
在 SQL 注入攻擊 中,用戶通過操縱表單或 GET 查詢字符串,將信息添加到數(shù)據(jù)庫查詢中。例如,假設(shè)有一個簡單的登錄數(shù)據(jù)庫。這個數(shù)據(jù)庫中的每個記錄都有一個用戶名字段和一個密碼字段。構(gòu)建一個登錄表單,讓用戶能夠登錄。
清單 5. 簡單的登錄表單
Login
Username
Password
這個表單接受用戶輸入的用戶名和密碼,并將用戶輸入提交給名為 verify.php的文件。在這個文件中,PHP 處理來自登錄表單的數(shù)據(jù),如下所示:
清單 6. 不安全的 PHP 表單處理代碼
$okay?= 0;
$username?=$_POST['user'];
$pw?=$_POST['pw'];
$sql?= “selectcount(*)as?ctr from users where
username=’”.$username.”‘a(chǎn)nd?password=’”.$pw.”‘ limit 1″;
$result?= mysql_query($sql);
while?($data?= mysql_fetch_object($result)){
if?($data->ctr == 1){
//they’re okay to enter the application!
$okay?= 1;
}
}
if?($okay){
$_SESSION['loginokay'] = true;
header(”index.php”);
}else{
header(”login.php”);
}
這段代碼看起來沒問題,對嗎?世界各地成百(甚至成千)的 PHP/MySQL 站點都在使用這樣的代碼。它錯在哪里?好,記住 “不能信任用戶輸入”。這里沒有對來自用戶的任何信息進行轉(zhuǎn)義,因此使應(yīng)用程序容易受到攻擊。具體來說,可能會出現(xiàn)任何類型的 SQL 注入攻擊。
例如,如果用戶輸入 foo 作為用戶名,輸入 ‘ or ‘1′=’1 作為密碼,那么實際上會將以下字符串傳遞給 PHP,然后將查詢傳遞給 MySQL:
$sql = “select count(*) as ctr from users where
username=’foo’ and password=” or ‘1′=’1′ limit 1″;
這個查詢總是返回計數(shù)值 1,因此 PHP 會允許進行訪問。通過在密碼字符串的末尾注入某些惡意 SQL,黑客就能裝扮成合法的用戶。
解決這個問題的辦法是,將 PHP 的內(nèi)置 mysql_real_escape_string() 函數(shù)用作任何用戶輸入的包裝器。這個函數(shù)對字符串中的字符進行轉(zhuǎn)義,使字符串不可能傳遞撇號等特殊字符并讓 MySQL 根據(jù)特殊字符進行操作。清單 7 展示了帶轉(zhuǎn)義處理的代碼。
清單 7. 安全的 PHP 表單處理代碼
$okay?= 0;
$username?=$_POST['user'];
$pw?=$_POST['pw'];
$sql?= “selectcount(*)as?ctr from users where
username=’”.mysql_real_escape_string($username).”‘
and?password=’”. mysql_real_escape_string($pw).”‘ limit 1″;
$result?= mysql_query($sql);
while?($data?= mysql_fetch_object($result)){
if?($data->ctr == 1){
//they’re okay to enter the application!
$okay?= 1;
}
}
if?($okay){
$_SESSION['loginokay'] = true;
header(”index.php”);
}else{
header(”login.php”);
}
使用 mysql_real_escape_string() 作為用戶輸入的包裝器,就可以避免用戶輸入中的任何惡意 SQL 注入。如果用戶嘗試通過 SQL 注入傳遞畸形的密碼,那么會將以下查詢傳遞給數(shù)據(jù)庫:
select count(*) as ctr from users where \
username=’foo’ and password=’\’ or \’1\’=\’1′ limit 1″
數(shù)據(jù)庫中沒有任何東西與這樣的密碼匹配。僅僅采用一個簡單的步驟,就堵住了 Web 應(yīng)用程序中的一個大漏洞。這里得出的經(jīng)驗是,總是應(yīng)該對 SQL 查詢的用戶輸入進行轉(zhuǎn)義。
但是,還有幾個安全漏洞需要堵住。下一項是操縱 GET 變量。
防止用戶操縱 變量
在前一節(jié)中,防止了用戶使用畸形的密碼進行登錄。如果您很聰明,應(yīng)該應(yīng)用您學(xué)到的方法,確保對 SQL 語句的所有用戶輸入進行轉(zhuǎn)義。
但是,用戶現(xiàn)在已經(jīng)安全地登錄了。用戶擁有有效的密碼,并不意味著他將按照規(guī)則行事 —— 他有很多機會能夠造成損害。例如,應(yīng)用程序可能允許用戶查看特殊的內(nèi)容。所有鏈接指向 template.php?pid=33 或 template.php?pid=321 這樣的位置。URL 中問號后面的部分稱為查詢字符串。因為查詢字符串直接放在 URL 中,所以也稱為 GET 查詢字符串。
在 PHP 中,如果禁用了 register_globals,那么可以用 $_GET['pid'] 訪問這個字符串。在 template.php 頁面中,可能會執(zhí)行與清單 8 相似的操作。
清單 8. 示例 template.php
$pid?=$_GET['pid'];
//we create an object of a fictional class Page
$obj?=new?Page;
$content?=$obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
這里有什么錯嗎?首先,這里隱含地相信來自瀏覽器的 GET 變量 pid 是安全的。這會怎么樣呢?大多數(shù)用戶沒那么聰明,無法構(gòu)造出語義攻擊。但是,如果他們注意到瀏覽器的 URL 位置域中的 pid=33,就可能開始搗亂。如果他們輸入另一個數(shù)字,那么可能沒問題;但是如果輸入別的東西,比如輸入 SQL 命令或某個文件的名稱(比如 /etc/passwd),或者搞別的惡作劇,比如輸入長達 3,000 個字符的數(shù)值,那么會發(fā)生什么呢?
在這種情況下,要記住基本規(guī)則,不要信任用戶輸入。應(yīng)用程序開發(fā)人員知道 template.php 接受的個人標識符(PID)應(yīng)該是數(shù)字,所以可以使用 PHP 的 is_numeric() 函數(shù)確保不接受非數(shù)字的 PID,如下所示:
清單 9. 使用 is_numeric() 來限制 GET 變量
$pid?=$_GET['pid'];
if?(is_numeric($pid)){
//we create an object of a fictional class Page
$obj?=new?Page;
$content?=$obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
}else{
//didn’t pass the is_numeric() test, do something else!
}
這個方法似乎是有效的,但是以下這些輸入都能夠輕松地通過 is_numeric() 的檢查:
100 (有效)
100.1 (不應(yīng)該有小數(shù)位)
+0123.45e6 (科學(xué)計數(shù)法 —— 不好)
0xff33669f (十六進制 —— 危險!危險!)
那么,有安全意識的 PHP 開發(fā)人員應(yīng)該怎么做呢?多年的經(jīng)驗表明,最好的做法是使用正則表達式來確保整個 GET 變量由數(shù)字組成,如下所示:
清單 10. 使用正則表達式限制 GET 變量
$pid?=$_GET['pid'];
if?(strlen($pid)){
if?(!ereg(”^[0-9]+$”,$pid)){
//do something appropriate, like maybe logging \
them outor?sending them back to home page
}
}else{
//empty $pid, so send them back to the home page
}
//we create an object of a fictional class Page, which is now
//moderately protected from evil user input
$obj?=new?Page;
$content?=$obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
需要做的只是使用 strlen() 檢查變量的長度是否非零;如果是,就使用一個全數(shù)字正則表達式來確保數(shù)據(jù)元素是有效的。如果 PID 包含字母、斜線、點號或任何與十六進制相似的內(nèi)容,那么這個例程捕獲它并將頁面從用戶活動中屏蔽。如果看一下 Page 類幕后的情況,就會看到有安全意識的 PHP 開發(fā)人員已經(jīng)對用戶輸入 $pid 進行了轉(zhuǎn)義,從而保護了 fetchPage() 方法,如下所示:
清單 11. 對 fetchPage() 方法進行轉(zhuǎn)義
class?Page{
function?fetchPage($pid){
$sql?= “select pid,title,desc,kw,content,\
status from page where pid=’
”.mysql_real_escape_string($pid).”‘”;
//etc, etc….
}
}
您可能會問,“既然已經(jīng)確保 PID 是數(shù)字,那么為什么還要進行轉(zhuǎn)義?” 因為不知道在多少不同的上下文和情況中會使用 fetchPage() 方法。必須在調(diào)用這個方法的所有地方進行保護,而方法中的轉(zhuǎn)義體現(xiàn)了縱深防御的意義。
如果用戶嘗試輸入非常長的數(shù)值,比如長達 1000 個字符,試圖發(fā)起緩沖區(qū)溢出攻擊,那么會發(fā)生什么呢?下一節(jié)更詳細地討論這個問題,但是目前可以添加另一個檢查,確保輸入的 PID 具有正確的長度。您知道數(shù)據(jù)庫的 pid 字段的最大長度是 5 位,所以可以添加下面的檢查。
清單 12. 使用正則表達式和長度檢查來限制 GET 變量
$pid?=$_GET['pid'];
if?(strlen($pid)){
if?(!ereg(”^[0-9]+$”,$pid) &&strlen($pid) > 5){
//do something appropriate, like maybe logging \
them outor?sending them back to home page
}
}else{
//empty $pid, so send them back to the home page
}
//we create an object of a fictional class Page, which is now
//even more protected from evil user input
$obj?=new?Page;
$content?=$obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
現(xiàn)在,任何人都無法在數(shù)據(jù)庫應(yīng)用程序中塞進一個 5,000 位的數(shù)值 —— 至少在涉及 GET 字符串的地方不會有這種情況。想像一下黑客在試圖突破您的應(yīng)用程序而遭到挫折時咬牙切齒的樣子吧!而且因為關(guān)閉了錯誤報告,黑客更難進行偵察。
緩沖區(qū)溢出攻擊
緩沖區(qū)溢出攻擊 試圖使 PHP 應(yīng)用程序中(或者更精確地說,在 Apache 或底層操作系統(tǒng)中)的內(nèi)存分配緩沖區(qū)發(fā)生溢出。請記住,您可能是使用 PHP 這樣的高級語言來編寫 Web 應(yīng)用程序,但是最終還是要調(diào)用 C(在 Apache 的情況下)。與大多數(shù)低級語言一樣,C 對于內(nèi)存分配有嚴格的規(guī)則。
緩沖區(qū)溢出攻擊向緩沖區(qū)發(fā)送大量數(shù)據(jù),使部分數(shù)據(jù)溢出到相鄰的內(nèi)存緩沖區(qū),從而破壞緩沖區(qū)或者重寫邏輯。這樣就能夠造成拒絕服務(wù)、破壞數(shù)據(jù)或者在遠程服務(wù)器上執(zhí)行惡意代碼。
防止緩沖區(qū)溢出攻擊的惟一方法是檢查所有用戶輸入的長度。例如,如果有一個表單元素要求輸入用戶的名字,那么在這個域上添加值為 40 的 maxlength 屬性,并在后端使用 substr() 進行檢查。清單 13 給出表單和 PHP 代碼的簡短示例。
清單 13. 檢查用戶輸入的長度
if?($_POST['submit'] == “go”){
$name?=substr($_POST['name'],0,40);
//continue processing….
}
;
Name
“name” id=”name” size=”20″ maxlength=”40″/>
為什么既提供 maxlength 屬性,又在后端進行 substr() 檢查?因為縱深防御總是好的。瀏覽器防止用戶輸入 PHP 或 MySQL 不能安全地處理的超長字符串(想像一下有人試圖輸入長達 1,000 個字符的名稱),而后端 PHP 檢查會確保沒有人遠程地或者在瀏覽器中操縱表單數(shù)據(jù)。
正如您看到的,這種方式與前一節(jié)中使用 strlen() 檢查 GET 變量 pid 的長度相似。在這個示例中,忽略長度超過 5 位的任何輸入值,但是也可以很容易地將值截短到適當?shù)拈L度,如下所示:
清單 14. 改變輸入的 GET 變量的長度
$pid?=$_GET['pid'];
if?(strlen($pid)){
if?(!ereg(”^[0-9]+$”,$pid)){
//if non numeric $pid, send them back to home page
}
}else{
//empty $pid, so send them back to the home page
}
//we have a numeric pid, but it may be too long, so let’s check
if?(strlen($pid)>5){
$pid?=substr($pid,0,5);
}
//we create an object of a fictional class Page, which is now
//even more protected from evil user input
$obj?=new?Page;
$content?=$obj->fetchPage($pid);
//and now we have a bunch of PHP that displays the page
//……
//……
注意,緩沖區(qū)溢出攻擊并不限于長的數(shù)字串或字母串。也可能會看到長的十六進制字符串(往往看起來像 \xA3 或 \xFF)。記住,任何緩沖區(qū)溢出攻擊的目的都是淹沒特定的緩沖區(qū),并將惡意代碼或指令放到下一個緩沖區(qū)中,從而破壞數(shù)據(jù)或執(zhí)行惡意代碼。對付十六進制緩沖區(qū)溢出最簡單的方法也是不允許輸入超過特定的長度。
如果您處理的是允許在數(shù)據(jù)庫中輸入較長條目的表單文本區(qū),那么無法在客戶端輕松地限制數(shù)據(jù)的長度。在數(shù)據(jù)到達 PHP 之后,可以使用正則表達式清除任何像十六進制的字符串。
清單 15. 防止十六進制字符串
if?($_POST['submit'] == “go”){
$name?=substr($_POST['name'],0,40);
//clean out any potential hexadecimal characters
$name?= cleanHex($name);
//continue processing….
}
function?cleanHex($input){
$clean?= preg_replace(”![\][xX]([A-Fa-f0-9]{1,3})!”, “”,$input);
return$clean;
}
” method=”post”
Name
您可能會發(fā)現(xiàn)這一系列操作有點兒太嚴格了。畢竟,十六進制串有合法的用途,比如輸出外語中的字符。如何部署十六進制 regex
由您自己決定。比較好的策略是,只有在一行中包含過多十六進制串時,或者字符串的字符超過特定數(shù)量(比如 128 或 255)時,才刪除十六進制串。
跨站點腳本攻擊
在跨站點腳本(XSS)攻擊中,往往有一個惡意用戶在表單中(或通過其他用戶輸入方式)輸入信息,這些輸入將惡意的客戶端標記插入過程或數(shù)據(jù)庫中。例如,假設(shè)站點上有一個簡單的來客登記簿程序,讓訪問者能夠留下姓名、電子郵件地址和簡短的消息。惡意用戶可以利用這個機會插入簡短消息之外的東西,比如對于其他用戶不合適的圖片或?qū)⒂脩糁囟ㄏ虻搅硪粋€站點的 JavaScript,或者竊取 cookie 信息。
幸運的是,PHP 提供了 strip_tags() 函數(shù),這個函數(shù)可以清除任何包圍在 HTML 標記中的內(nèi)容。strip_tags() 函數(shù)還允許提供允許標記的列表,比如 或 。
清單 16 給出一個示例,這個示例是在前一個示例的基礎(chǔ)上構(gòu)建的。
清單 16. 從用戶輸入中清除 HTML 標記
if?($_POST['submit'] == “go”){
//strip_tags
$name?=strip_tags($_POST['name']);
$name?=substr($name,0,40);
//clean out any potential hexadecimal characters
$name?= cleanHex($name);
//continue processing….
}
function?cleanHex($input){
$clean?= preg_replace\
(”![\][xX]([A-Fa-f0-9]{1,3})!”, “”,$input);
return$clean;
}
“” method=”post”
Name
“text” name=”name” id=”name” size=”20″ maxlength=”40″/>
從安全的角度來看,對公共用戶輸入使用 strip_tags() 是必要的。如果表單在受保護區(qū)域(比如內(nèi)容管理系統(tǒng))中,而且您相信用戶會正確地執(zhí)行他們的任務(wù)(比如為 Web 站點創(chuàng)建 HTML 內(nèi)容),那么使用 strip_tags() 可能是不必要的,會影響工作效率。
還有一個問題:如果要接受用戶輸入,比如對貼子的評論或來客登記項,并需要將這個輸入向其他用戶顯示,那么一定要將響應(yīng)放在 PHP 的 htmlspecialchars() 函數(shù)中。這個函數(shù)將與符號、< 和 > 符號轉(zhuǎn)換為 HTML 實體。例如,與符號(&)變成 &。這樣的話,即使惡意內(nèi)容躲開了前端 strip_tags() 的處理,也會在后端被 htmlspecialchars() 處理掉。
瀏覽器內(nèi)的數(shù)據(jù)操縱
有一類瀏覽器插件允許用戶篡改頁面上的頭部元素和表單元素。使用 Tamper Data(一個 Mozilla 插件),可以很容易地操縱包含許多隱藏文本字段的簡單表單,從而向 PHP 和 MySQL 發(fā)送指令。
用戶在點擊表單上的 Submit 之前,他可以啟動 Tamper Data。在提交表單時,他會看到表單數(shù)據(jù)字段的列表。Tamper Data 允許用戶篡改這些數(shù)據(jù),然后瀏覽器完成表單提交。
讓我們回到前面建立的示例。已經(jīng)檢查了字符串長度、清除了 HTML 標記并刪除了十六進制字符。但是,添加了一些隱藏的文本字段,如下所示:
清單 17. 隱藏變量
if?($_POST['submit'] == “go”){
//strip_tags
$name?=strip_tags($_POST['name']);
$name?=substr($name,0,40);
//clean out any potential hexadecimal characters
$name?= cleanHex($name);
//continue processing….
}
function?cleanHex($input){
$clean?= \
preg_replace(”![\][xX]([A-Fa-f0-9]{1,3})!”, “”,$input);
return$clean;
}
”” method=”post”
Name
“text” name=”name” id=”name” size=”20″ maxlength=”40″/>
注意,隱藏變量之一暴露了表名:users。還會看到一個值為 create 的 action 字段。只要有基本的 SQL 經(jīng)驗,就能夠看出這些命令可能控制著中間件中的一個 SQL 引擎。想搞大破壞的人只需改變表名或提供另一個選項,比如 delete。
圖 1 說明了 Tamper Data 能夠提供的破壞范圍。注意,Tamper Data 不但允許用戶訪問表單數(shù)據(jù)元素,還允許訪問 HTTP 頭和 cookie。
要防御這種工具,最簡單的方法是假設(shè)任何用戶都可能使用 Tamper Data(或類似的工具)。只提供系統(tǒng)處理表單所需的最少量的信息,并把表單提交給一些專用的邏輯。例如,注冊表單應(yīng)該只提交給注冊邏輯。
如果已經(jīng)建立了一個通用表單處理函數(shù),有許多頁面都使用這個通用邏輯,那該怎么辦?如果使用隱藏變量來控制流向,那該怎么辦?例如,可能在隱藏表單變量中指定寫哪個數(shù)據(jù)庫表或使用哪個文件存儲庫。有 4 種選擇:
不改變?nèi)魏螙|西,暗自祈禱系統(tǒng)上沒有任何惡意用戶。
重寫功能,使用更安全的專用表單處理函數(shù),避免使用隱藏表單變量。
使用 md5() 或其他加密機制對隱藏表單變量中的表名或其他敏感信息進行加密。在 PHP 端不要忘記對它們進行解密。
通過使用縮寫或昵稱讓值的含義模糊,在 PHP 表單處理函數(shù)中再對這些值進行轉(zhuǎn)換。例如,如果要引用 users 表,可以用 u 或任意字符串(比如 u8y90×0jkL)來引用它。
后兩個選項并不完美,但是與讓用戶輕松地猜出中間件邏輯或數(shù)據(jù)模型相比,它們要好得多了。
現(xiàn)在還剩下什么問題呢?遠程表單提交。
遠程表單提交
Web 的好處是可以分享信息和服務(wù)。壞處也是可以分享信息和服務(wù),因為有些人做事毫無顧忌。
以表單為例。任何人都能夠訪問一個 Web 站點,并使用瀏覽器上的 File > Save As 建立表單的本地副本。然后,他可以修改 action 參數(shù)來指向一個完全限定的 URL(不指向 formHandler.php,而是指向http://www.yoursite.com/formHandler.php,因為表單在這個站點上),做他希望的任何修改,點擊 Submit,服務(wù)器會把這個表單數(shù)據(jù)作為合法通信流接收。
首先可能考慮檢查 $_SERVER['HTTP_REFERER'],從而判斷請求是否來自自己的服務(wù)器,這種方法可以擋住大多數(shù)惡意用戶,但是擋不住最高明的黑客。這些人足夠聰明,能夠篡改頭部中的引用者信息,使表單的遠程副本看起來像是從您的服務(wù)器提交的。
處理遠程表單提交更好的方式是,根據(jù)一個惟一的字符串或時間戳生成一個令牌,并將這個令牌放在會話變量和表單中。提交表單之后,檢查兩個令牌是否匹配。如果不匹配,就知道有人試圖從表單的遠程副本發(fā)送數(shù)據(jù)。
要創(chuàng)建隨機的令牌,可以使用 PHP 內(nèi)置的 md5()、uniqid() 和 rand() 函數(shù),如下所示:
清單 18. 防御遠程表單提交
session_start();
if?($_POST['submit'] == “go”){
//check token
if?($_POST['token'] ==$_SESSION['token']){
//strip_tags
$name?=strip_tags($_POST['name']);
$name?=substr($name,0,40);
//clean out any potential hexadecimal characters
$name?= cleanHex($name);
//continue processing….
}else{
//stop all processing! remote form posting attempt!
}
}
$token?= md5(uniqid(rand(), true));
$_SESSION['token']=$token;
function?cleanHex($input){
$clean?= preg_replace(”![\][xX]([A-Fa-f0-9]{1,3})!”, “”,$input);
return$clean;
}
” method=”post”
Name
這種技術(shù)是有效的,這是因為在 PHP 中會話數(shù)據(jù)無法在服務(wù)器之間遷移。即使有人獲得了您的 PHP 源代碼,將它轉(zhuǎn)移到自己的服務(wù)器上,并向您的服務(wù)器提交信息,您的服務(wù)器接收的也只是空的或畸形的會話令牌和原來提供的表單令牌。它們不匹配,遠程表單提交就失敗了。
結(jié)束語
本教程討論了許多問題:
使用 mysql_real_escape_string() 防止 SQL 注入問題。
使用正則表達式和 strlen() 來確保 GET 數(shù)據(jù)未被篡改。
使用正則表達式和 strlen() 來確保用戶提交的數(shù)據(jù)不會使內(nèi)存緩沖區(qū)溢出。
使用 strip_tags() 和 htmlspecialchars() 防止用戶提交可能有害的 HTML 標記。
避免系統(tǒng)被 Tamper Data 這樣的工具突破。
使用惟一的令牌防止用戶向服務(wù)器遠程提交表單。
本教程沒有涉及更高級的主題,比如文件注入、HTTP 頭欺騙和其他漏洞。但是,您學(xué)到的知識可以幫助您馬上增加足夠的安全性,使當前項目更安全。