編者:amnesiac 首發:官方論壇之中文版
注:本文改寫自微軟知識庫文章,待找到源網址后補上。
注2:本文中代碼有誤,請參閱已修正的論壇版本。不過如果您對自己有信心或有豐富的腳本經驗,挑戰自己繼續往下看吧。從錯誤中學習常常效果更好,你信嗎?
Office 家族系列軟件功能強大,更強大的是通過相應的對象模型可以把這些軟件腳本化,唯一的問題可能是每個軟件都有自己專用對象模型。例如如果要操作 Word 或 Excel,您必須學習兩種對象模型,這樣并不是說學習它們很難,意思是例如知道如何添加數據到 Word 文檔并不能給您在添加數據到 Excel 文檔時帶來多少幫助。
所以在一些只需要執行基本操作的情況下,使用 ADO 操作 Excel 文檔可能是較好的選擇。比起 Excel 對象模型,使用 ADO 具有以下優點:
- ADO 對象模型簡單易學。
- ADO 且可用于 CSV、TSV、xls、mdb 等多種文件類型。
- ADO 中通過 SQL 查詢可以方便地進行過濾和聚合等。
- 使用 ADO 是在進程內執行,速度快(請參閱 COM 對象的進程內、外運行)。
- 無需安裝 Excel,這可節省了一筆不小的費用(基于國情,這點放最后)。
測試文件樣本
一般而言,除了需要通過腳本演示在 Excel 中進行的操作和使用 Excel 中專有的一些高級功能外,基本上 ADO 都可以滿足要求。下面將通過一個簡單的電子表格說明如何使用 ADO 訪問電子表格。(如果一定還要尋找其他適合使用 Excel 的原因,那么很可能是您對 Excel 對象模型很熟悉,而目前對 ADO 還不大了解,這樣看過本文后也許會給您帶來較大的收獲。)
下面是一個簡單的電子表格文件 C:\Scripts\Test.xls:

具體的內容結構:一個標簽為 Name,另一個為 Number。為了確保您能對 Excel 電子表格使用數據庫查詢,必須讓電子表格符合簡單的風格:讓第一行作為標題行,從第二行開始為數據,并且不要跳過任何行或列。同時為了讓代碼簡單些,在標題中不要包含空格,例如使用 SocialSecurityNumber 作為列標題代替 Social Security Number。
訪問樣本數據
現在我們看看使用 ADO 來訪問這樣電子表格數據的代碼:
adOpenStatic := 3
adLockOptimistic := 3
adCmdText := 0x0001
objConnection := ComObjCreate("ADODB.Connection")
objRecordSet := ComObjCreate("ADODB.Recordset")
objConnection.Open("Provider=Microsoft.Jet.OLEDB.4.0; Data Source=C:\Scripts\Test.xls; Extended Properties=""Excel 8.0;HDR=Yes;"";")
objRecordset.Open("Select * FROM [Sheet1$]", objConnection, adOpenStatic, adLockOptimistic, adCmdText)
while !objRecordset.EOF
{
MsgBox, % objRecordset.Fields.Item("Name") objRecordset.Fields.Item("Number")
objRecordset.MoveNext
}
運行代碼后結果像這樣:
A 1
B 1
C 2
D 2
E 1
F 1
代碼分析
開始部分定義了一些常量和兩個對象——ADODB.Connection 和 ADODB.Recordset,這兩個對象用來連接數據源并從中獲取數據。這幾乎是所有 ADO 腳本中的模板了,這里不會對這部分進行詳細的說明。
現在來看看接下來這行代碼,它實際上建立了到 Excel 電子表格的連接:
objConnection.Open("Provider=Microsoft.Jet.OLEDB.4.0; Data Source=C:\Scripts\Test.xls; Extended Properties=""Excel 8.0;HDR=Yes;"";")
其中 Data Source 部分指定了電子表格的文件路徑和名稱。如果文件名稱中包含空格呢?仍然直接寫就行了,例如 Data Source=C:\Scripts\My Spreadsheet.xls。
注意,您可能會把連接字符串中的 Excel 8.0 改為您電腦上安裝的 Excel 版本,但會執行錯誤,因為這里的 Excel 8.0 并非電腦上安裝的 Excel 程序的版本,而是指用來訪問 Excel 文檔提供者(Provider)的版本。
還有,其中的 HDR=Yes 表示電子表格含有標題行,如果沒有標題行則設置 HDR 為 No。
連接到數據源后,使用 SQL 查詢來獲取其中的數據。這是用來返回包含了電子表格中所有行的記錄集的代碼:
objRecordset.Open("Select * FROM [Sheet1$]", objConnection, adOpenStatic, adLockOptimistic, adCmdText)
這里只需要關心 SQL 查詢的參數,Select * FROM [Sheet1$] 是標準的 SQL 查詢,選擇數據庫(工作表)中的所有字段(列)。在查詢中指定了工作表的名稱,需要注意它的格式:工作表名稱后面附加了 $ 符且括在方括號中。
操作這里得到的記錄集和操作從 SQL Server 得到的記錄集沒多大區別,因此可以用下面這些代碼簡單地顯示記錄集中每個記錄中的 Name 和 Number 字段:
while !objRecordset.EOF
{
MsgBox, % objRecordset.Fields.Item("Name") objRecordset.Fields.Item("Number")
objRecordset.MoveNext
}
任務完成了,很漂亮。
進一步思考
您可能會產生這樣的疑問:不能使用 Excel 對象模型來獲取這樣的信息嗎?確實可以這么做。我承認,如果只是要顯示電子表格中的每行內容,使用 ADO 并沒有體現出多少好處(好處還是有的,或許您可以使用 Excel 對象模型實現相同的任務,并比較它們的代碼,不過這個不是決定性的好處)。
不過,設想一下如果我們只要顯示 Number 等于 2 的那些行呢?使用 Excel 腳本我們需要檢查每一行的 Number 是否等于 2,以決定是否顯示出來。這樣不難,但卻很麻煩,尤其當您需要檢查多個列的時候(例如您需要尋找在 Finance 部門且頭銜為 Administrative Assistant 的所有用戶)。比較起來,通過 ADO 我們可以不用檢查電子表格中的每行,唯一需要做的只是修改 SQL 查詢,即使用類似下面的查詢就可以獲取 Number 等于 2 的所有行:
objRecordset.Open("Select * FROM [Sheet1$] Where Number = 2", objConnection, adOpenStatic, adLockOptimistic, adCmdText)
這樣我們就能得到下面的結果:
C 2
D 2
從這里可以看出,在 ADO 使用 SQL 查詢進行過濾很方便,實際上除了過濾,還可以方便地進行排序、聚合等操作。
小結
本文中簡單介紹了使用 ADO 從 Excel 電子表格中讀取數據,主要說明了在一些情況下使用 ADO 訪問 Excel 電子表格比使用 Excel 更好的原因,實際上,使用 ADO 除了能從 Excel 中獲取數據外,還可以寫入數據。可以把 ADO 先看成一種通用數據訪問接口,詳細特性請參閱微軟的 ADO 手冊,簡單了解可參考 ADO 教程。
對于普通用戶而言,本文缺乏背景介紹學習起來有難度,但與其他技術類似,對于這些高級技術的學習不應局限在 AutoHotkey 自身幫助,本身也不屬于它的內容。需要自己從其他資料或語言中學習,例如 Windows API、COM、SQL、WMI,這些一般都是語言獨立的。