為了更好地理解如何利用數(shù)據(jù)抓取功能,讓我們創(chuàng)建一個(gè)從 Amazon 提取一些特定信息的自動(dòng)化程序。
注意:建議您在 InternetExplorer 11 及以上、MozillaFirefox 50 或更高版本或最新版本的 Google Chrome 上運(yùn)行 Web 自動(dòng)化。
假設(shè)您是一家體育用品供應(yīng)商,您有興趣在網(wǎng)上了解排球的最新價(jià)格。您可以這樣做:
1. 打開 IE 瀏覽器,導(dǎo)航到?www.amazon.com 。
2.在搜索框中,鍵入volleyball ball?并按?Enter 將結(jié)果顯示在網(wǎng)頁中。
3.在 Studio 中,在?Design?選項(xiàng)卡上的?Wizards?按鈕組,單擊?Data Scraping,將顯示?Extract Wizard?。
Extract Wizard
4.在向?qū)е螅x擇網(wǎng)頁中列表的第一項(xiàng)和最后一項(xiàng)。顯示?Configure Columns?向?qū)Р襟E。
操作提示:UiPath 通過網(wǎng)頁列表中的第一項(xiàng)和最后一項(xiàng)推測整個(gè)列表,然后讀取列表中的數(shù)據(jù)。這一步操作至關(guān)重要,如果選擇的元素不對(duì)就會(huì)導(dǎo)致無法識(shí)別網(wǎng)頁中的列表。
5.選中?Extract URL?復(fù)選框。(這意味中將會(huì)在數(shù)據(jù)中導(dǎo)出 Items 帶有的超鏈接)
6.更改列標(biāo)題的名稱。
7.單擊?Next,將顯示數(shù)據(jù)的預(yù)覽,您選擇的字段將在 Web 瀏覽器中突出顯示。
8. 點(diǎn)擊?Extract Correlated Data?按鈕,再次顯示?Extract Wizard?窗口
9. 在向?qū)е笤俅沃赋鲰?xiàng)目的價(jià)格。您將進(jìn)入?Configure Columns?步驟
10.更改新列的名稱,然后單擊?Next, 顯示數(shù)據(jù)預(yù)覽
數(shù)據(jù)預(yù)覽
11. (可選)通過拖動(dòng)列的位置來改變列的順序。
12. 單擊?Finish,將顯示?Indicate Next Link?窗口,提示您在跨越多個(gè)頁面時(shí)指示?Next?按鈕。
提示:運(yùn)行時(shí),UiPath 將會(huì)幫你自動(dòng)點(diǎn)擊該按鈕,就好像你手工翻看下一頁數(shù)據(jù)一樣。直到獲取的數(shù)據(jù)達(dá)到 Maximun number of results 設(shè)定的數(shù)值為止(這里設(shè)定的是 100,即獲取 100 條記錄)
13. 單擊?Yes?并在?amazon?中選擇?Next Page?按鈕。該項(xiàng)目保存并顯示在?Designer?面板中。注意,DataTable 變量 ExtractDataTable?已經(jīng)自動(dòng)生成。
14. 拖一個(gè)?Excel Application Scope ?活動(dòng)到?Data Scraping?容器中。
注意:使用?Manage Packager?安裝了 UiPath.Excel.Activities??才可以訪問Excel 相關(guān)的活動(dòng),否則你是無法在面板中找到?Excel Application Scope 的。
?UiPath.Excel.Activities?
15. 在?Properties?面板的?WorkbookPath?字段中,鍵入要將數(shù)據(jù)寫入的現(xiàn)有?Excel?文件的文件路徑。
16.在?Variables?面板中,將自動(dòng)生成的數(shù)據(jù)表變量的范圍更改為?Sequence,使?ExtractDataTable 可以被外部的活動(dòng)訪問。
17. 拖拽一個(gè)?Write Range?活動(dòng)到?Excel Application Scope?內(nèi)部。
18.在Properties?面板中的?DataTable?字段添加變量名?ExtractDataTable?。項(xiàng)目最終如下圖所示:
項(xiàng)目最終效果
19. 點(diǎn)擊 F5 運(yùn)行
20. 打開在步驟 15?設(shè)定的 Excel 文件。注意,表格中正確填充了來自網(wǎng)頁的數(shù)據(jù)。
項(xiàng)目運(yùn)行結(jié)果
注:本文改編自 UiPath 文檔,筆者在原文檔的基礎(chǔ)上添加了更加詳細(xì)的說明和注意要點(diǎn)。
<本節(jié)教程完>
更多 UiPath 相關(guān)的資訊,請(qǐng)關(guān)注本公眾號(hào):UiPath 教程
權(quán)所有,如需轉(zhuǎn)載,請(qǐng)先聯(lián)系。
轉(zhuǎn)發(fā)不屬于轉(zhuǎn)載行為,歡迎你轉(zhuǎn)發(fā)到朋友圈、微信群,分享給微信朋友。