1.Selenium2 的原理
第一篇分享簡單介紹了基于Python開發的Selenium2的環境配置,這篇主要講一下基本用法。首先講一下Selenium2的基本原理?;旧现懒诉@個東西是怎么回事,我們就知道怎么去用它了。
與Selenium和Selenium RC不同,Selenium2將瀏覽器原生的API封裝成WebDriver API,可以直接操作瀏覽器頁面里的元素,甚至操作瀏覽器本身(截屏,窗口大小,啟動,關閉,安裝插件,配置證書之類的),所以就像真正的用戶在操作一樣。其實剛開始我們不需要懂Webdriver具體是怎么回事,后面會講一下Webdriver的API,而現在我們只是要求會用,所以知其然就夠了。下面這張圖可以簡單清晰地講明Selenium2的邏輯。
綜上,如果想用Selenium2創造我們的腳本的話,我們需要做一下幾件事:
- 定位元素
- 操作元素
- 處理瀏覽器事件(驗證碼,警告框等)
- 處理系統時間(上傳文件,下載文件等)
本篇就先講如何定位元素。
2.Web元素定位
2.1.Element概念
如果對前端比較了解的話,可以簡單將Web界面理解為一個body,而table,element組成了這個body。拿百度主頁為例,打開百度主頁,點擊輸入框,右鍵-》inspect,會看到下面的前端代碼:
可以看到,搜索框擁有一個標識:id="kw",至于為什么叫這個,估計百度的開發覺得很cool。那么就可以說,搜索框就是一個element。
2.2定位元素
以搜索框為例,Selenium可以模仿用戶的操作,就可以支持在搜索框中輸入和刪除任意文本。想要操作一個element,就要先定位這個element。可以看到,僅僅搜索框這個element就有id,class,name等多種屬性,我們該怎么去定位該元素呢?Selenium又支持幾種定位的方法呢?簡單總結如下:
- By id
- By name
- By class name
- By tag name
- By link
- By partial link
- By XPath
2.1通過id定位
以Python為例(以后默認為Python):
find_element_by_id('kw')
find_element_by_id('su')
2.2通過name定位
find_element_by_name('wd')
像搜索按鈕就沒用name屬性,那么我們就不能通過name屬性來定位它。如果碰到name屬性定位到的元素不唯一,不要忘記改為
find_elements_by_id('name')
不然程序肯定會報錯,一般id都是唯一的。
2.3通過class name定位
以百度搜索框和搜索按鈕為例,下同:
find_element_by_class_name('s_ipt')
find_element_by_class_name('bg s_btn')
了解前端的親都會知道,class這種元素一般都不唯一,這時候別忘了
lista=find_element_by_class_name('classname')
這時候所有class name="classname"的元素都會被捕捉到,并存儲在數組lista中。
2.4通過tag name定位
tag是元素的一個基本屬性,比如需要輸入的元素為input:
find_elements_by_tag_name('input')
2.5通過link,partial link定位
以百度新聞鏈接為例
find_element_by_link_text('新聞')
partial link是對link方法的一個補充,假設這個鏈接有一個很長的名字,"我是一個很長很長很長的鏈接“:
find_element_by_partial_link_text('很長的')
或者
find_element_by_partial_link_text('鏈接')
2.6通過XPath定位
通過XPath定位是最簡單的也是最方便的一種方法,每一個元素在Web頁面上有自己的位置,在代碼里也有自己的位置。而XPath就表示了它在代碼里的絕對路徑,也就是說,通過一個絕對地址,肯定找得到這個元素。
一開始自己做腳本的時候傻傻的分析元素的XPath,直到知道了Firefox的超級插件,firebug。下載地址為 FireBug。
仍然以百度搜索框為例
右鍵通過FireBug查看元素,找到搜索框對應的element,右鍵就可以復制其XPath,定位的代碼為
find_element_by_xpath('/html/body/div[2]/div[1]/div/div[1]/div/form/span[1]/input')
XPath雖然是很簡單的方法,但是不能濫用。像百度首頁的代碼基本不會更新,自身也屬于靜態的網頁,element的絕對路徑基本不會變。如果碰到動態網頁或者需要靈活的定位元素,可以嘗試相對路徑,即元素屬性的組合
find_element_by_xpath("http://input[@id='kw']") //其中//表示在某個路徑下,一個tag name為input,id為kw的元素
層級與屬性結合
假設一個地址為"杭州市西湖區文二路西湖科技大廈",那么我們也可以這樣說"西湖區文二路391號",這就是層級與屬性結合
find_element_by_xpath("http://span[@class='bg s_ipt_wr']/input") //span[@class='bg s_ipt_wr']通過class定位到父
元素,/input表示父元素下面的子元素,這里如果父元素不是唯一可以定位的,可以上面尋求更高層級可以定位的元素
邏輯運算符
find_element_by_xpath("http://input[@id='kw' and @class='su']/span/input") //用and來連接屬性定位元素
2.7通過CSS定位
CSS是用來描述HTML和XML文檔表現的語言,可以通過CSS選擇器綁定頁面元素的屬性,語法為
find_element_by_css_selector("")
find_element_by_css_selector("")
常用的的選擇器有
".class"
"#id"
"*"
"element"
"element>element"
"element+element"
"[attribute=value]"
看起來比較抽象,確實一把情況下不怎么使用CSS定位,需要講的時候我們再舉例子,可以參考W3CSchool的例子。
2.8通過By定位元素
其實是WebDriver的另一種寫法,傳承于Selenium1?覺得沒啥用,筆者也沒有深究。
find_element(By.ID,"kw")
...
3.小結
其實定位元素的方法各種各樣,語法都很簡單,難的是活學活用。在具體的項目中,使用不同的定位方法最后取到的數據能夠簡單的調用才是最好的方法。這方面筆者也走了很多彎路,鑒于公司的產品是嚴格保密的,沒辦法用實際的例子來講述何時用合適的定位方法。在以后的博客中,盡量多多準備素材。
今天聽一個同事對測試看法個人十分贊同:測試的成長曲線不同于開發,前期的道路更為坎坷,需要更多經驗積累。測試腳本的編寫相比于開發更為簡單,不需要太難的算法,但是也需要對業務的了解和測試思想的融入。所以,萬里長征剛開始。老話,空談誤國,實干興邦,與君共勉。