1、id、name、class name、tag name、link text、partial link text、xpath、css selector在 Python 語言中對應的定位方法如下:
find_element_by_id()
find_element_by_name()
find_element_by_class_name()
find_element_by_tag_name()
find_element_by_link_text()
find_element_by_partial_link_text()
find_element_by_xpath()
find_element_by_css_selector()
from selenium import webdriver
import os
import time
path = os.getcwd()
path = 'file://' + path.split('test_case')[0] + 'demo_html' + os.path.sep + 'test.html'
test_html = path.decode('gbk').encode('utf-8')
baidu_url = 'http://www.baidu.com'
dr = webdriver.Firefox()
dr.implicitly_wait(30)
dr.get(baidu_url)
百度搜索框的html
1.根據id屬性定位, id="kw"
dr.find_element_by_id('kw').clear()
dr.find_element_by_id('kw').send_keys('python')
2.根據name屬性定位, name="wd"
dr.find_element_by_name('wd').clear()
dr.find_element_by_name('wd').send_keys('python')
3.根據class屬性定位, class="s_ipt"
dr.find_element_by_class_name('s_ipt').clear()
dr.find_element_by_class_name('s_ipt').send_keys('python')
4.find_element_by_tag_name(), 搜索框的標簽是
TIPS:通常很少使用tagname定位,因為頁面上包含的相同標簽數太多時, 比如_testfile頁面,包含了3個input元素,使用find_element_by_tag_name('input')時,driver是無法區分出你到底要對哪個input操作,這里我們使用find_elements_by_tag_name('input')
注意這里find_elements_xxx的用法
dr.get(test_html)
eles = dr.find_elements_by_tag_name('input')
for e in eles:
if e.get_attribute('id') == 'username':
e.send_keys(u'這是用戶名輸入框')
5.find_element_by_link_text() 加 u 的作用是把中文字符串轉換成unicode 編碼
dr.get(baidu_url)
dr.find_element_by_link_text(u'使用百度前必讀').click()
6.find_element_by_partial_link_text(), partial link text是對link text的補充。
只要取文本鏈接中的一部分即可,下面2行代碼定位到的是同一個元素dr.back()
返回上一頁dr.find_element_by_partial_link_text(u'使用百度').click()
dr.back()
dr.find_element_by_partial_link_text(u'百度前必讀').click()
7.find_element_by_xpath()dr.back()
7.1 使用絕對路徑xpath定位
dr.find_element_by_xpath("/html/body/div[3]/div[1]/div/div[1]/div/form/span[1]/input").send_keys('0')
7.2 使用相對路徑的xpath定位
關于xpath的技巧,建議親們在后期深入學習時重點研究下。通過常規方法不能定位元素時,使用xpath/css肯定是可行的。
dr.find_element_by_xpath("http://input[@id='kw']").send_keys('1')
dr.find_element_by_xpath("http://input[@name='wd']").send_keys('2')
dr.find_element_by_xpath("http://input[@class='s_ipt']").send_keys('3')
dr.find_element_by_xpath("http://[@class='s_ipt']").send_keys('4')
8. find_element_by_css_selector()
dr.find_element_by_css_selector(".s_ipt").send_keys('5')
.號后面跟的是class屬性, class="s_ipt"dr.find_element_by_css_selector("#kw").send_keys('6')
號后面跟的是id屬性, id="kw"
這里停留30秒,方便大家看下效果,百度輸入框里輸入的是不是0123456time.sleep(30)
print u"搜索按鈕的文字是>>>",
dr.find_element_by_id('su').textdr.get(baidu_url)news_link = dr.find_element_by_link_text(u"新聞")print u"新聞鏈接是>>>", news_link.get_attribute("href")print u"新聞鏈接的name屬性是>>>", news_link.get_attribute("name")
9.退出,有2種方法dr.quit()
關閉【所有窗口】,并退出相關的驅動程序,# dr.close()
關閉【當前窗口】,注意兩者的區別
find_element_by_xxxx 和find_elements_by_xxx的區別:
find_element_by_xxxx:定位一個元素
find_elements_by_xxx:定位一組元素,得到的是一個list,要從list取值后再對每個元素做具體操作