xpath簡介
1、xpath使用路徑表達式在xml和html中進行導航
2、xpath包含標準函數庫
3、xpath是一個w3c的標準
xpath語法
表達式 | 說明 |
---|---|
article | 選取所有article元素的所有子節點 |
/article | 選取根元素article |
article/a | 選取所有屬于article的子元素的a元素 |
//div | 選取所有div子元素(不論出現在文檔任何地方) |
article//div | 選取所有屬于article元素的后代的div元素,不管它出現在article之下的任何位置 |
//@class | 選取所有名為class的屬性 |
/div/* | 選取屬于div元素的所有子節點 |
//* | 選取所有元素 |
//div[@*] | 選取所有帶屬性的title元素 |
/div/a | //div/p | 選取所有div元素的a和p元素 |
//span | //ul | 選取文檔中的span和ul元素 |
article/div/p | //span | 選取所有屬于article元素的div元素的p元素以及文檔中的所有的span元素 |
xpath語法-謂語
表達式 | 說明 |
---|---|
/article/div[1] | 選取屬于article子元素的第一個div元素 |
/article/div[last()] | 選取屬于article子元素的最后一個div元素 |
/article/div[last()-1] | 選取屬于article子元素的倒數第二個div元素 |
//div[@lang] | 選取所有擁有lang屬性的div元素 |
//div[@lang='eng'] | 選取所有lang屬性為eng的div元素 |