- 以喜馬拉雅節目分類為入口,分析網站結構
首先爬取喜馬拉雅的所有分類的鏈接和類別名
左側分類列表.png
- 獲取每個分類的頁面后獲取每個分類下面的所有節目的的相關內容
每個類別下面的所有節目.png
每個類別的節目都是用分頁形式來展示,所有構建頁碼,通過獲取每個分類下最多分多少頁,來構建每個分頁面的的url鏈接,再通過鏈接地址獲取相應分頁的頁面
分頁頁面url示例.png
- 獲取每個節目中的信息,例如音頻id
節目頁面.png
一個節目中的每期音頻的id.png
對比.png
未完。。。