大家好~
你想第一時間獲取企業信息嗎?
歡迎使用我的Python代碼
Github地址
此項目可監控近千家中國企業的官方網站的新聞動態,如有更新,系統能在 5 分鐘之內通過郵件發送更新的標題和鏈接。 更新的信息流也可通過瀏覽器查看。監控的公司和站點可以添加刪除。
采用 celery 任務隊列,定期抓取網站 html, 使用 difflib 比對新舊頁面源碼,發現增加的部分,提取 url 和 text,過濾篩選,保存 MySQL 數據庫。 定期把更新的 url 和 text,通過郵件發送給訂閱者。
方法簡單粗暴 優點:實時性可以保障
歡迎fork, star。