Scrapy 2.5 documentation?
Scrapy 是一種快速的高級 web crawling 和 web scraping 框架,用于對網站進行爬網并從其頁面提取結構化數據。它可以用于廣泛的用途,從數據挖掘到監控和自動化測試。
得到幫助?
有麻煩嗎?我們想幫忙!
第一步?
- Scrapy一目了然
了解 Scrapy 是什么以及它如何幫助你。
- 安裝指南
在你的電腦上安裝Scrapy。
- Scrapy 教程
寫你的第一個 Scrapy 項目。
- 實例
通過玩預先制作的零碎項目了解更多信息。
基本概念?
內置服務?
解決具體問題?
- 常見問題
獲取最常見問題的答案。
- 調試spiders
學習如何調試你的廢蜘蛛的常見問題。
- 蜘蛛合約
學習如何使用聯系來測試你的蜘蛛。
- 常用做法
熟悉一些 Scrapy 慣例。
- 寬爬行
調整Scrapy以并行地爬行許多域。
- 使用瀏覽器的開發人員工具進行抓取
了解如何使用瀏覽器的開發人員工具。
- 選擇動態加載的內容
讀取動態加載的網頁數據。
- 調試內存泄漏
學習如何發現并消除爬行器中的內存泄漏。
- 下載和處理文件和圖像
下載與抓取項目相關的文件和/或圖像。
- 部署蜘蛛
部署 Scrapy 蜘蛛并在遠程服務器中運行它們。
- AutoThrottle 擴展
根據負載動態調整爬行速率。
- 標桿管理
檢查Scrapy在硬件上的性能。
- 作業:暫停和恢復爬行
學習如何暫停和恢復大型蜘蛛的爬行。
- 協同程序
使用 coroutine syntax .
- asyncio
擴展Scrapy?
其余所有?
- 發行說明
看看最近的Scrapy版本有什么變化。
- 為 Scrapy 貢獻
學習如何為 Scrapy 項目做出貢獻。
- 版本控制和API穩定性
了解Scrapy版本和API穩定性。