W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗值獎勵
BeautifulSoup 和 lxml 是用于分析HTML和XML的庫。Scrapy是一個應(yīng)用程序框架,用于編寫爬行網(wǎng)站并從中提取數(shù)據(jù)的網(wǎng)絡(luò)蜘蛛。
Scrapy提供了一種用于提取數(shù)據(jù)的內(nèi)置機制(稱為:ref:selectors <topics-selectors>)但你可以輕松使用`BeautifulSoup`_(或`lxml`_),如果你覺得使用它們更舒服。 畢竟,他們只是解析可以從任何Python代碼導(dǎo)入和使用的庫。
換句話說,將`BeautifulSoup`_(或`lxml`_)與Scrapy進(jìn)行比較就像將`jinja2`_與`Django`_進(jìn)行比較。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: