camara94/crawlSpider

Scrapy nous donne accès à deux classes principales de spiders, le spiders générique que nous avons beaucoup utilisé auparavant dans d'autres vidéos et cette CrawlSpider qui fonctionne de manière légèrement différente. Nous pouvons lui donner un ensemble de règles et lui faire suivre les liens automatiquement, en passant ceux que nous voulons faire correspondre à notre fonction d'analyseur avec un callback. Cela rend incroyablement facile la suppression complète des données du site Web. Dans ce tuto, je vais vous expliquer comment utiliser le CrawlSpider, ce que font le Ruler et le LinkExtrator et comment les utiliser, ainsi qu'une démonstration de leur fonctionnement.

16
/ 100
Experimental

No commits in the last 6 months.

Stale 6m No Package No Dependents
Maintenance 0 / 25
Adoption 0 / 25
Maturity 16 / 25
Community 0 / 25

How are scores calculated?

Stars

Forks

Language

License

MIT

Category

scraper

Last pushed

Nov 03, 2021

Commits (30d)

0

Get this data via API

curl "https://pt-edge.onrender.com/api/v1/quality/perception/camara94/crawlSpider"

Open to everyone — 100 requests/day, no key needed. Get a free key for 1,000/day.