-
Sujet
-
quand je lance mon script le contenue est vide et je passe robot.txt en respectant ces normes du coup je comprends pas pourquoi mon contenu est de mon ouput est vide quand je crawl j’essaie d’apprendre scrapy si vous pourriez m’aider j’en serai reconnaissant
import scrapy from scrapy.spiders import Rule, CrawlSpider from scrapy.linkextractors import LinkExtractor from scrapy.selector import Selector from scrapy.http import Request from scrapy.loader import ItemLoader import pandas as pd class SpiderPartySpider(scrapy.Spider): name = "Spider_party" allowed_domains = ["www.lagraviere.ch"] start_urls = ["https://lagraviere.ch"] DOWNLOAD_DELAY = 10 def parse(self, response): # Trouver et suivre les liens vers les pages d'événements for href in response.css('a.event-link::attr(href)'): yield response.follow(href, self.parse_event) def parse_event(self, response): # Extraire les informations de chaque page d'événement yield { 'title': response.css('h1::text').get(), 'date_time': response.css('div.event-date-time::text').get(), 'type': response.css('div.event-type::text').get(), 'description': response.css('p.description::text').get(), 'artists': response.css('div.artists p::text').getall(), 'practical_info': response.css('div.practical-info p::text').getall(), }
——————–
niwayume – Envoyé depuis le Discord : Culte du code
Vous lisez 14 fils de discussion
Vous lisez 14 fils de discussion
- Vous devez être connecté pour répondre à ce sujet.