Web Crawling e Scraping com Scrapy e Scrapy Cloud

Lidiane Taquehara

Web Crawling e Scraping com Scrapy e Scrapy Cloud

>whoami

Lidiane Taquehara

Web Scraping

Web Crawling

Web Crawling e Scraping no Love Mondays

Scrapy

Exemplo de uma Spider

Link para o exemplo no GitHub

O código

name = 'most_popular_movies'

O nome que identifica a spider

start_urls = ['https://www.imdb.com/chart/moviemeter']

O ponto de partida da spider

parse()

Método que manipula a resposta recebida por cada requisição feita.

Execução da spider

Gerenciamento dos dados na nuvem

Scrapinghub

Scrapy Cloud

Tecnologias

Dashboard

Utilização dos dados

Possibilidades:

Scrapy Cloud API

python-scrapinghub

Para saber mais:

Muito obrigada!!

Apresentação disponível em:

https://scrapy-slides.netlify.com