Scrapy
Scrapy | |
---|---|
Desenvolvedor | Zyte (antiga Scrapinghub) |
Sistema operacional | Windows, macOS, Linux |
Gênero(s) | Web crawler |
Licença | BSD License [1] |
Scrapy (/ˈskreɪpaɪ/ SKRAY-peye) é um framework de web-crawling gratuito e código aberto desenvolvido em Python. Originalmente idealizado para web scraping, também pode ser utilizado para extração de dados usando APIs ou como web crawler de forma mais abrangente.[2] Atualmente é mantido pela Zyte (antiga Scrapinghub Ltd.) uma empresa de desenvolvimento e serviços relacionados a web-scraping.
A arquitetura do Scrapy é construída em torno de "spiders", que são crawlers autônomos que recebem um conjunto de instruções. Seguindo o exemplo de outros frameworks DRY (don't repeat yourself), como Django,[3] tornando mais fácil o desenvolvimento e evolução de projetos de larga escala, que utilizam o crawling, pois permite a reutilização de código. Scrapy também fornece um shell para web-crawling, que pode ser utilizado pelos desenvolvedores para testar suas suposições sobre o comportamento de um site.[4][5][6]
Algumas empresas, produtos e projetos bem conhecidos que usam o Scrapy são: Querido Diário,[7] Lyst,[8][9] Parse.ly,[10] Sayone Technologies,[11] Sciences Po Medialab,[12] Data.gov.uk’s World Government Data site.[13][1]
História
Scrapy nasceu na Mydeco, empresa de agregação da web e comércio eletrônico sediada em Londres, onde foi desenvolvido e mantido por empregados da Mydeco e Insophia (uma empresa de consultoria web sediada em Montevideu, Uruguay). A primeira versão pública foi disponibilizada em Agosto de 2008 sob uma Licença BSD, e a sua versão 1.0 lançada em Junho de 2015.[14] Em 2011, Zyte (antiga Scrapinghub) tornou-se oficialmente responsável pelas manutenções do projeto.[15][16]
Referências
- ↑ «Release notes — Scrapy documentation». doc.scrapy.org (em inglês). Consultado em 18 de novembro de 2020
- ↑ Scrapy at a glance.
- ↑ «Frequently Asked Questions». Consultado em 20 de janeiro de 2020
- ↑ «Scrapy shell». Consultado em 20 de janeiro de 2020
- ↑ «Scrapy English Wikipedia». Consultado em 20 de janeiro de 2020
- ↑ «Scrapy Spanish Wikipedia». Consultado em 20 de janeiro de 2020
- ↑ «Querido Diario». queridodiario.ok.org.br. Consultado em 6 de setembro de 2021
- ↑ Bell, Eddie; Heusser, Jonathan. «Scalable Scraping Using Machine Learning». Consultado em 28 de julho de 2015
- ↑ Scrapy | Companies using Scrapy
- ↑ Montalenti, Andrew. «Web Crawling & Metadata Extraction in Python»
- ↑ «Scrapy Companies». Scrapy website
- ↑ Hyphe v0.0.0: the first release of our new webcrawler is out!
- ↑ Ben Firshman [@bfirsh] (21 de janeiro de 2010). «World Govt Data site uses Django, Solr, Haystack, Scrapy and other exciting buzzwords bit.ly/5jU3La #opendata #datastore» (Tweet) – via Twitter
- ↑ Medina, Julia (19 de junho de 2015). «Scrapy 1.0 official release out!». scrapy-users (Lista de grupo de correio)
- ↑ Pablo Hoffman (2013). List of the primary authors & contributors. [S.l.: s.n.] Consultado em 18 de novembro de 2013
- ↑ Interview Scraping Hub.
Sites externos
- Site oficial