RodrigoSiliunas/etl-pyems
O código armazenado nesse repositório é um ETL. O site alvo é um site onde são armazenados mais de dez mil poemas de autores diferentes, todos em português, os dados passam por um leve tratamento e são armazenados como documentos no MongoDB. Esse repositório ainda é utilizado por outro, que consome os dados extraidos e retorna eles através de uma RESTapi Flask.
No commits in the last 6 months.
Stars
2
Forks
1
Language
Python
License
MIT
Category
Last pushed
Jan 19, 2022
Commits (30d)
0
Get this data via API
curl "https://pt-edge.onrender.com/api/v1/quality/perception/RodrigoSiliunas/etl-pyems"
Open to everyone — 100 requests/day, no key needed. Get a free key for 1,000/day.
Higher-rated alternatives
seleniumbase/SeleniumBase
APIs for browser automation, testing, and bypassing bot-detection.
intoli/user-agents
A JavaScript library for generating random user agents with data that's updated daily.
apify/crawlee
Crawlee—A web scraping and browser automation library for Node.js to build reliable crawlers. In...
Kaliiiiiiiiii-Vinyzu/patchright
Undetected version of the Playwright testing and automation library.
Kaliiiiiiiiii-Vinyzu/patchright-python
Undetected Python version of the Playwright testing and automation library.