Algoritmo de raspagem de dados no site da transparencia de Joinville - SC.
Este projeto utiliza as especificações do Python 3 e possuí as seguintes dependencias:
Selenium |
BeautifulSoup |
Pandas |
Keras |
Numpy |
Scipy |
Tensorflow |
Scikit-Learn |
Mpldatacursor |
Matplotlib |
Realize a copia do repositório para seu computador:
$ git clone https://github.com/renanredel/DataScrapingJoinville.git
Caso queira realizar o o treinamento da IA de identificação de sexo, execute a função treinar.train()
disponível em mainscraping.py.
O dataset com os nomes para treinamento, se encontram em Dataset.
Escolha qual cargo será buscado utilizando a linha abaixo, também disponível em mainscraping.py.
driver.find_element_by_id("ds_cargo").send_keys("CARGO")
Por fim, execute a classe mainscraping.py.
- GUI
MIT License