Web Scraping com InfoMoney

Este projeto faz parte da disciplina de coleta e tratamento de dados do curso de Análise de Dados e Inteligência Artificial da UFMA. O objetivo é realizar a raspagem de dados, tratamento, normalização e transformação dos dados utilizando Python.

🚀 Objetivo do Projeto

O projeto visa:

Raspar dados públicos do site InfoMoney, com foco nos dados de ações.
Tratar os dados coletados (valores faltantes, ruídos e outliers).
Normalizar e transformar os dados para melhor compreensão.
Garantir que a raspagem respeite os Termos de Uso e o arquivo robots.txt do site.

🔍 Verificação Legal

Política de privacidade

Com não ha termos de uso e somente as política de privacidade do site e não foi itentidicado nenhuma proibição do uso de Web Scraping.

Robots.txt

O arquivo robots.txt do InfoMoney, disponível aqui, não bloqueia o acesso às páginas públicas. Assim, a raspagem para fins acadêmicos está em conformidade.

📋 Pré-requisitos

Para executar o projeto, você precisa ter:

Python 3.13.1 ou superior.
Foram usadas as libs requests, beautifulsoup4, pandas, numpy, matplotlib, selenium, streamlit e plotly.

Instale os pacotes necessários com o comando:

pip install -r requirements.txt

🔧 Execução

1. Configuração

Clone este repositório e navegue até a pasta do projeto:

[git clone https://github.com/AbimaelAndrade/webscraping-infomoney.git](https://github.com/AbimaelAndrade/webscraping-infomoney.git)
cd webscraping-infomoney

2. Rodar o projeto

Execute o script realizar o scraping da página e mostrar os dados no dashboad.

streamlit run app.py

📖 Documentação

Fontes de Dados

Os dados foram coletados da seção pública de Altas e Baixas das Ações da Bolsa do InfoMoney, acessível aqui.

Métodos de Tratamento

Valores faltantes: preenchidos com a média ou valores padrão.
Outliers: identificados e removidos com base no método IQR.

🛠️ Contribuindo

Contribuições são bem-vindas! Para contribuir:

Faça um fork deste repositório.
Crie uma branch: git checkout -b sua-branch.
Envie suas alterações: git push origin sua-branch.
Abra um pull request.

📝 Licença

Este projeto é destinado apenas para fins acadêmicos e segue os Termos de Uso do InfoMoney.

Importante: O uso dos dados deve respeitar as políticas de privacidade e direitos autorais do site.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
src		src
.gitignore		.gitignore
.tool-versions		.tool-versions
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Web Scraping com InfoMoney

🚀 Objetivo do Projeto

🔍 Verificação Legal

Política de privacidade

Robots.txt

📋 Pré-requisitos

🔧 Execução

1. Configuração

2. Rodar o projeto

📖 Documentação

Fontes de Dados

Métodos de Tratamento

🛠️ Contribuindo

📝 Licença

About

Releases

Packages

Languages

AbimaelAndrade/webscraping-infomoney

Folders and files

Latest commit

History

Repository files navigation

Web Scraping com InfoMoney

🚀 Objetivo do Projeto

🔍 Verificação Legal

Política de privacidade

Robots.txt

📋 Pré-requisitos

🔧 Execução

1. Configuração

2. Rodar o projeto

📖 Documentação

Fontes de Dados

Métodos de Tratamento

🛠️ Contribuindo

📝 Licença

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages