Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

ATV projeto GUIADO #15

Open
wants to merge 1 commit into
base: main
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
69 changes: 32 additions & 37 deletions exercicios/para-casa/README.md
Original file line number Diff line number Diff line change
@@ -1,37 +1,32 @@
# Exercício de Casa 🏠

## Projeto II

Explicação do exercício:
- Use o dataset proposto em aula ou busque um de sua preferência no [Kaggle](https://www.kaggle.com/).<br>
- Faça uma introdução explicando os dados e por que você escolheu o dataset.<br>
- Fale sobre o motivo de escolha dos dados: pq esses dados me chamaram a atenção ao ponto de achar que teríamos bons insights? O que eu vi de relevante nesses dados?
- Faça a instalação das bibliotecas necessárias para tratamento de dados, sendo necessário usar pandas e numpy.<br>
- Utilize a biblioteca Matplotlib ou Seaborn para construir novos gráficos.<br>
- Crie visualizações de gráficos com pandas, sendo no mínimo 4 gráficos.<br>
- Faça consultas em sql.<br>
- Utilize a biblioteca Matplotlib ou Seaborn para construir novos gráficos.<br>
- Faça um teste de hipótese.<br>

Arquivos que devem ser submetidos:

- arquivo.csv (ou similar: json, exe, etc) utilizado
- arquivo .db com entradas de interesse
- arquivo .ipynb com relatório contendo gráficos e insights sobre dados utilizados.
- código de criação e edição em sql (.py ou .ipynb)
- readme.md com todas a documentação das analises.

## Extra

Crie uma função que, a partir do dataset escolhido, crie um DataFrame, faça o tratamento dos dados e, por fim, exiba uma visualização gráfica.
Crie duas amostras e faça consultas com elas usando a operação merge.

Terminou o exercício? Dá uma olhada nessa checklist e confere se tá tudo certinho, combinado?!

- [ ] Fiz o fork do repositório.
- [ ] Clonei o fork na minha máquina (`git clone url-do-meu-fork`).
- [ ] Resolvi o exercício.
- [ ] Adicionei as mudanças. (`git add .` para adicionar todos os arquivos, ou `git add nome_do_arquivo` para adicionar um arquivo específico)
- [ ] Commitei a cada mudança significativa ou na finalização do exercício (`git commit -m "Mensagem do commit"`)
- [ ] Pushei os commits na minha branch (`git push origin nome-da-branch`)
- [ ] Criei um Pull Request seguindo as orientaçoes que estao nesse [documento](https://github.com/mflilian/repo-example/blob/main/exercicios/para-casa/instrucoes-pull-request.md).
# Social Media Sentiments Analysis Dataset

## Overview

Este dataset contém informações relacionadas à análise de sentimentos em posts de mídias sociais. Ele foi coletado e preparado para ajudar pesquisadores e desenvolvedores a criar e testar modelos de aprendizado de máquina que analisam sentimentos de texto, categorizando-os como positivos, negativos ou neutros.

## Conteúdo do Dataset

O dataset é composto por diversas colunas, cada uma representando uma característica específica dos posts de mídias sociais. Abaixo está a descrição detalhada de cada coluna:

- **Post ID**: Um identificador único para cada post.

- **Text**: O conteúdo textual do post.

- Sentiment

: O sentimento associado ao post, categorizado como:

- `Positive`: Postagem com conotação positiva.
- `Negative`: Postagem com conotação negativa.
- `Neutral`: Postagem com conotação neutra.

- **Date**: A data em que o post foi publicado.

- **Platform**: A plataforma de mídia social onde o post foi encontrado (ex: Twitter, Facebook, Instagram).

- **Likes**: O número de curtidas que o post recebeu.

- **Shares**: O número de vezes que o post foi compartilhado.

- **Comments**: O número de comentários que o post recebeu.

Loading