Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Semana 17- Projeto final -sayonara #13

Open
wants to merge 4 commits into
base: main
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
2,613 changes: 2,613 additions & 0 deletions Df_Trasnplantes_Realizados_RNipynb.ipynb

Large diffs are not rendered by default.

1,464 changes: 1,464 additions & 0 deletions Doaçoes.ipynb

Large diffs are not rendered by default.

1,082 changes: 1,082 additions & 0 deletions ListadeEspera.ipynb

Large diffs are not rendered by default.

208 changes: 104 additions & 104 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,104 +1,104 @@
<h1 align="center">
<img src="assets/reprograma-fundos-claros.png" alt="logo reprograma" width="500">
</h1>

# Tema da Aula

Turma Online 34 | Python | Semanas 17 e 18 | 2024 | [Daniele Junior](https://travatech.com.br?router=danijr)

### Instruções
Antes de começar, vamos organizar nosso setup.
* Fork esse repositório
* Clone o fork na sua máquina (Para isso basta abrir o seu terminal e digitar `git clone url-do-seu-repositorio-forkado`)
* Entre na pasta do seu repositório (Para isso basta abrir o seu terminal e digitar `cd nome-do-seu-repositorio-forkado`)
* [Add outras instruções caso necessário]

### Resumo
O que veremos na aula de hoje?
* [Slide Semana 17](https://docs.google.com/presentation/d/1axo2Dlm0Hx35ahKdZW6s-UAdG61L41QXdete8ZcQV0w/edit?usp=sharing)
* Slide Semana 18

* [Escolhendo uma fonte de dados](#Escolhendoumafontededados)
* Análise exploratória
* Criando uma história com dados

## Conteúdo

### O que é um projeto de análise de dados?
Nesse ponto vocês já aprenderam que ter dados não é a mesma coisa que ter informação.
**Dados:** são elementos brutos e não processados, como números, palavras, ou símbolos que precisam ser interpretados para se tornarem úteis.
**Informação:** é o resultado do processamento, organização e interpretação dos dados, fornecendo significado e contexto para tomar decisões ou entender situações.
Assim, dados são a matéria-prima da informação, que é o produto final após análise e interpretação dos dados.

Por isso a importância de nós contarmos uma história estruturada a partir dos dados que conseguimos coletar. E é exatamente sobre isso, que se trata um projeto de análise de dados: **gerar informação útil a partir da construção de uma perspectiva contextualizada!**

Então aqui vão algumas perguntas gerais que devemos nos fazer ao iniciar um projeto como esse:

- **Conteúdo**
- O que eu quero informar?
- **Público**
- Para quem eu estou contanto essa história? Com quem vou compartilhar essa informação?
- **Transformação**
- Por que essa informação é relevante?

Ok, as perguntas são importantes,

MAS POR ONDE COMEÇAR?!

### Escolhendo uma fonte de dados

#### O caminho comum
Se você já fez algum tipo de pesquisa acadêmica (TCC, Iniciação Científica, etc) você certamente está familiarizado com esse processo, pois tudo começa com a escolha de um TEMA, seguindo para a definição do PROBLEMA, que em seguida é desdobrado em PERGUNTAS, que irão guiar a COLETA DE DADOS.

1. Delimitação do Tema
2. Definição do Problema
3. Desenvolvimento de Perguntas
4. Coleta de Dados

#### O caminho que iremos seguir
Porque esse projeto é um exercício e encontrar os dados ideais para responder às nossas perguntas pode se tornar um trabalho extremamente complexo...

Nós iremos fazer um caminho um pouco diferente e a partir de um tema de interesse, escolher uma base e então pensar quais perguntas podem ser respondidas a partir dela.

O QUE TAMBÉM É SUPER VÁLIDO! E PODE RENDER DESCOBERTAS INCRÍVEIS!

* **Escolha do tema**

No primeiro momento você deve escolher qual assunto gostaria de abordar. Pense em um tema atual, relevante e até onde você vai aprofundar a análise. Lembre-se, não adianta abraçar o mundo sozinho, você precisa focar e entregar o melhor resultado possível, então trabalhe na delimitação do Tema! Quais são os recortes possíveis dentro do universo escolhido?

#Dica: Dê prioridade para algo que você goste, se interesse, tenha afinidade ou conhecimento na área.

* **Escolha da Base de Dados**

[Algumas opções de Bases de Dados](#base-de-dados)

* **Definindo nossas perguntas**

O que eu quero tentar responder? VAMOS AO [BRAINSTORM](#material-da-aula)!

***

### Material da aula

* [Slides](https://docs.google.com/presentation/d/1axo2Dlm0Hx35ahKdZW6s-UAdG61L41QXdete8ZcQV0w/edit?usp=sharing)

### Links Úteis
- [Documentação Pandas](https://pandas.pydata.org/docs/user_guide/index.html#user-guide)
- [Introdução ao Pandas](https://medium.com/tech-grupozap/introdu%C3%A7%C3%A3o-a-biblioteca-pandas-89fa8ed4fa38)
- [Análise Exploratória de Dados I](https://escoladedados.org/tutoriais/analise-exploratoria-de-dados/)
- [Análise Exploratória de Dados II](https://www.alura.com.br/artigos/analise-exploratoria)
- [Storytelling com Dados](https://medium.com/resumos-resenhas/storytelling-com-dados-resumo-fd63ebe4f704)
- [Markdown Cheastsheet](https://www.ibm.com/docs/en/watson-studio-local/1.2.3?topic=notebooks-markdown-jupyter-cheatsheet)

#### Base de Dados
- [Kaggle](https://www.kaggle.com/datasets)
- [IBGE](https://ces.ibge.gov.br/base-de-dados/links-base-de-dados.html)
- [Brasil.io](https://brasil.io/datasets/)
- [Gov.br](https://dados.gov.br/dados/conjuntos-dados)
- [Nosso Mundo em Dados](https://ourworldindata.org/charts)

<p align="center">
Desenvolvido com :purple_heart:
</p>


<h1 align="center">
<img src="assets/reprograma-fundos-claros.png" alt="logo reprograma" width="500">
</h1>
# Tema da Aula
Turma Online 34 | Python | Semanas 17 e 18 | 2024 | [Daniele Junior](https://travatech.com.br?router=danijr)
### Instruções
Antes de começar, vamos organizar nosso setup.
* Fork esse repositório
* Clone o fork na sua máquina (Para isso basta abrir o seu terminal e digitar `git clone url-do-seu-repositorio-forkado`)
* Entre na pasta do seu repositório (Para isso basta abrir o seu terminal e digitar `cd nome-do-seu-repositorio-forkado`)
* [Add outras instruções caso necessário]
### Resumo
O que veremos na aula de hoje?
* [Slide Semana 17](https://docs.google.com/presentation/d/1axo2Dlm0Hx35ahKdZW6s-UAdG61L41QXdete8ZcQV0w/edit?usp=sharing)
* Slide Semana 18
* [Escolhendo uma fonte de dados](#Escolhendoumafontededados)
* Análise exploratória
* Criando uma história com dados
## Conteúdo
### O que é um projeto de análise de dados?
Nesse ponto vocês já aprenderam que ter dados não é a mesma coisa que ter informação.
**Dados:** são elementos brutos e não processados, como números, palavras, ou símbolos que precisam ser interpretados para se tornarem úteis.
**Informação:** é o resultado do processamento, organização e interpretação dos dados, fornecendo significado e contexto para tomar decisões ou entender situações.
Assim, dados são a matéria-prima da informação, que é o produto final após análise e interpretação dos dados.
Por isso a importância de nós contarmos uma história estruturada a partir dos dados que conseguimos coletar. E é exatamente sobre isso, que se trata um projeto de análise de dados: **gerar informação útil a partir da construção de uma perspectiva contextualizada!**
Então aqui vão algumas perguntas gerais que devemos nos fazer ao iniciar um projeto como esse:
- **Conteúdo**
- O que eu quero informar?
- **Público**
- Para quem eu estou contanto essa história? Com quem vou compartilhar essa informação?
- **Transformação**
- Por que essa informação é relevante?
Ok, as perguntas são importantes,
MAS POR ONDE COMEÇAR?!
### Escolhendo uma fonte de dados
#### O caminho comum
Se você já fez algum tipo de pesquisa acadêmica (TCC, Iniciação Científica, etc) você certamente está familiarizado com esse processo, pois tudo começa com a escolha de um TEMA, seguindo para a definição do PROBLEMA, que em seguida é desdobrado em PERGUNTAS, que irão guiar a COLETA DE DADOS.
1. Delimitação do Tema
2. Definição do Problema
3. Desenvolvimento de Perguntas
4. Coleta de Dados
#### O caminho que iremos seguir
Porque esse projeto é um exercício e encontrar os dados ideais para responder às nossas perguntas pode se tornar um trabalho extremamente complexo...
Nós iremos fazer um caminho um pouco diferente e a partir de um tema de interesse, escolher uma base e então pensar quais perguntas podem ser respondidas a partir dela.
O QUE TAMBÉM É SUPER VÁLIDO! E PODE RENDER DESCOBERTAS INCRÍVEIS!
* **Escolha do tema**
No primeiro momento você deve escolher qual assunto gostaria de abordar. Pense em um tema atual, relevante e até onde você vai aprofundar a análise. Lembre-se, não adianta abraçar o mundo sozinho, você precisa focar e entregar o melhor resultado possível, então trabalhe na delimitação do Tema! Quais são os recortes possíveis dentro do universo escolhido?
#Dica: Dê prioridade para algo que você goste, se interesse, tenha afinidade ou conhecimento na área.
* **Escolha da Base de Dados**
[Algumas opções de Bases de Dados](#base-de-dados)
* **Definindo nossas perguntas**
O que eu quero tentar responder? VAMOS AO [BRAINSTORM](#material-da-aula)!
***
### Material da aula
* [Slides](https://docs.google.com/presentation/d/1axo2Dlm0Hx35ahKdZW6s-UAdG61L41QXdete8ZcQV0w/edit?usp=sharing)
### Links Úteis
- [Documentação Pandas](https://pandas.pydata.org/docs/user_guide/index.html#user-guide)
- [Introdução ao Pandas](https://medium.com/tech-grupozap/introdu%C3%A7%C3%A3o-a-biblioteca-pandas-89fa8ed4fa38)
- [Análise Exploratória de Dados I](https://escoladedados.org/tutoriais/analise-exploratoria-de-dados/)
- [Análise Exploratória de Dados II](https://www.alura.com.br/artigos/analise-exploratoria)
- [Storytelling com Dados](https://medium.com/resumos-resenhas/storytelling-com-dados-resumo-fd63ebe4f704)
- [Markdown Cheastsheet](https://www.ibm.com/docs/en/watson-studio-local/1.2.3?topic=notebooks-markdown-jupyter-cheatsheet)
#### Base de Dados
- [Kaggle](https://www.kaggle.com/datasets)
- [IBGE](https://ces.ibge.gov.br/base-de-dados/links-base-de-dados.html)
- [Brasil.io](https://brasil.io/datasets/)
- [Gov.br](https://dados.gov.br/dados/conjuntos-dados)
- [Nosso Mundo em Dados](https://ourworldindata.org/charts)
<p align="center">
Desenvolvido com :purple_heart:
</p>
Original file line number Diff line number Diff line change
@@ -0,0 +1,12 @@
Ano,Potencial Doador,Potencial Doador (PMP),Doador Efetivo,Doador Efetivo (PMP),Percentual de Efetivação,Entrevista Familiar,Negativa Familiar,Negativa Familiar (%)
2013,177,"55,9",44,"13,9","24,9%",279,146,"52,3%"
2014,175,"55,2",44,"13,9","25,1%",233,105,"45,1%"
2015,157,"46,1",36,"10,6","22,9%",144,79,"54,9%"
2016,152,"44,2",39,"11,3","25,7%",97,53,"54,6%"
2017,173,"49,8",47,"13,5","27,2%",124,66,"53,2%"
2018,159,"45,3",32,"9,1","20,1%",101,71,"70,3%"
2019,217,"62,4",52,"14,9","24,0%",126,71,"56,3%"
2020,188,"53,6",24,"6,8","12,8%",100,64,"64,0%"
2021,207,"58,6",19,"5,4","9,2%",107,67,"62,6%"
2022,231,"64,9",36,"10,1","15,6%",131,88,"67,2%"
2023,223,"67,5",32,"9,7","14,3%",134,89,"66,4%"
Binary file not shown.
Original file line number Diff line number Diff line change
@@ -0,0 +1,12 @@
Ano,Coração,Fígado,Figado vivo,Figado falecido,Pancreas,Pulmão,Pulmão vivo,Pulmão falecido,Rim,Rim vivo,Rim falecido,Pancreas rim,Intestino Isolado,Multivisceral,Total Orgãos,Córnea,Médula óssea,MO Autólogo,Mo Aparentado,Mo Nap,Total Geral
2013,0,3,0,3,0,0,0,0,60,5,55,0,0,0,63,181,50,21,20,9,294
2014,2,2,0,2,0,0,0,0,66,7,59,0,0,0,70,141,60,31,17,12,271
2015,0,0,0,0,0,0,0,0,67,7,60,0,0,0,67,131,39,20,10,9,237
2016,0,0,0,0,0,0,0,0,67,11,56,0,0,0,67,104,57,24,17,16,228
2017,0,0,0,0,0,0,0,0,60,12,48,0,0,0,60,177,1,1,0,0,238
2018,0,0,0,0,0,0,0,0,45,6,39,0,0,0,45,166,59,42,9,8,270
2019,0,0,0,0,0,0,0,0,76,9,67,0,0,0,76,140,71,49,14,8,287
2020,0,0,0,0,0,0,0,0,48,7,41,0,0,0,48,92,91,63,21,7,231
2021,0,0,0,0,0,0,0,0,18,3,15,0,0,0,18,97,71,40,23,8,186
2022,2,0,0,0,0,0,0,0,48,9,39,0,0,0,50,135,52,27,15,10,237
2023,4,0,0,0,0,0,0,0,53,7,46,0,0,0,57,159,87,62,18,7,303
Binary file not shown.
Binary file not shown.
1 change: 1 addition & 0 deletions S7.SAYONARA_TEMP
Submodule S7.SAYONARA_TEMP added at 9e5aa8
12 changes: 12 additions & 0 deletions dados.csv
Original file line number Diff line number Diff line change
@@ -0,0 +1,12 @@
Ano,Potencial Doador,Potencial Doador (PMP),Doador Efetivo,Doador Efetivo (PMP),Percentual de Efetivação,Entrevista Familiar,Negativa Familiar,Negativa Familiar (%),Coração_x,Fígado_x,Figado vivo,Figado falecido,Pancreas,Pulmão_x,Pulmão vivo,Pulmão falecido,Rim_x,Rim vivo,Rim falecido,Pancreas rim,Intestino Isolado,Multivisceral_x,Total Orgãos,Córnea_x,Médula óssea,MO Autólogo,Mo Aparentado,Mo Nap,Total Geral,Coração_y,Fígado_y,Pulmão_y,Rim_y,Pâncreas,Pâncreas Rim,Intestino,Multivisceral_y,SubTotal,Córnea_y,Total
2013,177,"55,9",44,"13,9","24,9%",279,146,"52,3%",0,3,0,3,0,0,0,0,60,5,55,0,0,0,63,181,50,21,20,9,294,0,5,0,61,0,0,0,0,66,73,139
2014,175,"55,2",44,"13,9","25,1%",233,105,"45,1%",2,2,0,2,0,0,0,0,66,7,59,0,0,0,70,141,60,31,17,12,271,0,0,0,153,0,0,0,0,153,55,208
2015,157,"46,1",36,"10,6","22,9%",144,79,"54,9%",0,0,0,0,0,0,0,0,67,7,60,0,0,0,67,131,39,20,10,9,237,0,0,0,180,0,0,0,0,180,66,246
2016,152,"44,2",39,"11,3","25,7%",97,53,"54,6%",0,0,0,0,0,0,0,0,67,11,56,0,0,0,67,104,57,24,17,16,228,0,0,0,162,0,0,0,0,162,149,311
2017,173,"49,8",47,"13,5","27,2%",124,66,"53,2%",0,0,0,0,0,0,0,0,60,12,48,0,0,0,60,177,1,1,0,0,238,0,0,0,165,0,0,0,0,165,180,345
2018,159,"45,3",32,"9,1","20,1%",101,71,"70,3%",0,0,0,0,0,0,0,0,45,6,39,0,0,0,45,166,59,42,9,8,270,0,0,0,299,0,0,0,0,299,201,500
2019,217,"62,4",52,"14,9","24,0%",126,71,"56,3%",0,0,0,0,0,0,0,0,76,9,67,0,0,0,76,140,71,49,14,8,287,0,0,0,306,0,0,0,0,306,296,602
2020,188,"53,6",24,"6,8","12,8%",100,64,"64,0%",0,0,0,0,0,0,0,0,48,7,41,0,0,0,48,92,91,63,21,7,231,0,0,0,278,0,0,0,0,278,378,656
2021,207,"58,6",19,"5,4","9,2%",107,67,"62,6%",0,0,0,0,0,0,0,0,18,3,15,0,0,0,18,97,71,40,23,8,186,1,0,0,301,0,0,0,0,302,479,781
2022,231,"64,9",36,"10,1","15,6%",131,88,"67,2%",2,0,0,0,0,0,0,0,48,9,39,0,0,0,50,135,52,27,15,10,237,3,0,0,307,0,0,0,0,310,541,851
2023,223,"67,5",32,"9,7","14,3%",134,89,"66,4%",4,0,0,0,0,0,0,0,53,7,46,0,0,0,57,159,87,62,18,7,303,1,0,0,330,0,0,0,0,331,584,915
12 changes: 12 additions & 0 deletions dataset.csv
Original file line number Diff line number Diff line change
@@ -0,0 +1,12 @@
Ano,Coração,Fígado,Pulmão,Rim,Pâncreas,Pâncreas Rim,Intestino,Multivisceral,SubTotal,Córnea,Total
2013,0,5,0,61,0,0,0,0,66,73,139
2014,0,0,0,153,0,0,0,0,153,55,208
2015,0,0,0,180,0,0,0,0,180,66,246
2016,0,0,0,162,0,0,0,0,162,149,311
2017,0,0,0,165,0,0,0,0,165,180,345
2018,0,0,0,299,0,0,0,0,299,201,500
2019,0,0,0,306,0,0,0,0,306,296,602
2020,0,0,0,278,0,0,0,0,278,378,656
2021,1,0,0,301,0,0,0,0,302,479,781
2022,3,0,0,307,0,0,0,0,310,541,851
2023,1,0,0,330,0,0,0,0,331,584,915
44 changes: 22 additions & 22 deletions material/analise-exploratoria/analise.ipynb
Original file line number Diff line number Diff line change
@@ -1,22 +1,22 @@
{
"cells": [
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"#Utilizar as bibliotecas de Python aprendidas em aula (pandas, matplotlib, seaborn, etc);\n",
"#Trazer um notebook estruturado e organizado com o uso de Markdown. O uso de textos no notebook é altamente incentivado);\n",
"#Mínimo de 3 visualizações que ajudem a sumarizar os resultados da sua análise."
]
}
],
"metadata": {
"language_info": {
"name": "python"
}
},
"nbformat": 4,
"nbformat_minor": 2
}
{
"cells": [
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"#Utilizar as bibliotecas de Python aprendidas em aula (pandas, matplotlib, seaborn, etc);\n",
"#Trazer um notebook estruturado e organizado com o uso de Markdown. O uso de textos no notebook é altamente incentivado);\n",
"#Mínimo de 3 visualizações que ajudem a sumarizar os resultados da sua análise."
]
}
],
"metadata": {
"language_info": {
"name": "python"
}
},
"nbformat": 4,
"nbformat_minor": 2
}
22 changes: 11 additions & 11 deletions material/nome-projeto.md
Original file line number Diff line number Diff line change
@@ -1,12 +1,12 @@
## Contexto
Esse projeto consiste na análise de xxxxxx. O objetivo desse projeto é xxxxxxxxx.
Para desenvolver esse projeto, desenvolvemos uma análise exploratória de dados xxxxxxx e utilizamos o Tableau para gerar a visualização das nossas análises.

### Objetivos gerais e específicos do projeto

### Bases escolhidas

- Base 1 (fonte)
- Base 2 (fonte)

## Contexto
Esse projeto consiste na análise de xxxxxx. O objetivo desse projeto é xxxxxxxxx.
Para desenvolver esse projeto, desenvolvemos uma análise exploratória de dados xxxxxxx e utilizamos o Tableau para gerar a visualização das nossas análises.
### Objetivos gerais e específicos do projeto
### Bases escolhidas
- Base 1 (fonte)
- Base 2 (fonte)
## Ferramentas utilizadas