Skip to content

kerllare/Case_challenge_Lighthouse

Repository files navigation


Challenge - Lighthouse

Este repositório se refere ao case challenge de processo seletivo, do programa Lighthouse da Indicium



Este projeto é uma Análise de dados no Jupyter Notebook com visualizações no Power BI e

📌 Apresentação em PowerPoint.

Aprimoramento e enriquecimento dos dados foram realizados, envolvendo a transformação dos dados com a criação de novas variáveis a partir das já existentes, além do tratamento de valores nulos nas colunas relevantes. Dois novos conjuntos de dados foram exportados como arquivos CSV. Insights foram obtidos por meio da exploração de dataframes e do uso de bibliotecas de visualização em Python, guiando assim o processo de análise de dados de forma informada e eficaz.

Objetivo


"Desafio Análise de Dados /Engenharia de Analytics

Introdução

Este desafio busca simular um projeto de analytics de um banco fictício chamado Banco Vitória que tem o objetivo de amadurecer na sua cultura e no uso de dados dentro da organização. Você será avaliado de acordo com sua capacidade de raciocínio analítico, manipulação, visualização e argumentação com o uso de dados.

Contexto

BanVic - A Jornada dos Dados Financeiros. O Banco Vitória S.A., também conhecido como BanVic, foi fundado em São Paulo em 2010, com uma visão inovadora de oferecer serviços bancários eficientes tanto em agências físicas quanto no ambiente digital. Com uma equipe de 100 colaboradores dedicados, o BanVic cresceu para se tornar uma instituição financeira nacional de destaque.

O banco sempre foi focado em proporcionar aos clientes experiências bancárias transparentes e convenientes. No entanto, à medida que a instituição expandiu suas operações e serviços, surgiu a necessidade de aprimorar a compreensão de seus dados para impulsionar ainda mais a excelência em seus serviços.

Nossa história começa quando a CEO do BanVic, Sofia Oliveira, percebe que a análise de dados é a chave para elevar o banco a novos patamares. Ela acredita que entender profundamente as operações e comportamentos dos clientes pode levar a melhorias significativas nos serviços oferecidos.

Sofia convoca uma reunião com a equipe de liderança, incluindo o Diretor de Tecnologia, André Tech, a Diretora Comercial, Camila Diniz, e o recém-contratado Analista de Dados, Lucas Johnson. Cada um deles traz perspectivas únicas para a mesa.

André Tech, o especialista em tecnologia, está animado com a ideia de implementar técnicas avançadas de análise de dados para otimizar as operações internas do banco. Há tempos André e sua equipe fazem análises manuais para o banco e ele não gostaria de seguir dessa forma por já conhecer os riscos deste formato.

Camila Diniz, por outro lado, não está convencida que este é o caminho. Ela acredita que o BanVic pode investir mais em marketing e melhorar a segmentação dos clientes nas cidades que o banco já está estabelecido, sendo esse um caminho mais rápido e já conhecido pelo BanVic. Sua postura pode colocar em risco o projeto, pois sua equipe hoje detém parte dos dados comerciais importantes para a estruturação digital da empresa e isso pode acarretar em burocracias e atrasos em relação a acessos e permissões.

Por fim, Lucas Johnson, apaixonado por dados, propõe uma abordagem abrangente para compreender não apenas as transações financeiras, mas também o comportamento dos clientes em diversos canais. Ele sugere explorar como o PIX afetou as transações, identificar padrões de inatividade e avaliar a popularidade da agência digital em comparação com a agência física.

A equipe concorda que a implementação de um projeto de análise de dados bem-sucedido pode proporcionar insights valiosos, melhorando a eficiência operacional e a experiência do cliente. No entanto, todos são conscientes dos desafios técnicos e da importância de escolher as ferramentas certas.

Em um servidor da nuvem estão os dados do ERP, CRM e marketing. Atualmente as análises do BanVic são realizadas em planilhas e apresentações, sendo que não possuem nada em ferramentas de BI, mas estão abertos a utilizar ferramentas como Metabase, Data Studio, PowerBI, entre outros.

Dados

7 cópias das principais tabelas do ERP do BanVic disponível em arquivo banvic_data.zip

Desafio

Neste desafio você vai gerar um relatório com indicadores de performance para responder às demandas do BanVic. Para isso você deve criar indicadores de negócio e sugerir como a empresa pode agir em cima deles para melhorar seus resultados. Você pode usar as ferramentas que tiver maior facilidade ou achar mais interessante tais como Excel, Google Sheets, Python, R, dbt (data build tool) etc. Lembre que este relatório será apresentado para a CEO, então você deve formatá-lo de forma profissional e objetiva.

Entregas

⦁ Nem todos os envolvidos estão convictos com a ideia de uma frente de BIs no BanVic. Como podemos convencer Camila Diniz, diretora comercial, que as nossas soluções serão úteis para a empresa? Com base na análise exploratória realizada nos dados apresentados, quais perguntas de negócio podemos responder para mostrar o valor que dados possuem para a empresa? Pergunta de nível teórico. O seu projeto final não necessariamente precisa trazer os mesmos ou todos os indicadores citados nessa entrega.

⦁ Quais serão os indicadores ou visualizações utilizadas para responder às perguntas de negócio citadas anteriormente? Pergunta de nível teórico. O seu projeto final não necessariamente precisa trazer os mesmos ou todos os indicadores citados nessa entrega.

⦁ Apresentar pelo menos duas análises de negócio para cada uma das categorias. Pergunta de nível teórico. O seu projeto final não necessariamente precisa ter todas análises citadas nessa entrega:

⦁ Uma análise descritiva; ⦁ Uma análise diagnóstica; ⦁ Uma análise prescritiva; ⦁ Uma análise preditiva.

⦁ Um relatório em PDF com suas análises, justificativas e raciocínio contendo os seguintes pontos: ⦁ As respostas do item 1, 2 e 3. ⦁ Um tópico descrevendo brevemente quais os processos de transformação e tratamento de dados foram aplicados por você. ⦁ Um dashboard dos principais KPIs de negócio do BanVic permitindo um detalhamento por data, por agência e por clientes. ⦁ Apresentar as análises que foram necessárias para o entendimento do negócio e que podem ser úteis no suporte para a tomada de decisão. ⦁ E finalmente, com base nas suas análises, uma conclusão com recomendações/sugestões de negócio e encaminhamentos para a CEO do BanVic. ⦁ Apresentar e justificar as ferramentas adotadas para a elaboração das análises.

Você também poderá enviar em anexo outros arquivos que julgar necessários para complementar a análise de Indicadores do BanVic ou que foram usados para elaborar o relatório. Como dashboards, HTML, Jupyter/R Notebook, excel, ferramenta de BI, links para repositórios de código, etc.

Prazo

⦁ Você tem até 7 dias corridos para a entrega, contados a partir do recebimento deste desafio. ⦁ Envie o seu relatório dentro da sua data limite para o email.

Bom trabalho!"



Tecnologias e Dependências Utilizadas
Ferramenta Descrição
Python Linguagem de programação.
pandas Biblioteca criada para a linguagem Python para manipulação e análise de dados.
matplotlib Biblioteca de software para criação de gráficos e visualizações de dados em geral, feita para e da linguagem de programação Python.
seaborn Ferramenta para plotagem dos mais variados tipos de gráficos em Python.
VSCode Editor de código .
Jupyter Notebook Aplicação web criada para desenvolver software de código aberto, padrões abertos e serviços para computação interativa em dezenas de linguagens de programação.
Power BI Plataforma de análise, exploração e gerenciamento de dados visuais.
PowerPoint Apresentação final para PowerPoint em PDF.



Visualização


# Clonar o repositório
$ git clone https://github.com/kerllare/Case_challenge_Lighthouse.git

# Entrar na pasta do repositório
$ cd Case_challenge_Lighthouse

# Instalar as bibliotecas (execute estes comandos em um ambiente Python):
$ pip install pandas matplotlib seaborn

# Após instalar as bibliotecas, você pode executar o projeto localmente no arquivo 'case.ipynb'.

# Se você  estiver na pasta do repositório 'banvic_data', você pode prosseguir da seguinte maneira:

# Instalar as bibliotecas:
$ import pandas as pd
$ import matplotlib.pyplot as plt
$ import seaborn as sns

# Executar o comando na parte superior do arquivo '.ipynb' para que você possa rodar o projeto localmente no arquivo 'case.ipynb'.
$ Run ou Run All


⚗️ Interface Gráfica


📌 Este projeto está com visualizações interativas no Power BI Web. Você pode acessar no link Power BI.

📌 Apresentação em PowerPoint.




Desenvolvido por Kerlla - Analista de Dados

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published