El objetivo de este proyecto es realizar un análisis de un conjunto de datos utilizando la metodología CRISP-DM. Se busca:
- Crear conocimiento útil a partir de los datos.
- Generar valor utilizando los datos.
- Tomar decisiones basadas en los datos.
La metodología CRISP-DM (Cross Industry Standard Process for Data Mining) permite una comunicación constante entre todos los miembros del proyecto durante el desarrollo de un producto de análisis de datos, lo cual facilita la adaptación a los cambios en los requisitos, diseño y otros factores.
- Gonzales Astoray, Andrea Abigail - U20211C561
- Marco Antonio Fuentes Rivera Onofre - U20211b693
- Esteban Fabricio Cabrera Arbizu - U202014600
El conjunto de datos "bike_buyers" fue proporcionado por la empresa Peru_bike, que se dedica a la venta de bicicletas. Este conjunto de datos está compuesto por detalles de 1000 usuarios de diferentes orígenes y registra si compraron o no una bicicleta. El conjunto de datos contiene 13 campos, que son los siguientes:
Variable | Descripción |
---|---|
ID | Identificación del comprador |
Marital Status | Estado civil del comprador (casado o soltero) |
Gender | Género del comprador (hombre o mujer) |
Income | Ingresos del comprador en un determinado período de tiempo |
Children | Número de hijos que tiene el comprador |
Education | Antecedentes educativos del comprador (licenciatura, posgrado, escuela secundaria, universidad parcial, etc.) |
Occupation | Trabajo u ocupación del comprador (oficinista, administrativo, manual, profesional, etc.) |
Home Owner | Estado del comprador si posee o no una casa propia |
Cars | Número de coches que posee el comprador |
Commute Distance | Distancia entre la casa del comprador y la empresa en la que trabaja (0-1 millas, 1-2 millas, 10+ millas, etc.) |
Region | Región donde vive el comprador (Europa, América del Norte, el Pacífico, etc.) |
Age | Edad del comprador |
Purchased Bike | Estado del comprador si ha comprado la bicicleta o no |
Este conjunto de datos será utilizado para realizar un análisis detallado y extraer información relevante que permita tomar decisiones basadas en datos.