Lleva tus campañas a otro nivel analizando del comportamiento de tus clientes
.
Análisis Exploratorio de Datos
URL del proyecto:
https://github.com/abraham-cedeno/Analisis-de-audiencia-caso-Cyclistic.git
URL del proyecto en R:
Cyclistics-Analysis-notebook-in-R.html
Herramientas utilizadas:
SQL, RStudio, Microsoft Excel, Power Query, Tableau
Sección 1: Introducción al proyecto
Descripción del problema
Cyclistic, una empresa de bicicletas compartidas en Chicago, busca maximizar el número de miembros anuales para asegurar su crecimiento futuro. El equipo de marketing necesita entender las diferencias entre los ciclistas ocasionales y los miembros anuales y cómo los medios digitales pueden afectar su estrategia.
La tarea principal de este proyecto es analizar los datos históricos de viajes en bicicleta de los diferentes tipos de clientes de Cyclistic, especialmente durante los últimos 12 meses, para comprender cómo utilizan las bicicletas de manera distinta.
Objetivo empresarial
"Proporcionar información valiosa al equipo de marketing para que pueda determinar las estrategias de marketing digital más efectivas, permitiéndoles conectar con la audiencia de Cyclistic e influir en los ciclistas ocasionales para que opten por una membresía anual."
Sección 2: Descripción de los datos
Datos proporcionados
Los datos proporcionados para este proyecto incluyen más de 6 millones de registros de viajes en bicicleta de Cyclistic, con información detallada sobre cada viaje, incluyendo la identificación del viaje, el tipo de vehículo utilizado, la hora y fecha de inicio y finalización del viaje, las estaciones de inicio y finalización, y las coordenadas geográficas de inicio y finalización.
Columna |
Tipo de datos |
Sub tipo de datos |
Rangos o Categorias |
1. ID de viaje |
Categorical |
Nominal |
ID que combina números y letras |
2. Tipo de vehículo |
Categorical |
Nominal |
bici clásica, bici eléctrica, bici acoplada |
3. Hora de inicio de viaje |
Numerical |
Continuous |
0:00 a 24:00 |
4. Día de inicio de viaje |
Numerical |
Discrete |
11/1/2021 a 10/31/2022 |
5. Hora de finalización del viaje |
Numerical |
Continuous |
0:00 a 24:00 |
6. Día de finalización del viaje |
Numerical |
Discrete |
11/1/2021 a 10/31/2022 |
7. ID de estación de inicio |
Categorical |
Nominal |
ID que combina números y letras |
8. Estación de inicio |
Categorical |
Nominal |
Nombres de las estaciones de inicio |
9. ID de estación de finalización |
Categorical |
Nominal |
ID que combina números y letras |
10. Estación de finalización |
Categorical |
Nominal |
Nombres de las estaciones de inicio |
11. Latitud de inicio |
Numerical |
Continuous |
-90º a 90º |
12. Longitud de inicio |
Numerical |
Continuous |
-180º a 180º |
13. Latitud de finalización |
Numerical |
Continuous |
-90º a 90º |
14. Longitud de finalización |
Numerical |
Continuous |
-180º a 180º |
Sección 3: Descubrimientos
¿Cuál fue la distribución porcentual de preferencia de bicis?
Observaciones
-
Preferencias de miembros igual:
los viajeros miembros no tienen una preferencia significativa por un tipo de bici, ya que su distribución fue casi del 50%/50%.
-
Preferencia por bicis eléctricas:
los viajeros casuales tienen una preferencia mayor por las bicis eléctricas que por las bicis clásicas.
-
Algunos viajeros casuales utilizan bicis acopladas:
a pesar de que ninguno de los viajeros miembros utilizó bicis acopladas, algunos viajeros casuales sí las utilizaron.
¿Cómo se distribuye el uso del servicio a lo largo de la semana?
Observaciones
-
Viajeros casuales viajan más los fines de semana:
se observa que el volumen de viajes casuales disminuye los día de semana e incrementa los fines de semana.
-
Viajeros miembros viajan más los días de semana:
el patrón opuesto es observado con los viajeros miembros que utilizan el servicio con más frecuencia durante la semana.
¿Cómo se distribuye el uso del servicio a lo largo de un día?
Observaciones
-
Misma hora pico:
la hora pico para el inicio de viajes de usuarios casuales y miembros es alrededor de las 5:10PM.
-
Patrones de comportamiento variables durante el día:
los viajeros miembros tienen un pico inicial alrededor de las 8:30AM, luego un decremento hasta las 4:00PM cuando vuelve a subir. En cambio, los viajeros casuales tienen un incremento continuo de partidas desde la mañana hasta la hora pico.
¿Cúal es la duración promedio de los viajes?
Observaciones
-
Duración mayor de viajes casuales:
la duración promedio de los viajes casuales(22:52 mins) es mayor que la de los viajes de miembros (12:27 mins).
-
Pico de duración promedio distinto:
se observa que el mayor volumen de viajes casuales se da a los 7 minutos, en cambio para los viajes de miembros el mayor volumen se da a los 4 minutos.
-
Dispersión elevada:
se visualiza una mayor dispersión en el histograma de viajes casuales, lo que reafirma porque el promedio es tan elevado.
¿Cuál es la estación preferida para iniciar viajes?
Observaciones
-
Significativa preferencia en viajeros casuales:
se percibe una preferencia significativa en los viajeros casuales, prácticamente 25% de viajes iniciaron en la estación "Streeter Dr & Grand Ave".
-
No se encontró una preferencia significativa en viajeros miembros:
se logra ver que en la gráfica de pastel de los miembros, los viajes se distribuyen de manera casi equitativa para todas las estaciones.
-
Patrón similar en finalización de viajes:
al graficar para la finalización de los viajes, se encontró el mismo patrón par ambos tipos de viajeros.
¿Cómo se distribuyen geográficamente los puntos de inicio de los viajes?
Observaciones
-
Similitud en comportamiento geográfico:
No se logra percibir una diferencia significativa en el comportamiento de ambos tipos de viajeros.
-
Elevado uso de servicios en un radio específico:
se logra percibir que hay un radio en el cuál se inician muchos más viajes que en otras localizaciones geográficas.
-
Patrón similar en finalización de viajes:
al graficar para la finalización de los viajes, se encontró el mismo patrón par ambos tipos de viajeros.
Sección 4: Recomendaciones