El MITMA ha comenzado a publicar datos abiertos de movilidad procedentes de operadoras de telefonía móvil. En este post mostramos un caso de análisis y aplicación de estos datos.
Como en el anterior análisis de movilidad a los distritos de Madrid central con datos de telefonía móvil, seré muy conciso e iré directo a las conclusiones principales, para ajustar la extensión, obviando el preproceso de los datos, que tal como han sido liberados en el Open data del estudio de movilidad con Big data del MITMA es laborioso y requiere capacidades para procesar grandes volúmenes de datos.
Los datos de origen informan, para cada día y hora, y partiendo por edad, género, actividad en origen y actividad de destino, de las matrices de desplazamiento con una granularidad de ‘distrito’ en ciudades grandes, municipio o agrupación de municipios si estos tienen poca población. Son 3.743 zonas con una población media de 12.600 habitantes, aunque con una alta varianza entre ellas. Esta es una primera pregunta, ¿es suficiente esta granularidad? Depende, claro, siempre depende de lo que busquemos…
Aplicaciones de los datos de movilidad de telefonía móvil
Los datos que el MITMA ha liberado son, a priori, de gran valor para estudios de muchos tipos, los más obvios, por supuesto, relacionados con planeamiento urbano y movilidad: Planes Generales de Ordenación Urbana (PGOU), Planes de Movilidad Urbana Sostenible (PMUS), diseño de zonas de bajas emisiones (ZBE), diseño de infraestructuras o transporte público, optimización de red de puntos de recarga, peatonalización…En este sentido, constituyen un buen punto de partida para la elaboración de matrices origen – destino (OD) con las que alimentar modelos.
Pero también son datos de altísimo valor para análisis sociales, estilos de vida, identificación de target en campañas de marketing físicas u online, usando en estos casos la movilidad como proxy para perfilar estos hábitos de consumo y estilos de vida. Cómo, cuándo, a dónde nos movemos nos define y habla de nuestros intereses.
Caso de análisis de los datos de movilidad de telefonía móvil
Como probablemente sabréis, en unica360 modelizamos movilidad humana, lo que se traduce, por ejemplo, en los modelos de movilidad de peatones y vehículos que forman parte de nuestro producto de datos para location intelligence y enriquecimiento microtarget. Pero en este caso estamos explorando el valor potencial de estos sets de movilidad como modo de inferir estilos de vida de la población, en el contexto de un modelo de estilos de vida aplicable al enriquecimiento de modelos analíticos.
Concretamente, nos interesa saber si, para un distrito dado, sus habitantes tienden a trabajar en el mismo distrito o se desplazan al centro metropolitano sobre el que gravitan, lo mismo para el ocio, si salen de noche y a dónde, si hacen viajes por trabajo o vacaciones… Y como parte de esta exploración y validación, os presento un breve análisis de movilidad hacia el distrito en el que se ubica el aeropuerto Adolfo Suárez / Barajas. Analizaremos desde dónde hay más desplazamientos, qué meses, días, horas, motivos…
Datos de movilidad vs estadística de viajeros
Empezamos aislando un subset del inmenso lago de datos compartido: desplazamientos al aeropuerto de Barajas desde los distritos de la provincia de Madrid y limítrofes, excluyendo los que tienen como motivo el desplazarse a la residencia habitual, para tratar de neutralizar el efecto de que en el distrito del aeropuerto viven 50.000 personas y sus desplazamientos diarios generarían «ruido».
Si comparamos los viajes en el set del Mitma el último año móvil disponible -2022-06-01 a 2023-05-31- con los viajeros declarados por Aena en 2022 vemos una relación lineal pero con ciertas inconsistencias. En el gráfico siguiente vemos los viajeros según Aena comparados con los desplazamientos hacia el distrito de 24 de los 48 aeropuertos en España. La moderada correlación lineal (0.71) y los casos extremos que muestra el gráfico de dispersión nos hacen pensar que, o bien esa estimación de desplazamientos a vivienda habitual es imprecisa o bien en el distrito en que se ubican ciertos aeropuertos hay muchos puestos de trabajo o puntos de atracción de ocio. Estamos validando estas hipótesis con nuestros modelos de población laboral y de oferta comercial, pero no me quiero bifurcar, seguimos con el hilo de análisis.
Análisis de desplazamientos al aeropuerto por distritos
Vamos directos a ver unos mapas de resultados.
Son más los desplazamientos al aeropuerto desde los distritos del centro y Norte de Madrid, aun cuando no son los más poblados:
Si neutralizamos la población, se acentúa esta diferencia, pero destacan también los municipios del Este de Madrid, con desplazamientos al distrito que pueden no ser al aeropuerto:
¿Y si nos centráramos en la movilidad en períodos vacacionales? Tomamos las semanas de vacaciones de verano, navidad y semana santa para el siguiente mapa temático. Como vemos, la diferencia es mínima respecto a los viajes de todo el año del primer mapa.
Finalmente, vemos los viajes vacacionales neutralizando la población, con el mismo efecto de «activarse» los municipios al Este de Madrid que veíamos en los viajes totales.
Los datos incluyen una estimación de renta -preferimos usar nuestro modelo, más preciso- y la distribución de viajes por edad y género de los viajeros en el distrito. Con estos últimos indicadores podemos hacer análisis como el del cuadro siguiente, que nos muestra diferencias de distribución entre los distritos.
Por ejemplo, en el distrito 21, donde se encuentra el aeropuerto y el que aporta mayor número de viajes, y entre los jóvenes de 0-25 años hay 1 millón de viajes más de hombres que de mujeres, mientras que las mujeres de más de 64 años aportan 300.000 viajes más. Esta es una dinámica típica de barrios con alta inmigración, pero esto es algo que, de nuevo, validaremos cruzando con nuestros datos sociodemográficos y de mercado.
Conclusión: ¿son útiles los datos de movilidad del MITMA?
- Los datos de movilidad basados en telefonía móvil que el MITMA ha publicado aportan gran granularidad temporal y de perfil de usuarios. Su granularidad espacial, sin embargo, es insuficiente para análisis como el que hemos abordado en este post.
- El formato de distribución de los datos requiere un preproceso experto de los mismos, y tecnología quizá no al alcance de cualquier perfil de usuario.
- Los datos siguen siendo válidos con propósitos de creación de matrices de entrada Origen – Destino (OD) en proyectos de movilidad, pero requerirían mucho postproceso para ser usados en análisis con alta precisión espacial. Exploraremos en el futuro aproximaciones para esta interpolación espacial.
- Para contar con el contexto suficiente es aconsejable enriquecer los distritos con datos sociodemográficos y de mercado que sirvan de referencia y permitan comparar las cifras de movilidad.
- Son muchas, muchas líneas con mucho detalle, por lo que requieren técnicas de identificación de patrones, secuencias, obtención de insights relevantes…la analítica avanzada va siendo imprescindible
Guillermo Córdoba
Latest posts by Guillermo Córdoba (see all)
- Automatic Insights, far beyond dashboard - 14-11-2024
- Ubicación óptima de puntos de recarga con análisis espacial - 16-09-2024
- Simulación de movilidad por agentes para tod@s - 07-06-2024
Una pregunta, cómo se podrían estimar las ventas de un centro comercial sabiendo sólo la afluencia de gente que va? Por ejemplo 40.000 personas en un día. Gracias