Google Research lanza un conjunto de datos abierto que permite rastrear cambios en edificaciones en África, América Latina y Asia del Sur y Sudeste, utilizando imágenes satelitales públicas.
El crecimiento urbano global es una realidad inminente; se espera que para el 2050 la población urbana aumente en 2.5 mil millones de personas, con el 90% de este crecimiento concentrado en ciudades de Asia y África.
La planificación efectiva de este crecimiento, la respuesta a crisis y la comprensión del impacto de la urbanización requieren de datos precisos sobre edificaciones e infraestructura.
No obstante, muchas regiones del Sur Global carecen de acceso a esta información vital, obstaculizando los esfuerzos de desarrollo.
En el 2021, Google Research lanzó el Open Buildings dataset, que incrementó significativamente el número de edificaciones mapeadas públicamente en África, expandiéndose luego a América Latina, el Caribe, y Asia del Sur y Sudeste.
Este conjunto de datos ha sido crucial para agencias de la ONU, ONG y investigadores en la planificación de electrificación, respuesta a crisis y campañas de vacunación.
Los usuarios del Open Buildings dataset han solicitado datos que muestren cambios en edificaciones a lo largo del tiempo, lo cual puede mejorar la planificación urbana y la comprensión de los cambios en el impacto humano sobre el medio ambiente.
También se ha solicitado información sobre alturas aproximadas de los edificios para estimar la densidad poblacional en respuesta a desastres o esfuerzos de asignación de recursos.
Para abordar estas necesidades, se presenta el Open Buildings 2.5D Temporal Dataset, basado en resultados experimentales que estiman cambios a lo largo del tiempo y proporcionan datos de altura para edificaciones en el Sur Global.
Este conjunto de datos genera anualmente un mapa de presencia, conteo y alturas de edificios desde 2016 hasta 2023, cubriendo una región de 58 millones de km² en África, América Latina y Asia del Sur y Sudeste, utilizando imágenes de resolución de 10m del satélite Sentinel-2.
Está disponible en el sitio de Open Buildings o a través de Earth Engine.
La metodología utilizada para este dataset implica un modelo de estudiante y maestro que procesa hasta 32 marcos temporales de imágenes de baja resolución para una misma ubicación. A pesar de la menor resolución, el satélite Sentinel-2 capta cada punto de la Tierra aproximadamente cada cinco días, lo que permite detectar edificaciones con una precisión superior. El modelo adapta técnicas similares a las utilizadas por los teléfonos Pixel para mejorar la resolución de las imágenes mediante capturas múltiples.
El modelo, basado en HRNet, genera una imagen en escala de grises de superresolución, ayudando a alinear espacialmente las salidas del modelo. Esto permite ver los cambios en el terreno a lo largo del tiempo, con un detalle que se aproxima al de un modelo de alta resolución.
El conteo de edificios es esencial para muchas tareas analíticas. Aunque los datos rasterizados no permiten identificar edificios individuales directamente, se ha añadido una salida extra al modelo que predice el conteo de edificaciones en un área determinada. Esta técnica ha demostrado ser precisa tanto en escalas absolutas como logarítmicas.
Estimaciones aproximadas de las alturas de los edificios ayudan a calcular la densidad poblacional y evaluar el impacto potencial de desastres naturales. Sin embargo, el entrenamiento de datos de altura se ha limitado principalmente a regiones de EE.UU. y Europa, por lo que la evaluación en el Sur Global se ha realizado mediante verificaciones puntuales.
El modelo tiene limitaciones, como la necesidad de imágenes sin nubes y la detección errónea de ciertas estructuras.
A pesar de estas restricciones, el conjunto de datos 2.5D Temporal es valioso para agencias gubernamentales, organizaciones humanitarias e investigadores interesados en patrones de crecimiento urbano, evaluación de áreas afectadas por desastres y tendencias de desarrollo.
En colaboración con entidades como WorldPop, UN Habitat y Sunbird AI, este conjunto de datos se está utilizando para estimar poblaciones globales, sostenibilidad urbana y planificación de electrificación rural. Se invita a investigadores y responsables de políticas a explorar este recurso y proporcionar retroalimentación.