DZETSAKA para clasificación de imágenes Satelitales, Complemento de Qgis v3,x

1.-Introducción.

La presente nota técnica es acerca de una herramienta basada en IA (Inteligencia Artificial), disponible desde la plataforma de Qgis, para la Clasificación Supervisada; es un complemento que se instala en Qgis 3.x, desarrollado por Nicolas Karasiak, PhD Teledetección. Se presentará la misma y se dará un ejemplo de su uso en Qgis, con una imagen del satélite Sentinel 2.

El complemento se denomina “dzetsaka”, se desarrolló para clasificar diferentes tipos de vegetación en la selva tropical inicialmente en el Parque Amazónico de Guayana (Guiana Amazonian Park), en la Guayana Francesa. El nombre «dzetsaka» proviene de la lengua Teko (una nación indígena de la Guayana Francesa). Se refiere a los objetos o instrumentos que utilizamos para «ver el mundo», como satélites, microscopios o cámaras

Comenzó con algoritmos básicos como GMM (Gaussian Mixture Model), la versión más reciente (v5.0) ha dado un salto importante al integrar hasta 11 algoritmos diferentes. En el contexto de la teledetección y el análisis de datos geoespaciales, estos modelos se dividen generalmente en tres categorías según su funcionamiento:

2. Modelos Basados en Árboles y Ensamble

Estos suelen ser los más robustos para clasificar coberturas vegetales o usos de suelo debido a su capacidad para manejar datos no lineales.

  • RF (Random Forest): Un estándar en teledetección. Crea múltiples árboles de decisión y combina sus resultados para mejorar la precisión.
  • XGBoost / CatBoost / GBC (Gradient Boosting): Algoritmos que construyen árboles de forma secuencial, donde cada nuevo árbol intenta corregir los errores del anterior. CatBoost es especialmente bueno con datos categóricos.
  • ET (Extra Trees): Similar a Random Forest, pero introduce más aleatoriedad en la creación de los nodos, lo que a veces reduce el sobreajuste (overfitting).

3. Modelos Estadísticos y de Distancia

  • SVM (Support Vector Machines): Busca el hiperplano óptimo que separa las clases. Muy eficaz con bandas espectrales de alta dimensión.
  • KNN (K-Nearest Neighbors): Clasifica un punto basándose en la proximidad a otros puntos conocidos (los «vecinos» más cercanos).
  • LR (Logistic Regression): A pesar de su nombre, se usa para clasificación binaria o multinomial calculando probabilidades.
  • NB (Naive Bayes): Basado en el teorema de Bayes; asume que las variables son independientes entre sí (lo cual es «ingenuo», pero funciona rápido para clasificar textos o firmas espectrales simples).
  • GMM (Gaussian Mixture Models): Un modelo probabilístico que asume que todos los puntos de datos se generan a partir de una mezcla de un número finito de distribuciones gaussianas. Útil para clasificación no supervisada.

4. Modelos Basados en Redes y Neuronas

  • MLP (Multi-Layer Perceptron): El tipo más básico de Red Neuronal Artificial. Es la base de de Deep Learning, compuesto por capas de «neuronas» interconectadas.

Clasificación

El primer paso para hacer uso de este complemento es su instalación en ambiente Qgis 3.x; para esto se selecciona al menú Complementos→Administrar e instalar complementos y en la pestaña Todos buscar dzetsaka, y proceder a instalar.

Una vez instalado se Selecciona el menú Complementos→dzetsaka→clasifier dashboard y se adiciona un panel del complemento

DZETSAKA 2

Figura 1. Vista de panel dzetsaka clasifier

Se carga la imagen a clasificar, en este ejemplo una Multiespectral del Satélite Sentinel 2, con 4 bandas, tres en el visible y una en el infrarrojo cercano. Se crea una capa vectorial tipo polígono, con un campo numérico, que permitirá tomar muestras de clases en la imagen. El proceso se basa en el conocimiento previo que tienes del terreno. Para que el algoritmo aprenda a diferenciar las coberturas, en la ejecución del algoritmo Gaussian Mixture Model (GMM).  el proceso de «tomar muestras» implica identificar y delimitar Áreas de Entrenamiento. El clasificador requiere que se tome un número significativo, para el ejemplo de la nota se tomaron 48 muestras (polígonos) para 4 clases (12 por cada una).

DZETSAKA 3

Figura. 2. Vista de las muestras en la imagen de satélite.

Una vez culminado la selección de Áreas de Entrenamiento (muestras), se procede a seleccionar el algoritmo de clasificación. En el ejemplo el algoritmo Gaussian Mixture Model (GMM)., en el listado QuickBaselines el algoritmo central y original de este complemento.

DZETSAKA 4
DZETSAKA 5

Fig. 3. Panel de dsztsaka con Quickbaselines seleccionado como algoritmo. Algoritmos disponibles.

https://www.artis-gis.com/tutoriales-qgis

Se presiona el botón de run clasification y se obtiene una salida en tono de grises

DZETSAKA 6

En este ejemplo se tienen 4 Clases, que pueden en la opción Psuedocolor de la simbología, cambiar a colores adecuados a las clases generadas

DZETSAKA 8

Fig. 5. Una vez obtenida una versión se procede a revisar, contra la imagen.

DZETSAKA 7

Fig.6. Comparación entre imágenes y clasificación usando el complemento MapSwipe.

Si el resultado es aceptable se puede dar por concluido el proceso, de no ser así se puede recurrir a una validación. Mas allá del análisis visual es necesario calcular la matriz de confusión y evaluarla. Para ellos en la caja de procesos se buscan las herramientas asociadas al clasificador. →Trian algorithm y se obtiene la matrix de confusión.

DZETSAKA 1

Fig. 7. Train algorithm

  • -Conclusiones.

-Generación de una matriz de Confusión:

Clases1234Pixeles
1387000387
2067690226791
300587425876
4063298301

Tabla 1. Matriz de Confusión del ejemplo.

En la matriz de arriba se observa que en la clase 1, no hubo confusión, en la clase 2 hubo 22 pixeles clasificados mal como 4, en la clase 3 se equivocaron en 2 y en la 4, 3 pixeles fueron clasificados como 3. Calculando la exactitud global (Overall Accuracy) esta da 99,75 %. Por lo que el ejemplo puede considerarse aceptable.

Con muchas más clases y en ámbitos geográficos más extensos o heterogéneos, probablemente requiera más áreas de entrenamiento, o probar varios algoritmos para obtener un resultado óptimo. En esto el clasificador Dzetsaka es una herramienta flexible, que permite la validación de resultado en una interfaz sencilla, amigable y el mismo proceso de clasificar es claro y directo.

Refrencias

Elio Suarez
Centro de Procesamiento Digital de Imágenes (CPDI).
Fundación Instituto de Ingeniería para la Investigación y Desarrollo Tecnológico

Facebook
Telegram
Email