Principal Component Analysis with MultiSpec Software
Para descargar manual hacer click en el siguiente letrero
Manual PCA con Multispec.pdf
Para descargar manual hacer click en el siguiente letrero
Manual PCA con Multispec.pdf
El presente documento pretende
ser una herramienta para los usuarios que tengan el interés de utilizar
software gratuito; y aplicar la técnica de ACP para: "comprimir” la
información contenida en un conjunto original de N bandas espectrales (imagen
de satélite original) a un conjunto menor de nuevas bandas "componentes
principales" consecuentemente estos
componentes podrán servir para desarrollar un análisis visual y posteriormente
a un proceso más complejo como la clasificación a
través de algoritmos matemático-estadísticos para la obtención de un mapa
de vagetación y uso del suelo.
Introducción y
Fundamento
Que es el Análisis de Componentes Principales?
El Análisis de Componentes Principales (ACP) es una técnica bastante empleada
en ciencias sociales y naturales. Su objetivo es resumir un grupo amplio
de variables en un nuevo conjunto, mas
pequeño, sin perder una parte significativa de información original (Chuvieco,1990).
El origen de esta técnica parece arrancar del campo de sicometría: al analizar una serie de test de inteligencia, se intuía la presencia de una serie de factores,
subyacentes a las variables medidas, que podrían explicar gran parte de la
variación común en determinados grupos de variables. Por ejemplo, se comprobó
que las puntuaciones obtenidas en física y
matemáticas tendían a estar bastante relacionadas, así como
las obtenidas por otros alumnos en história y
literatura. Esto hacía pensar en la existencia de otras variables más
complejas, como la habilidad para el cálculo o la capacidad de abstracción,
que permitirían resumir la información
contenida en un mayor número de variables. Esos factores podrían cuantificarse
a partir de las variables originales, estudiando sus relaciones comunes tal y
como se miden en la matriz de varianza-covarianza.
Los factores o componentes principales vendrían, por tanto, a ser como
variables-síntesis de las medidas
inicialmente: un menor número de dimensiones, preservando lo más sustancioso de
la información original (Chuvieco, 1990).
Esta capacidad de síntesis ha
sido la base de la aplicación del ACP en la Teledetección
o percepción remota. La
adquisición de imágenes sobre bandas adyacentes del espectro, implica con
frecuencia detectar una información redundante, puesto que los tipos de
cubierta tienden a presentar un comportamiento similar
en regiones próximas del espectro. Por ello, las medidas realizadas en una
banda pueden presentar una importante correlación con las deducidas de otra, haciendo
una o varias de ellas prácticamente irrelevantes.
En este contexto, el ACP permite sintetizar las bandas originales, creando unas
nuevas bandas – los componentes principales de la imagen,
que recojan la mayor parte de la información original. Esta síntesis resulta
muy conveniente cuando se pretende abordar
un análisis multi-temporal (Joly et al, 1983), o cuando se
intenta seleccionar las tres bandas más adecuadas para una composición en color
(Green et al, 1988).
Desde el punto de vista estadístico, el ACP facilita una primera interpretación
sobre los ejes de variabilidad de la imagen: se identifican aquellos rasgos que
se recogen en la mayor parte de las bandas y aquellos otros que son específicos
a algún grupo de ellas. Una mejor distribución de los datos, frente a esos ejes
de variabilidad, puede facilitar una identificación más
atinada de las distintas cubiertas (Clases o tipos de vegetación). Como es bien
sabido, el sentido y la fuerza de la correlación lineal entre dos variables
puede representarse gráficamente mediante un eje bivariado.
En nuestro contexto, la nube de puntos indica la localización de
los Números Digitales (ND) en las dos
bandas consideradas. La elipse que limita
estos puntos, expresa gráficamente la
fuerza de la correlación entre las dos bandas, tanto mayor cuanto más se
aproxime a una recta, o dicho de otro modo cuanto mayor sea el contraste entre
los dos ejes de esa elipse (Chuvieco, 1990).
Ejemplo: como se observa en las figuras abajo la alta correlación que existe entre la banda 1 "azul" y la banda 2 "verde" (gráfica 1); la banda 2 "verde" y la banda 3 "Roja" (gráfica 2). "los datos representados en las gráficas son los mismos de la imagen utilizada en este ejercicio".
Ejemplo: como se observa en las figuras abajo la alta correlación que existe entre la banda 1 "azul" y la banda 2 "verde" (gráfica 1); la banda 2 "verde" y la banda 3 "Roja" (gráfica 2). "los datos representados en las gráficas son los mismos de la imagen utilizada en este ejercicio".
En términos sencillos, el proceso puede resumirse
en los siguientes pasos. A partir de la matriz de varianza-covarianza, se extraen los eigenvalores para
cada uno de los componentes. Los eigenvalores expresan
la longitud de cada uno de los nuevos componentes, y en última instancia, la
proporción de información original que retienen. El ACP deduce tantos
componentes como bandas originales, si bien el eigenvalor va disminuyendo progresivamente, del primero al
último, pues lo que se pretende es maximizar sucesivamente la
varianza extraída en el análisis. La
varianza original explicada por cada componente se calcula como la proporción
de su eigenvalor frente a la suma de
todos los eigenvalores (Chuvieco, 1990).
Software MultiSpec
Que es MultiSpec?
Es un programa gratuito
(Software free) para el análisis de datos o de
imágenes multiespectrales e hiperespectrales.
MultiSpec tiene sus orígenes en la
Universidad de Purdue, West Lafayette, IN. Hasta la fecha; sus
creadores David Landgrebe y Biehl Larry de la Escuela de
Ingeniería Eléctrica y Computación, ITAP y LARS; siguen con su desarrollo actualizando las nuevas versiones desde el 2000.
El objetivo del software es contar con una tecnología multi plataforma, robusta y gratuita; basada
fundamentalmente para el análisis de imágenes multiespectrales e hiperespectrales, y transferir esta tecnología a la
comunidad de usuarios de la manera más rápida posible. Por lo tanto el
resultado de la investigación se encuentra incorporado en Software y puesto a
disposición de la comunidad de usuarios a través de la página de
descarga. MultiSpec ©
Windows https://engineering.purdue.edu/~biehl/MultiSpec/download_win.html
Macintosh https://engineering.purdue.edu/~biehl/MultiSpec/download_mac.html
Nota
Para realizar el ejercicio es necesario contar con el software MultiSpec versión 3.3 el cual lo pueden descargar gratuitamente de la siguiente dirección:
https://engineering.purdue.edu/~biehl/MultiSpec/download_win.html
También es necesario contar con una imagen de satélite LandSat (MSS, TM o ETM) la cual también pueden descargar gratuitamente de la siguiente dirección:
También es necesario contar con una imagen de satélite LandSat (MSS, TM o ETM) la cual también pueden descargar gratuitamente de la siguiente dirección:
La imagen de satélite que se
utilizó para llevar a cabo los pasos en el presente manual; fue del sensor LandSat 5
TM, escena PAT 25-ROW 46; fecha de toma 4 de junio de 2011.
Posteriormente fue corregida atmosféricamente (algoritmo del objeto oscuro) y recortada (886 lineas y 1126
columnas) el área corresponde a la zona central del estado de Veracruz, México.
Pasos para realizar el análisis de componentes principales con el software MultiSpec
Pasos para realizar el análisis de componentes principales con el software MultiSpec
1.- Una vez bajado el archivo Zip con el nombre “MultiSpecWin32z” (El cual contiene
el programa). Lo descomprimimos en la unidad de nuestra preferencia (para mi caso lo descomprimi en la siguiente direccion C:\Documents and Settings\luis.alvarez\Mis
documentos\Downloads\).
2.- Después ingrese a la carpeta y ejecute el programa haciendo doble
click en el archivo ejecutable.
3.- Abierto el programa, nos dirigimos a la carpeta que contine nuestros
datos para visualizar la imagen de satélite. Por lo tanto seleccionamos el menú
File, submemú
Open Image.
Posteriormente nos dirigimos a la carpeta donde tenemos nuestros datos ( para nuestro
caso se en cuentran en D:\Manual “Archivo
L5025046_04620110406.tif” )
Posteriormente le damos click al boton abrir y nos despliega; dos
ventanas (Set
Display Specifications for y L5025046_04620110406) la primer ventana “Set
Display Specifications for:”
Como se observa en la figura a bajo, la ventana está integrada por tres
recuadros: el primero (Area to Display) despliega el tamaño de la
imagen, como se aprecia esta tiene un tamaño de 886 líneas y 1126 columnas; la
segundo recuadro (Display) contiene el número de bandas que se van a
desplegar y el arreglo, para este caso se desplegaran tres bandas con el
arreglo 432 (conocida como falso color), es decir, en el cañon Rojo- banda del
infrarojo cercano, cañon Verde- Banda roja y
cañon azul- banda verde y el tercer recuadro (Enhancement) contiene los
realces de contraste para la optimización visual de la imágen como se observa
para este caso se utlizará el metodo lineal con el 2% .
Hacemos click en el botón OK y
veremos que en la otra ventana se desplega nuestra imagen.
Nota: Si queremos desplegar
nuestra imagen con diferente arreglo de bandas, podemos desplegarla nuevamente
abriendo el archivo original repitiendo el paso 3 y cuando estemos en la
ventana “Set Display Specifications
for:” en el recuadro Display seleccionamos las bandas y arreglo. Por
ejemplo 321, 453, 543, 743, 754, etc.
4.- Obtención de información, Histograma y Estadísticas de la imagen; para llevar acabo este paso damos click al menú Processor y seleccionamos el submenú Histogram Image.
Posteriormente nos aparece una nueva ventana "Set Histogram Specifications", activamos la opción List Histogram Summari haciendo click en cuadro pequeño y hacemos click en OK
Posteriormente nos aparece en la ventana de Text Output los valores y estadísticas de la imagen; como se muestra abajo en la figura, en el recuadro rojo.
Pasos para la obtención de la Matriz para el Análisis de Componentes Principales ACP
Matriz Análisis de Componentes Principales ACP
Matriz de Transformación para la generación de los Componentes Principales
Pasos para la generación de los Componentes Principales
Visualización de Componentes 1, 2, 3- RGB
Buen día alguien sabe que método utilizaron los creadores del Software Multispec para realizar la descomposición en componentes principales. Existe algún articulo donde se describa el método. Saludos
ResponderEliminarEsta bueno el post, pero me parece que deberias hablar mas acerca de como eliges cada componente a la hora de buscar determinado material.
ResponderEliminar