domingo, 24 de noviembre de 2013

UNIDAD 5


Procesamiento de imágenes


EL PROCESAMIENTO de imágenes tiene como objetivo mejorar el aspecto de las imágenes y hacer más evidentes en ellas ciertos detalles que se desean hacer notar. La imagen puede haber sido generada de muchas maneras, por ejemplo, fotográficamente, o electrónicamente, por medio de monitores de televisión. El procesamiento de las imágenes se puede en general hacer por medio de métodos ópticos, o bien por medio de métodos digitales, en una computadora. En la siguiente sección describiremos muy brevemente estos dos métodos, pero antes se hará una síntesis brevísima de los principios matemáticos implícitos en ambos métodos, donde el teorema de Fourier es el eje central.

El matemático Jean-Baptiste-Joseph Fourier (1768-1830) nació en Auxerre, alrededor de 160 km al sureste de París. Perdió a sus padres a la temprana edad de ocho años, quedando al cuidado del obispo de Auxerre, gracias a la recomendación de una vecina. Desde muy pequeño mostró una inteligencia y vivacidad poco comunes. Siguió una carrera religiosa en una abadía, al mismo tiempo que estudiaba matemáticas, para más tarde dedicarse a impartir clases. Sus clases eran muy amenas, pues constantemente mostraba una gran erudición y conocimientos sobre los temas más variados.

Fourier estaba muy interesado en la teoría del calor, y además tenía una gran obsesión práctica por él. Se dice que mantenía su habitación tan caliente que era muy incómoda para quienes lo visitaban, y que aparte de eso, siempre llevaba puesto un grueso abrigo. Algunos historiadores atribuyen esta excentricidad a los tres años que pasó en Egipto con el ejército de Napoleón Bonaparte.

La teoría de Fourier se consideró tan importante desde de sus inicios, que lord Kelvin dijo de ella: "El teorema de Fourier no solamente es uno de los resultados más hermosos del análisis moderno, sino que además se puede decir que proporciona una herramienta indispensable en el tratamiento de casi todos los enigmas de la física moderna."

El teorema de Fourier afirma que una gráfica o función, cualquiera que sea su forma, se puede representar con alta precisión dentro de un intervalo dado, mediante la suma de una gran cantidad de funciones senoidales, con diferentes frecuencias. Dicho de otro modo, cualquier función, sea o no sea periódica, se puede representar por una superposición de funciones periódicas con diferentes frecuencias. El teorema nos dice de qué manera se puede hacer esta representación, pero hablar de él va más allá del objeto de este libro.

La variación de la irradiancia o brillantez de una imagen, medida a lo largo de una dirección cualquiera es entonces una función que se puede representar mediante el teorema de Fourier, con una suma de distribuciones senoidales de varias frecuencias. Sin entrar en detalles técnicos innecesarios, simplemente afirmaremos aquí que atenuar o reforzar individualmente algunas de estas componentes senoidales puede tener un efecto dramático en la calidad de una imagen, mejorándola o empeorándola, según el caso. Este es el fundamento del procesamiento de imágenes, tanto por medios ópticos como digitales, que ahora describiremos.

 

PROCESAMIENTO ÓPTICO

 
Los principios del procesamiento óptico de imágenes están bien establecidos desde el siglo pasado, cuando se desarrolló la teoría de la difracción de la luz. Sin embargo, su aplicación práctica data apenas del principio de la década de los sesenta, cuando se comenzó a disponer del rayo láser.

El procesamiento óptico se basa en el hecho de que la imagen de difracción de Fraunhofer de una transparencia colocada en el plano focal frontal de una lente es una distribución luminosa que representa la distribución de las frecuencias de Fourier que componen la imagen, a la que se le llama técnicamente transformada de Fourier.

Consideremos el arreglo óptico de la figura 42. En el plano focal frontal de la lente L1 se ha colocado la transparencia T, la cual está siendo iluminada por un haz de rayos paralelos provenientes de un láser de gas. Sobre el plano focal F1 de la lente L1 se forma una distribución luminosa que representa la transformada de Fourier de la transparencia. Si ahora se coloca otra lente L2 como se muestra en la misma figura, se puede formar una imagen de la transparencia en el plano focal F2 de esta lente. Si ahora se coloca cualquier objeto o diafragma sobre el plano F1, se pueden eliminar las porciones que se deseen de la transformada de Fourier de la transparencia, eliminando así de la imagen las frecuencias de Fourier deseadas.

Cada porción de la transformada de Fourier corresponde a una frecuencia espacial diferente sobre el objeto. Por lo tanto, mediante los diafragmas adecuados se pueden eliminar las frecuencias espaciales, llamadas también de Fourier, que se deseen quitar.

PROCESAMIENTO DIGITAL

Al igual que en el caso del procesamiento óptico, los principios fundamentales del procesamiento digital de imágenes están establecidos hace muchos años, pero no se llevaban a cabo debido a la falta de computadoras. Con la aparición de las computadoras de alta capacidad y memoria, era natural que se comenzara a desarrollar este campo. Uno de los primeros lugares donde se empezó a realizar el procesamiento digital fue en el Jet Propulsion Laboratory, en 1959, con el propósito de mejorar las imágenes enviadas por los cohetes. Los resultados obtenidos en un tiempo relativamente corto fueron tan impresionantes que muy pronto se extendieron las aplicaciones del método a otros campos.

El procesamiento digital de imágenes se efectúa dividiendo la imagen en un arreglo rectangular de elementos, como se muestra en la figura 43. Cada elemento de la imagen así dividida se conoce con el nombre de pixel. El siguiente paso es asignar un valor numérico a la luminosidad promedio de cada pixel. Así, los valores de la luminosidad de cada pixel, con sus coordenadas que indican su posición, definen completamente la imagen.

Todos estos números se almacenan en la memoria de una computadora.

El tercer paso es alterar los valores de la luminosidad de los pixeles mediante las operaciones o transformaciones matemáticas necesarias, a fin de hacer que resalten los detalles de la imagen que sean convenientes. El paso final es pasar la representación de estos pixeles a un monitor de televisión de alta definición, con el fin de mostrar la imagen procesada.

 

UTILIDAD DEL PROCESAMIENTO DE IMÁGENES


La utilidad del procesamiento de imágenes es muy amplia y abarca muchos campos. Un ejemplo son las imágenes obtenidas con fines de diagnóstico médico. Otro ejemplo son las imágenes aéreas obtenidas para realizar exámenes del terreno. Mediante este método se pueden analizar los recursos naturales, las fallas geológicas del terreno, etcétera.

Visión por computadora


La visión por computadora es una rama de la inteligencia artificial que tiene por objetivo modelar matemáticamente los procesos de percepción visual en los seres vivos y generar programas que permitan simular estas capacidades visuales por computadora.

Historia

Sus antecedentes se remontan a los años veinte, cuando se mejoró la calidad de las imágenes digitalizadas de los periódicos, enviadas por cable submarino entre Londres y Nueva York. Actualmente existen vehículos autónomos que han viajado de costa a costa en Estados Unidos y sólo han sido asistidos por un operador humano, el 3% del tiempo.[Carnegie Mellon University] [González & Woods].

Terminología

El proceso de visión por computadora puede subdividirse en seis áreas principales:
1. Sensado: Es el proceso que nos lleva a la obtención de una imagen visual
2. Preprocesamiento: Trata de las técnicas de reducción de ruido y enriquecimiento de detalles en la imagen
3. Segmentación: Es el proceso que particiona una imagen en objetos de interés.
4. Descripción: Trata con el cómputo de características útiles para diferenciar un tipo de objeto de otro.
5. Reconocimiento: Es el proceso que identifica esos objetos.
6. Interpretación: Asigna un significado a un conjunto de objetos reconocidos.

 

Animación por computadora

ANIMACIÓN GENERADA POR COMPUTADORA.


La animación por computadora (también llamada animación digital, animación informática o animación por ordenador) es la técnica que consiste en crear imágenes en movimiento mediante el uso de ordenadores o computadoras. Cada vez más los gráficos creados son en 3D, aunque los gráficos en 2Dtodavía se siguen usando ampliamente para conexiones lentas y aplicaciones en tiempo real que necesitan renderizar rápido. Algunas veces el objetivo de la animación es la computación en sí misma, otras puede ser otro medio, como una película. Los diseños se elaboran con la ayuda de programas de diseño, modelado y por último renderizado.
Para crear la ilusión del movimiento, una imagen se muestra en pantalla sustituyéndose rápidamente por una nueva imagen en un fotograma diferente. Esta técnica es idéntica a la manera en que se logra la ilusión de movimiento en las películas y en la televisión.
Para las animaciones 3D, los objetos se modelan en la computadora (modelado) y las figuras 3D se unen con un esqueleto virtual (huesos). Para crear una cara en 3D se modela el cuerpo, ojos, boca, etc. del personaje y posteriormente se animan con controladores de animación. Finalmente, se renderiza la animación.
En la mayor parte de los métodos de animación por ordenador, un animador crea una representación simplificada de la anatomía de un personaje, pues tiene menos dificultad para ser animada. En personajes bípedos o cuadrúpedos, muchas partes del esqueleto del personaje corresponden a los huesos reales. La animación con huesos también se utiliza para animar otras muchas cosas, tales como expresiones faciales, un coche u otro objeto que se quiera dotar de movimiento.
En contraste, otro tipo de animación más realista sería la captura de movimiento, que requiere que un actor vista un traje especial provisto de sensores, siendo sus movimientos capturados por una computadora y posteriormente incorporados en el personaje.
Para animaciones 3D, los fotogramas deben ser renderizados después de que el modelo es completado. Para animaciones vectoriales 2D, el proceso de renderizado es clave para el resultado. Para grabaciones grabadas anticipadamente, los fotogramas son convertidos a un formato diferente o a un medio como una película o video digital. Los fotogramas pueden ser renderizados en tiempo real, mientras estos son presentados al usuario final. Las animaciones para transmitir vía Internet en anchos de banda limitados (ejem. 2D Flash, X3D) utilizan programas en el ordenador del usuario para renderizar en tiempo real la animación como una alternativa para la transmisión y para animaciones pre-cargadas para enlaces de alta velocidad.

ANIMACIÓN POR COMPUTADORA.

Se elige un fondo de pantalla como el negro. En este caso, se dibuja una cabra en la parte derecha de la pantalla. El siguiente paso es volver a poner negra la pantalla y colocar la cabra en una posición ligeramente a la izquierda de la posición original. Este proceso se repite moviendo la cabra un poco más a la izquierda cada vez. Si este proceso es repetido lo suficientemente rápido, parecerá que la cabra se mueve suavemente hacia la izquierda. Este procedimiento básico es utilizado para todas las animaciones creadas en películas y televisión.
La cabra en movimiento es un ejemplo de como modificar la ubicación de un objeto. Transformaciones más complejas de las propiedades de un objeto como el tamaño, forma, efectos de luz o color, requieren cálculos y renderizar por medio de la computadora en lugar de un sencillo procedimiento de duplicar o re-dibujar imágenes.
Explicación
Para engañar al ojo y al cerebro para que alguien piense que está viendo un objeto en movimiento, las imágenes deben ser mostradas a alrededor de 12 imágenes o marcos por segundo o más rápido. Con velocidades superiores a los 70 frames/segundo, no se notará una mejoría en el realismo o suavidad en el movimiento de la imagen debido a la manera en que el ojo y cerebro procesan las imágenes. A velocidades menores a 12 frames/segundo la mayoría de las personas podrán detectar un parpadeo en el momento en que se muestre la secuencia de imágenes y disminuirá la ilusión de un movimiento realista. Animaciones convencionales realizadas a mano, normalmente utilizan 15 frames/segundo con el objetivo de disminuir la cantidad de dibujo que se requiere, pero esto es normalmente aceptado debido a la naturaleza de los dibujos animados. Por esto, para crear una animación por ordenador realista, se requiere una cantidad superior de frames/segundo.
El motivo de que a altas velocidades no sea perceptible el parpadeo de la imagen, es por la «persistencia de la visión». De momento a momento, el ojo y cerebro trabajando juntos almacenan cualquier cosa que se esté mirando por una fracción de segundos, y automáticamente realiza «saltos» pequeños y suaves. Las películas que se exhiben en los cines, corren a 24 frames/segundo, que es suficiente para crear esta ilusión de movimiento continuo.

MÉTODOS PARA ANIMAR PERSONAJES VIRTUALES


Sintel, un ejemplo de un cortometraje generado por computadora.
En la mayor parte de los sistemas de animación 3D, un animador crea una representación simplificada del cuerpo del personaje, análogo a unesqueleto o stick figure. La posición de cada segmento del modelo del esqueleto es definida por «variables de la animación», o Avars
.
En personajes humanos y animales, muchas partes del modelo de esqueleto corresponden a la ubicación real de los huesos, pero la animación del modelo de esqueleto skeletal animation es también utilizada para animar otras cosas, como expresiones faciales (a pesar de que existen otros métodos de animación facial facial animation). «Woody», el personaje de Toy Story, por ejemplo, usa 700 Avars, incluyendo 100 Avars en la cara. La computadora no renderiza el modelo de esqueleto directamente de forma habitual render el esqueleto es invisible, pero usa el modelo de esqueleto para calcular la posición exacta y la orientación del personaje, que es eventualmente renderizado en una imagen. Cambiando los valores de los Avars sobre la línea de tiempo, el animador crea movimiento realizando el personaje cuadro por cuadro.
Existen varios métodos para generar los valores de Avars para obtener un movimiento realista. Tradicionalmente, los animadores manipulan los Avars directamente. En lugar de crear Avars para cada cuadro, usualmente colocan los Avars en puntos estratégicos de los cuadros y permiten a la computadora realizar la transición entre ellos, este proceso es llamado keyframing. Keyframing pone el control en las manos del animador, y está basado en la animación manual traditional animation.
En contraste, un método nuevo llamado «captura de movimiento» (motion capture), utiliza acción real (live action). Cuando la animación por ordenador es realizada por esta técnica, un actor real realiza la escena como si fuera el personaje a ser animado. Su movimiento es grabado en una computadora utilizando cámaras de vídeo y marcadores, y ese movimiento es aplicado al personaje animado.
Cada método tiene sus ventajas, y hasta el 2007, juegos y películas utilizaban alguno o ambos de ellos en sus producciones. La animación por cuadros puede producir movimientos que serían imposibles de realizar para un actor, mientras que la «captura de movimiento» puede reproducir las características de un actor en particular. Por ejemplo, en la película del 2006 Pirates of the Caribbean: Dead Man's Chest, el actor Bill Nighy realizó el personaje Davy Jones. Incluso aunque él prácticamente no aparece en la película, la producción se benefició grabando las características de su lenguaje corporal, posturas, expresiones faciales, etc. Esta «captura de movimiento» es apropiada en situaciones en las que se requiere un comportamiento realista, pero que las características de un personaje excede lo que se puede realizar con maquillaje y vestuario convencional.
Ha habido casos de animaciones excelentes en diversas películas, la de Final Fantasy The Spirits Within, el cabello de Violeta en Los Increíbles, la animación de escenarios en Toy Story, el movimiento del cabello de Tifa al viento en Final Fantasy Advent Children, la animación del agua en la Danza del Agua del videojuego Final Fantasy X y la creación de monstruos en Monstruos, S.A. (Monsters Inc.).






 






Bibliografía
http://es.wikipedia.org/wiki/Animaci%C3%B3n_por_computadora

http://www.depi.itch.edu.mx/apacheco/expo/html/ai11/vision.html

http://www.lania.mx/spanish/actividades/newsletters/1999-primavera-verano/aplicaciones.html

[González & Woods] R.C. González, and R.E. Woods, "Digital Image Processing" Addison-Wesley, 1993

http://www.cs.cmu.edu/afs/cs/project/alv/member/www/navlab_home_page.html

Vega J, "Visión por computadora". Facultad de Ingeniería UACH 1998, p. 1,2

http://home.talkcity.com/arpeggioav/templarhawk/InteligenciaArtificial.htm


No hay comentarios:

Publicar un comentario