Última revisión realizada: 23/05/2022
Denominación de la asignatura |
Percepción Computacional |
Máster al que pertenece |
Máster Universitario en Inteligencia Artificial |
Créditos ECTS |
6 |
Cuatrimestre en el que se imparte |
Primer cuatrimestre |
Carácter de la asignatura | Obligatoria |
En los humanos, la adquisición de conocimiento del entorno comienza con los datos obtenidos a través de los sentidos. En los sistemas artificiales se trata de emular los procesos de percepción usando modelos de la visión humana, la comprensión del habla y el procesamiento de otras señales sensoriales.
En esta asignatura se proporcionarán las herramientas necesarias para entender cuáles son los elementos esenciales en la percepción computacional entendida como la capacidad que posee una inteligencia artificial de realizar las funciones de comprensión humana, principalmente la visión y el habla.
La percepción computacional ofrece multitud de retos desde el punto de vista matemático (algoritmos, preprocesamiento, filtrado, segmentación, etc.) como desde el de la ingeniería informática (optimización, rapidez, precisión de los algoritmos, etc.).
Esta asignatura presentará una visión global de cómo se ha afrontado en el estado del arte la percepción computacional, centrándonos de forma particular y detallada en algunos de los enfoques más comunes (detección de bordes o segmentación) así como enfoques más avanzados (filtros de Gabor, extracción de características invariantes al escalado, entre otros).
El alumno será capaz de afrontar problemas que involucren cualquier área de percepción humana (visión y oído), siendo capaz de procesar dicha información y extraer los aspectos más significativos para la toma de decisiones.
Finalmente, esta asignatura permitirá entender cómo se resuelven problemas actuales, como pueden ser el self-driving car, el procesamiento del habla o la comprensión avanzada y la detección de objetos dentro de imágenes.
Competencias básicas.
Competencias generales.
Competencias específicas:
Competencias transversales:
Tema 1. Introducción a los sistemas de percepción
Objetivos
Funcionamiento del sistema auditivo
Percepción visual
Tema 2. Elementos de un sistema de percepción
Objetivos
Descubriendo los elementos esenciales de un sistema de percepción
Captura de información
Procesamiento de la información
Toma de decisión
Referencias bibliográficas
Tema 3.Captura y digitalización de señales
Objetivos
Introducción
Sistemas de conversión analógico-discreto
Muestreo y cuantificación
Tema 4. Fuentes y tipos de ruido
Entropía: Concepto y estimación
Fuentes perturbadoras de las señales
Caracterización matemática del ruido: procesos estocásticos
Tema 5. Detección y cancelación de anomalías
Definición de anomalía
Métodos de identificación de anomalías
Eliminación de anomalías
Referencias bibliográficas
Tema 6. Procesamiento de imagen. Operaciones elementales
Ajuste de intensidad
Procesado sistemático del histograma
Suavizado y realce mediante operadores aritméticos
Referencias bibliográficas
Tema 7. Preprocesamiento de imagen. Operaciones espaciales
Filtros paso bajo y paso alto
Detección de bordes
Referencias bibliográficas
Tema 8. Procesamiento de imagen. Morfología matemática
Introducción a la morfología matemática
Definición de elemento estructural
Erosión y dilatación
Apertura y clausura
Gradiente morfológico
Top Hat
Ejercicio práctico
Referencias bibliográficas
Tema 9. Procesamiento de señales. Filtrado y análisis en frecuencia
Objetivos
Introducción al análisis en frecuencia
La transformada de Fourier
Transformada discreta de Fourier (DFT) y su implementación mediante Fast Fourier Transform (FFT)
Tema 10. Procesamiento de imagen. Crecimiento de regiones
Segmentación y crecimiento de regiones
Técnicas empleadas en el crecimiento de regiones
Crecimiento de regiones basado en semillas
Crecimiento de regiones basado en Split and Merge
Crecimiento de regiones basado en Gradient Vector Flow (GVF)
Crecimiento de regiones basado en Watershed
Crecimiento de regiones basado en grafos
Referencias bibliográficas
Tema 11. Extracción de características. Propiedades estadísticas y frecuenciales de la señal
Caracterización de señales en el dominio natural
Características derivadas del análisis en frecuencia
Tema 12. Extracción de características. Caracterización de textura en imágenes
Matriz de coocurrencia de Haralick
Patrones binarios locales
Caracterización basada en transformadas unitarias
Referencias bibliográficas
Tema 13. Extracción de características. Procesamientos multiescala y métodos avanzados
Introducción a la extracción de características basada en procesamientos multiescala
Definición de transformada Wavelet
Filtros de Gabor
Transformada SIFT
Referencias bibliográficas
Tema 14. Decisión. Principios e implementación de algoritmos de ayuda en la toma de decisiones
Clasificación y reconocimiento de patrones
Aplicación de técnicas machine learning al procesado de señales
Tema 15. Aplicaciones actuales del tratamiento de la señal
Biometrics
Self-driving car
Retos y limitaciones de la percepción computacional
Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.
Las actividades formativas de esta asignatura son las siguientes:
En la programación semanal puedes consultar cuáles son las actividades concretas que tienes que realizar en esta asignatura.
Estas actividades formativas prácticas se completan, por supuesto, con estas otras:
Las horas de dedicación a cada actividad se detallan en la siguiente tabla:
ACTIVIDADES FORMATIVAS | HORAS |
Sesiones Presenciales Virtuales | 15 |
Recursos didácticos audiovisuales | 6 |
Estudio Personal de material básico | 52 |
Lectura de material complementario | 25 |
Práctica de laboratorios virtuales | 12 |
Trabajos, casos prácticos y test de evaluación | 17 |
Tutoría individual y grupal | 16 |
Trabajo colaborativo | 7 |
Total |
150 |
Bibliografía básica.
Los textos necesarios para el estudio de la asignatura han sido elaborados por la UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.
Bibliografía complementaria.
Alain, C. et al. (2001). «What» and «where» in the human auditory system. Proceedings of the National Academy of Sciences, 98(21), 12301-12306.
Alberola, C. (2004). Probabilidad, variables aleatorias y procesos estocásticos. Valladolid: Universidad de Valladolid. Secretariado de Publicaciones e Intercambio Editorial. ISBN: 978-84-8448-307-6.
Atchison, D. y Smith, G. (2000). Optics of the human eye (pp. 34-35). Oxford: Butterworth-Heinemann.
Bhuyan, M. K. (2019). Computer Vision and Image Processing: Fundamentals and Applications. Florida: CRC Press.
Bishop, C. M. (1995). Neural networks for pattern recognition. Oxford: Oxford University Press.
González, R. C. y Woods R. E. (2007). Digital image processing. Upper Saddle River: Prentice-Hall, Inc.
Lim, J. S. (1990). Two-dimensional signal and image processing. Upper Saddle River: Prentice-Hall, Inc.
Moore, J. K. y Linthicum F. H. Jr. (2007). The human auditory system: a timeline of development. International journal of audiology, 46(9), 460-478.
Nixon, M. y Aguado, A. (2019). Feature extraction and image processing for computer vision. Massachusetts: Academic Press.
Oppenheim, A. V. (1983). Signals and systems. Upper Saddle River: Prentice-Hall, Inc.
Oppenheim, A. V. y Schafer, R. W. (2009). Discrete-Time Signal Processing. Upper Saddle River: Prentice-Hall, Inc.
Singh, H. (2019). Practical Machine Learning and Image Processing. Nueva York: Apress.
Thorpe, S., Fize, D. y Marlot, C. (1996). Speed of processing in the human visual system. Nature: International Journal of Science, 81, 520-522.
Young, S. S. (2001). Computerized data acquisition and analysis for the life sciences. Cambridge: Cambridge University Press.
El sistema de calificación se basa en la siguiente escala numérica:
0 - 4, 9 |
Suspenso |
(SS) |
5,0 - 6,9 |
Aprobado |
(AP) |
7,0 - 8,9 |
Notable |
(NT) |
9,0 - 10 |
Sobresaliente |
(SB) |
La calificación se compone de dos partes principales:
CALIFICACIÓN | EXAMEN FINAL | 60% | |
EVALUACIÓN CONTINUA | 40% |
El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL U ONLINE Y OBLIGATORIO. Supone el 60% de la calificación final y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO.
La evaluación continua supone el 40% de la calificación final. Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.
Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua permite que realices las que prefieras hasta conseguir el máximo puntuable mencionado en la programación semanal. En ella se detalla la calificación máxima de cada actividad o evento concreto puntuables.
El sistema de evaluación de la asignatura es el siguiente:
SISTEMA DE EVALUACIÓN |
PONDERACIÓN |
PONDERACIÓN |
Participación en sesiones, foros y laboratorios |
0 % |
40 % |
Realización de trabajos, proyectos y casos |
0 % |
40 % |
Prácticas de laboratorio virtual |
10 % |
40 % |
Test de evaluación |
0 % |
40 % |
Examen final |
60 % |
60 % |
Alberto de Santos Sierra
Formación académica: Doctor Ingeniero de Telecomunicaciones (Cum Laude y Premio Extraordinario de Doctorado) por la Universidad Politécnica de Madrid en 2012. Su tesis doctoral aplicaba el reconocimiento de patrones y la visión por computador al reconocimiento biométrico de personas en dispositivos móviles.
Experiencia: Actualmente es Senior Data Scientist en Vodafone y cocreador de Koulu (plataforma de Inteligencia Artificial aplicada a la enseñanza de matemáticas en cursos superiores). Previamente, fue Lead Data Scientist en Hewlett-Packard Enterprise. Líneas de investigación: Alberto de Santos posee más de 45 publicaciones en temas de procesamiento de señales e imágenes aplicadas a la biometría, así como una patente en detección de estrés y lógica difusa. Sus intereses se centran, además, en la visualización y representación de datos.
José Víctor Marcos Martín
Formación académica: Doctor en Tecnologías de la Información y las Telecomunicaciones e ingeniero de Telecomunicación por la Universidad de Valladolid.
Experiencia: En 2016 se une a Vodafone como Data Scientist. Previamente, ha desarrollado su carrera profesional en otras compañías en el sector de las TIC. Su trayectoria investigadora se inicia en 2006, centrándose en el diseño e implementación de nuevas técnicas para el tratamiento de señales e imágenes. En este tiempo, desarrolla su labor en el Instituto de Óptica del CSIC y en el Grupo de Ingeniería Biomédica de la Universidad de Valladolid. Líneas de investigación: Ha publicado más de quince artículos JCR en revistas internacionales y ha participado en más de treinta congresos y conferencias relacionadas con el procesado de señal e imagen. Su tesis doctoral fue distinguida con el Premio Extraordinario de Doctorado de la Universidad de Valladolid.Obviamente, al tratarse de formación on-line puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de actividades, trabajos y exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:
Recuerda que en el aula virtual de Lo que necesitas saber antes de empezar puedes consultar el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Sesiones presenciales virtuales, Envío de actividades, etc.
Ten en cuenta estos consejos…
|