Denominación de la asignatura

Aprendizaje Automático y Minería de Datos
Curso al que pertenece

Grado en Ingeniería Informática

Créditos ECTS
6
Curso y cuatrimestre en el que se imparte
Segundo cuatrimestre
Materia
Inteligencia Artificial y Sistemas Inteligentes II
Carácter de la asignatura Optativa

Presentación

La minería de datos es un proceso que permite extraer conocimiento a partir de grandes cantidades de datos. Esta asignatura tiene un enfoque práctico, centrándose principalmente en enseñar al alumno cómo procesar y analizar los datos para extraer información útil que ayude a resolver problemas y tomar decisiones. La minería de datos utiliza métodos estadísticos así como técnicas de inteligencia artificial, específicamente de la rama de aprendizaje automático.

En esta asignatura se explican conceptos y métodos estadísticos y de aprendizaje automático que se aplican en la minería de datos, tales como las técnicas para el aprendizaje de árboles de decisión, reglas de clasificación o asociación, generación de agrupamientos, los métodos bayesianos o las redes neuronales. Los diferentes temas, acompañados de ejemplos de aplicación, cubren diversas etapas del proceso de descubrimiento de conocimiento, desde el preprocesamiento de los datos, la generación del modelo de análisis a través de diferentes técnicas, hasta su evaluación.

El alumno, al finalizar la asignatura, podrá aplicar técnicas adecuadas a diversas distintas tareas de aprendizaje y análisis, podrá comparar los resultados y evaluar las técnicas con rigor. Mediante la aplicación de herramientas de minería de datos el alumno podrá ejecutar diferentes algoritmos para la resolución de problemas, interpretar el resultado de dichos algoritmos y su evaluación.

Competencias

Competencias básicas

  • CB1: Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio.
  • CB2: Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • CB3: Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • CB4: Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • CB5: Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.

Competencias generales

  • CG08: Conocimiento de las materias básicas y tecnologías, que capaciten para el aprendizaje y desarrollo de nuevos métodos y tecnologías, así como las que les doten de una gran versatilidad para adaptarse a nuevas situaciones.

Competencias específicas

  • CC07: Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.

Competencias transversales

  • CT1: Capacidad de innovación y flexibilidad en entornos nuevos de aprendizaje como es la enseñanza on-line.
  • CT2: Conocer, y utilizar con habilidad, los mecanismos básicos de uso de comunicación bidireccional entre profesores y alumnos, foros, chats, etc.
  • CT3: Utilizar las herramientas para presentar, producir y comprender la información que les permita transformarla en conocimiento.


Contenidos

Tema 1. Introducción a los procesos de descubrimiento de conocimiento
Perspectiva histórica de la minería de datos
Aproximación a los conceptos de aprendizaje automático, minería de datos y descubrimiento de conocimiento a partir de datos
Fases del proceso de descubrimiento de conocimiento a partir de datos
Tecnologías utilizadas en minería de datos
Aplicaciones y ejemplos
Referencias bibliográficas

Tema 2. Aprendizaje automático. Conceptos básicos
Definición de aprendizaje. Tareas básicas
Elementos que intervienen en el aprendizaje
Aprendizaje supervisado: descripción de conceptos
Aprendizaje no supervisado: descubrimiento de nuevos conceptos
Etapas del diseño de sistemas de aprendizaje automático
Referencias bibliográficas

Tema 3. Exploración y pre-procesamiento de los datos
Instancias y tipos de atributos
Descriptores estadísticos
Evaluación de la calidad de los datos
Limpieza de datos
Reducción de datos
Transformación de datos
Referencias bibliográficas

Tema 4. Árboles de decisión
Representación del conocimiento mediante árboles de decisión
Descripción de la tarea de inducción
Algoritmo básico de aprendizaje de árboles de decisión: ID3
Métodos de selección de atributos
Sobreajuste y poda de árboles
Simplificación de árboles de decisión mediante poda: algoritmo C4.5
Referencias bibliográficas

Tema 5. Evaluación de modelos clasificadores
Introducción
Métricas de evaluación
Métodos de validación
Comparación de modelos
Referencias bibliográficas

Tema 6. Aprendizaje de reglas de clasificación
Representación del conocimiento mediante reglas
Medidas de evaluación de reglas
Algoritmo de recubrimiento secuencial
Referencias bibliográficas

Tema 7. Redes neuronales
Introducción. Fundamento biológico
La neurona artificial. El Perceptrón
Redes Neuronales multicapa
Redes Neuronales recurrentes Hopfield Network
Referencias bibliográficas

Tema 8. Métodos bayesianos
Clasificador bayesiano
Redes bayesianas
Aprendizaje de redes bayesianas
Referencias bibliográficas

Tema 9. Predicción numérica
Regresión
Máquinas de vectores de soporte
Árboles de regresión y de modelos
Referencias bibliográficas

Tema 10. Métodos basados en instancias
Introducción
Método K-NN
Regresión local
Razonamiento basado en casos
Referencias bibliográficas

Tema 11. Descubrimiento de patrones
Conceptos
Algoritmo Apriori
Algoritmo FP-growth
Evaluación de patrones
Referencias bibliográficas

Tema 12. Descubrimiento de conceptos. Clustering
Conceptos. Tipos de agrupamientos
Medidas de similitud
Métodos exclusivos
Métodos jerárquicos
Métodos probabilistas
Evaluación de agrupamientos
Referencias bibliográficas


Metodología

Metodología

Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.

Las actividades formativas de esta asignatura son las siguientes:

  • Trabajos y Lecturas. Se trata de actividades de diferentes tipos: reflexión, análisis de casos, prácticas, etc. Además de análisis de textos relacionados con diferentes temas de la asignatura.
  • Participación en eventos. Son eventos programados todas las semanas del cuatrimestre: sesiones presenciales virtuales, foros de debate, test.
  • Laboratorios. Actividad práctica que se realiza en tiempo real e interactuando con otros alumnos. En el laboratorio los estudiantes tendrán que desarrollar los ejercicios propuestos en un entorno de simulación online. Los estudiantes contarán en todo momento con el apoyo de un tutor de laboratorio, que ayudará al
    alumno a desarrollar su actividad. El tutor de laboratorio podrá asignar grupos de alumnos para que, de forma
    colaborativa, alcancen los resultados solicitados. Este tipo de actividad posee un peso considerable en la
    evaluación continua del alumno, por lo que, a pesar de no ser obligatoria su realización, se recomienda firmemente la participación en los mismos.

En la programación semanal puedes consultar cuáles son las actividades concretas que tienes que realizar en esta asignatura.

Descarga el pdf de la programación

Estas actividades formativas prácticas se completan, por supuesto, con estas otras:

  • Estudio personal
  • Tutorías. Las tutorías se pueden articular a través de diversas herramientas y medios. Durante el desarrollo de la asignatura, el profesor programa tutorías en días concretos para la resolución de dudas de índole estrictamente académico a través de las denominadas “sesiones de consultas”. Como complemento de estas sesiones se dispone también del foro “Pregúntale al profesor de la asignatura” a través del cual se articulan algunas preguntas de alumnos y las correspondientes respuestas en el que se tratan aspectos generales de la asignatura. Por la propia naturaleza de los medios de comunicación empleados, no existen horarios a los que deba ajustarse el alumno.
  • Examen final presencial

Las horas de dedicación a cada actividad se detallan en la siguiente tabla:

ACTIVIDADES FORMATIVAS 
HORAS
% PRESENCIAL
Sesiones presenciales virtuales
15
100%
Lecciones magistrales
6
0
Estudio del material básico
50
0
Lectura del material complementario
25
0
Trabajos, casos prácticos, test
17
0
Prácticas de laboratorios virtuales
12
16,7%
Tutorías
16
30%
Trabajo colaborativo
7
0
Realización de examen final presencial
2
100%
Total
150

 


Puedes personalizar tu plan de trabajo seleccionando aquel tipo de actividad formativa que se ajuste mejor a tu perfil. El profesor-tutor te ayudará y aconsejará en el proceso de elaboración de tu plan de trabajo. Y siempre estará disponible para orientarte durante el curso.

Recomendaciones técnicas

Metodología

Para la correcta participación de los alumnos en las diferentes actividades propuestas en la asignatura se recomienda disponer de un ordenador con las siguientes especificaciones mínimas recomendadas:

  • 4 GB de RAM
  • Conexión a Internet superior a 6 Mbit/s
  • Cámara web
  • Micrófono
  • Altavoces o auriculares
  • Sistema operativo Windows o Mac OS (algunas actividades pueden presentar dificultades sobre Linux. En esta circunstancia se recomienda consultar con el profesor de la asignatura)
  • Acceso de administrador al sistema (es necesario la instalación de programas, emuladores, compiladores…)
  • Navegador web Netscape, Chrome, Safari o Firefox actualizado (versiones no actualizadas pueden presentar problemas funcionales y/o de seguridad)

Bibliografía

Bibliografía básica

La bibliografía básica es imprescindible para el estudio de la asignatura. Cuando se indica que no está disponible en el aula virtual, tendrás que obtenerla por otros medios: librería UNIR, biblioteca… 

Los textos necesarios para el estudio de la asignatura han sido elaborados por UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.

Además, en algunos temas deberás estudiar la siguiente bibliografía, disponible en el aula virtual en virtud del artículo 32.4 de la Ley de Propiedad Intelectual:

Tema 3

Pérez, C. & Santín, D. (2007). Minería de Datos: técnicas y herramientas. Madrid: Thomson Paraninfo.
ISBN: 978-84-9732-492-2

Temas 5

Hernández, J., Ramírez, M.J., Ferri, C. (2004). Introducción a la Minería de Datos. Pearson Prentice Hall.
ISBN: 978-84-205-4091-9

Temas 8 y 9

Hernández, J., Ramírez, M.J., Ferri, C. (2004). Introducción a la Minería de Datos. Pearson Prentice Hall.
ISBN: 978-84-205-4091-9

Sierra, B. (2006). Aprendizaje Automático: conceptos básicos y avanzados. Pearson Educación.
ISBN: 978-84-832-2318-5


Tema 10

Sierra, B. (2006). Aprendizaje Automático: conceptos básicos y avanzados. Pearson Educación.
ISBN: 978-84-832-2318-5

Pajares, G. & de la Cruz, J.M. (2010). Aprendizaje Automático. Un Enfoque Práctico. RaMa Editorial.
ISBN: 978-84-996-4011-2

Bibliografía complementaria

Gurney, K. (1997). An Introduction to Neural Networks. London: UCL Press.

Han, J., Kamber, M., & Pei, J. (2012). Data mining: concepts and technique. San Francisco: Morgan Kaufmann.

Haykin, S. (1998). Neural Networks: A Comprehensive Foundation. Prentice Hall.

Kolodner, J. (1993). Case-Based Reasoning. Morgan Kaufmann.

Mitchell, T.M. (1997). Machine Learning. McGraw-Hill. 

Negnevitsky, M. (2005). Artificial Intelligence. A Guide to Intelligent Systems. UK: Addison-Wesley.

Nisbet, R., Elder, J., y Miner, G. (2009). Handbook of Statistical Analysis and Data Mining Applications. Elsevier.

Shawe-Taylor, J. & Cristianini, N. (2000). Support Vector Machines and other kernel-based learning methods. Cambridge University Press.

Witten, I.H. & Frank, E. (2005). Data Mining. Morgan Kaufmann Publishers.

evaluación

Evaluación y calificación

El sistema de calificación se basa en la siguiente escala numérica:

0 - 4, 9

Suspenso

(SS)

5,0 - 6,9

Aprobado

(AP)

7,0 - 8,9

Notable

(NT)

9,0 - 10

Sobresaliente

(SB)

La calificación se compone de dos partes principales:

calificación

El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL y OBLIGATORIO. Supone el 60% de la calificación final (6 puntos sobre 10) y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO (es decir, obtener 3 puntos de los 6 totales del examen).

La evaluación continua supone el 40% de la calificación final (es decir, 4 puntos de los 10 máximos). Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.

Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua es de 15 puntos. Así, puedes hacer las que prefieras hasta conseguir un máximo de 10 puntos (que es la calificación máxima que se puede obtener en la evaluación continua). En la programación semanal de la asignatura, se detalla la calificación máxima de cada actividad o evento concreto puntuables.

SISTEMA DE EVALUACIÓN 
PONDERACIÓN MIN. 
PONDERACIÓN MÁX. 
Prueba de evaluación final presencial
60%
60%
Evaluación de prácticas de laboratorios virtuales
0%
40%
Resolución de trabajos, proyectos y casos
0%
40%
Participación en foros y otros medios participativos
0%
40%

 

 

Ten en cuenta…
Si quieres presentarte sólo al examen final, tendrás que obtener una calificación de 5 puntos sobre 6 para aprobar la asignatura.

Profesorado

Elena Verdú Pérez

Formación: Doctora por la Universidad de Valladolid e Ingeniera de Telecomunicación.

Experiencia: Experiencia Académica: Profesora Adjunta en la Escuela de Ingeniería de la UNIR. Ha sido previamente investigadora en la Universidad de Valladolid, siendo responsable de la dirección técnica del proyecto Intuitel del Séptimo Programa Marco de la Unión Europea. b. Acreditación de Profesor de Universidad Privada (ANECA). Durante 1 año y medio, Profesora Colaboradora en la Escuela de Ingeniería de la UNIR. Durante 9 años, Profesora Asociada en la Escuela Técnica Superior de Ingenieros de Telecomunicación de la Universidad de Valladolid. Co-autora de 7 artículos publicados en revistas indexadas en Journal Citation Reports (JCR). Co-editora de 3 libros, uno de los cuales ha sido publicado por la editorial Ariel, situada en la segunda posición del Ranking SPI (Scholarly Publishers Indicators) 2014. d. Coordinadora de Investigación del Centro Tecnológico CEDETEL (Centro para el Desarrollo de las Telecomunicaciones de Castilla y León) durante 1 año. Experiencia Profesional: a. 12 años de experiencia profesional en el sector TIC. Jefe de Proyectos del Centro Tecnológico CEDETEL (Centro para el Desarrollo de las Telecomunicaciones de Castilla y León) durante más de 10 años.

Líneas de investigación: Sistemas tutores inteligentes, minería de datos aplicada a la educación, sistemas de aprendizaje competitivo y sistemas inteligentes para servicios web de mapas.

Orientaciones para el estudio

Orientación para el estudio

Obviamente, al tratarse de formación on-line puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de actividades, trabajos y exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:

  1. Desde el Campus virtual podrás acceder al aula virtual de cada asignatura en la que estés matriculado y, además, al aula virtual del Grado. Aquí podrás consultar la documentación disponible sobre cómo se utilizan las herramientas del aula virtual y sobre cómo se organiza una asignatura en la UNIR y también podrás organizar tu plan de trabajo personal con tu profesor-tutor.
  2. Observa la programación semanal. Allí te indicamos qué parte del temario debes trabajar cada semana.
  3. Ya sabes qué trabajo tienes que hacer durante la semana. Accede ahora a la sección Temas del aula virtual. Allí encontrarás el material teórico y práctico del tema correspondiente a esa semana.
  4. Comienza con la lectura de las Ideas clave del tema. Este resumen te ayudará a hacerte una idea del contenido más importante del tema y de cuáles son los aspectos fundamentales en los que te tendrás que fijar al estudiar el material básico. Lee siempre el primer apartado, ¿Cómo estudiar este tema?, porque allí te especificamos qué material tienes que estudiar. Consulta, además, las secciones del tema que contienen material complementario (Lo + recomendado y + Información).
  5. Dedica tiempo al trabajo práctico (sección Actividades y Test). En la programación semanal te detallamos cuáles son las actividades correspondientes a cada semana y qué calificación máxima puedes obtener con cada una de ellas.
  6. Te recomendamos que participes en los eventos del curso (sesiones presenciales virtuales, foros de debate…). Para conocer la fecha concreta de celebración de los eventos debes consultar las herramientas de comunicación del aula vitual. Tu profesor y tu profesor-tutor te informarán de las novedades de la asignatura.
En el aula virtual del Grado encontrarás siempre disponible la documentación donde te explicamos cómo se estructuran los temas y qué podrás encontrar en cada una de sus secciones: Ideas clave, Lo + recomendado, + Información, Actividades y Test.

Ten en cuenta estos consejos…

  • Sea cual sea tu plan de estudio, accede periódicamente al aula virtual, ya que de esta forma estarás al día de las novedades del curso y en contacto con tu profesor y con tu profesor tutor.
  • Recuerda que no estás solo: consulta todas tus dudas con tu profesor-tutor utilizando el correo electrónico. Si asistes a las sesiones presenciales virtuales también podrás preguntar al profesor sobre el contenido del tema. Además, siempre puedes consultar tus dudas sobre el temario en los foros que encontrarás en cada asignatura (Pregúntale al profesor).
  • ¡Participa! Siempre que te sea posible accede a los foros de debate y asiste a las sesiones presenciales virtuales. El intercambio de opiniones, materiales e ideas nos enriquece a todos.
  • Y ¡recuerda!, estás estudiando con metodología online: tu esfuerzo y constancia son imprescindibles para conseguir buenos resultados. ¡No dejes todo para el último día!