Última revisión realizada: 23/05/2022

Denominación de la asignatura: Aprendizaje Automático y Minería de Datos
Grado al que pertenece: Grado en Ingeniería Informática
Créditos ECTS: 6
Cuatrimestre en el que se imparte: Segundo
Carácter de la asignatura: Optativa
Materia a la que pertenece: Inteligencia Artificial y Sistemas Inteligentes II

Presentación

El principal objetivo de esta asignatura es introducir al estudiante de grado, de forma práctica, conocimientos sólidos de programación en la inteligencia artificial, data mining y el análisis de datos. Para dicha finalidad, se hará un repaso muy breve por la mayor parte de las áreas de conocimiento de esta disciplina.

Para las sesiones prácticas se usará Python (www.python.org), ya que es el software clave junto con R (www.r-project.org). Se incluyen en el temario tanto aspectos básicos del análisis y visualización de datos, como métodos avanzados, como son las redes de neuronas. Además, trataremos también el análisis de textos y sentimientos.

Competencias básicas

  • CB1: Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio.
  • CB2: Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • CB3: Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • CB4: Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • CB5: Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.

Competencias generales

  • CG08: Conocimiento de las materias básicas y tecnologías, que capaciten para el aprendizaje y desarrollo de nuevos métodos y tecnologías, así como las que les doten de una gran versatilidad para adaptarse a nuevas situaciones.

Competencias específicas

  • CC07: Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.

Competencias transversales

  • CT1: Capacidad de innovación y flexibilidad en entornos nuevos de aprendizaje como es la enseñanza online.
  • CT2: Conocer, y utilizar con habilidad, los mecanismos básicos de uso de comunicación bidireccional entre profesores y alumnos, foros, chats, etc.
  • CT3: Utilizar las herramientas para presentar, producir y comprender la información que les permita transformarla en conocimiento.

Tema 1. Introducción a los procesos de descubrimiento del conocimiento

  • Introducción y objetivos
  • Conceptos clave
  • Perspectiva histórica
  • Etapas
  • Técnicas utilizadas
  • Referencias bibliográficas

Tema 2. Conceptos básicos de aprendizaje automático

  • Introducción y objetivos
  • Características de los buenos modelos
  • Tipos de información
  • Conceptos básicos de aprendizaje
  • Conceptos básicos de aprendizaje no supervisado
  • Referencias bibliográficas

Tema 3. Exploración y preprocesamiento de datos

  • Introducción y objetivos
  • Tratamiento de datos
  • Tratamiento de datos en el flujo de análisis de datos
  • Tipos de datos
  • Transformaciones de datos
  • Visualización y exploración de variables continuas
  • Visualización y exploración de variables categóricas
  • Medidas de correlación
  • Representaciones gráficas más habituales
  • Introducción al análisis multivariante y a la reducción de dimensiones
  • Referencias bibliográficas

Tema 4. Árboles de decisión

  • Introducción y objetivos
  • Algoritmo ID3
  • Algoritmo C4.5
  • Sobreentrenamiento y poda
  • Análisis de resultados
  • Referencias bibliográficas

Tema 5. Evaluación de clasificadores

  • Introducción y objetivos
  • Matrices de confusión
  • Matrices de evaluación numérica
  • Estadístico de Kappa
  • La curva ROC
  • Referencias bibliográficas

Tema 6. Reglas de clasificación

  • Introducción y objetivos
  • Medidas de evaluación de reglas
  • Introducción a la representación gráfica
  • Algoritmo de recubrimiento secuencial
  • Referencias bibliográficas

Tema 7. Redes neuronales

  • Introducción y objetivos
  • Conceptos básicos
  • Redes de neuronas simples
  • Algoritmo de backpropagation
  • Introducción a las redes neuronales recurrentes
  • Referencias bibliográficas

Tema 8. Métodos bayesianos

  • Introducción y objetivos
  • Conceptos básicos de probabilidad
  • Teorema de Bayes
  • Naive Bayes
  • Introducción a las redes bayesianas
  • Referencias bibliográficas

Tema 9. Modelos de regresión y de respuesta continua

  • Introducción y objetivos
  • Regresión lineal simple
  • Regresión lineal múltiple
  • Regresión logística
  • Árboles de regresión
  • Introducción a las máquinas de soporte vectorial (SVM)
  • Medidas de bondad de ajuste
  • Referencias bibliográficas

Tema 10. Clustering

  • Introducción y objetivos
  • Conceptos básicos
  • Clustering jerárquico
  • Métodos probabilistas
  • Algoritmo EM
  • Método B-Cubed
  • Métodos implícitos
  • Referencias bibliográficas

Tema 11. Minería de textos y procesamiento de lenguaje natural (NLP)

  • Introducción y objetivos
  • Conceptos básicos
  • Creación del corpus
  • Análisis descriptivo
  • Introducción al análisis de sentimientos
  • Referencias bibliográficas

Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.

Las actividades formativas de esta asignatura son las siguientes:

  • Trabajo. Se trata de actividades de diferentes tipos: reflexión, análisis de casos, prácticas, etc.
  • Comentario de lecturas. Es un tipo de actividad muy concreto que consiste en el análisis de textos de artículos de autores expertos en diferentes temas de la asignatura.
  • Casos prácticos. Situarán al alumno ante situaciones reales que tendrán que analizar y tras ello tomar decisiones, evaluar consecuencias y alternativas.
  • Participación en eventos. Son eventos programados todas las semanas del cuatrimestre: sesiones presenciales virtuales, foros de debate.
Descargar programación

Estas actividades formativas prácticas se completan, por supuesto, con estas otras:

  • Estudio personal.
  • Tutorías. Las tutorías se pueden articular a través de diversas herramientas y medios. Durante el desarrollo de la asignatura, el profesor programa tutorías en días concretos para la resolución de dudas de índole estrictamente académico a través de las denominadas “sesiones de consultas”. Como complemento de estas sesiones se dispone también del foro “Pregúntale al profesor de la asignatura” a través del cual se articulan algunas preguntas de alumnos y las correspondientes respuestas en el que se tratan aspectos generales de la asignatura. Por la propia naturaleza de los medios de comunicación empleados, no existen horarios a los que deba ajustarse el alumno.
  • Examen final presencial u online

Las horas de dedicación a cada actividad se detallan en la siguiente tabla:

ACTIVIDADES FORMATIVAS HORAS POR ASIGNATURA % PRESENCIAL
Sesiones presenciales virtuales 15 horas 100 %
Recursos didácticos visuales 6 horas 0
Estudio del material básico 50 horas 0
Lectura del material complementario 25 horas 0
Trabajos, casos prácticos, test 17 horas 0
Prácticas de laboratorios virtuales 12 horas 16,7 %
Tutorías 16 horas 30 %
Trabajo colaborativo 7 horas 0
Realización de examen final 2 horas 100 %
Total 150 horas -

Bibliografía básica

Recuerda que la bibliografía básica es imprescindible para el estudio de la asignatura. Cuando se indica que no está disponible en el aula virtual, tendrás que obtenerla por otros medios: librería UNIR, biblioteca...

Los textos necesarios para el estudio de la asignatura han sido elaborados por UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.

Tema 11

Bibliografía complementaria

  • Bird, S., Klein, E. y Loper, E. (2009). Natural language processing with python. Newton: O’Reilley.
  • Duchesnay, E. y Löfstedt, T. (2018). Statistics and Machine Learning in Python. Recuperado de ftp://ftp.cea.fr/pub/unati/people/educhesnay/pystatml/StatisticsMachineLearningPythonDraft.pdf
  • Daumé, H. (2012). A Course in Machine Learning. Manual autoeditado. Recuperado de http://ciml.info/
  • James, G., Witten, D., Hastie, T. y Tibshirani, R. (2017). An Introduction to Statistical Learning. Berlín: Springer
  • McKinney, W. (2017). Python for Data Analysis, Data Wrangling with Pandas, NumPy, and IPython. Newton: O’Reilley.

El sistema de calificación se basa en la siguiente escala numérica:

0 - 4, 9 Suspenso (SS)
5,0 - 6,9 Aprobado (AP)
7,0 - 8,9 Notable (NT)
9,0 - 10 Sobresaliente (SB)

La calificación se compone de dos partes principales:

El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL U ONLINE y OBLIGATORIO. Supone el 60% de la calificación final y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO.

La evaluación continua supone el 40% de la calificación final. Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.

Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua permite que realices las que prefieras hasta conseguir el máximo puntuable mencionado en la programación semanal. En ella se detalla la calificación máxima de cada actividad o evento concreto puntuables.

El sistema de evaluación de la asignatura es el siguiente:

Sistema de evaluación Ponderación min - max
Prueba de evaluación final
60%
60%
Evaluación de prácticas de laboratorios virtuales
0%
40%
Resolución de trabajos, proyectos y casos
0%
40%
Test de autoevaluación
0%
20%
Participación en foros y otros medios participativos
0%
40%

Jordi Escayola Mansilla

Formación académica: Doctor en Economía por la Universidad Ramón Llull-AACSB. Miembro de Beta Gamma Sigma. Candidato a Executive in Administration (EAE Business School). Máster Oficial en Estadística e Investigación Operativa por la Universidad de Barcelona/Universidad Politécnica de Cataluña. Licenciado en Ciencias y Técnicas Estadísticas por la Universidad Politécnica de Cataluña. Diplomado en Estadística por la Universidad Politécnica de Cataluña.

Experiencia: Más de 10 años de experiencia en modelización predictiva y analytics, focalizado en el sector financiero-asegurador, y también como consultor particular. Cargos de responsabilidad y vinculación internacional en la firma Willis Towers Watson y Milliman Consultants and Actuaries. Actualmente profesor asociado de UNIR, vinculado al Máster de Inteligencia Artificial y al Grado de Informática. Profesor Asociado al Departamento de Estadística e Investigación Operativa de la Universidad Politécnica de Cataluña.

Líneas de investigación: Modelización predictiva para finanzas. Comportamiento del consumidor. Calidad y dimensiones de la calidad de servicio.

Obviamente, al tratarse de formación online puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de actividades, trabajos y exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:

  1. Desde el Campus virtual podrás acceder al aula virtual de cada asignatura en la que estés matriculado y, además, al aula virtual del Curso de introducción al campus virtual. Aquí podrás consultar la documentación disponible sobre cómo se utilizan las herramientas del aula virtual y sobre cómo se organiza una asignatura en la UNIR y también podrás organizar tu plan de trabajo personal con tu tutor personal.
  2. Observa la programación semanal. Allí te indicamos qué parte del temario debes trabajar cada semana.
  3. Ya sabes qué trabajo tienes que hacer durante la semana. Accede ahora a la sección Temas del aula virtual. Allí encontrarás el material teórico y práctico del tema correspondiente a esa semana.
  4. Comienza con la lectura de las Ideas clave del tema. Este resumen te ayudará a hacerte una idea del contenido más importante del tema y de cuáles son los aspectos fundamentales en los que te tendrás que fijar al estudiar el material básico. Consulta, además, las secciones del tema que contienen material complementario.
  5. Dedica tiempo al trabajo práctico (sección Actividades y Test). En la programación semanal te detallamos cuáles son las actividades correspondientes a cada semana y qué calificación máxima puedes obtener con cada una de ellas.
  6. Te recomendamos que participes en los eventos del curso (sesiones presenciales virtuales, foros de debate…). Para conocer la fecha concreta de celebración de los eventos debes consultar las herramientas de comunicación del aula vitual. Tu profesor y tu tutor personal te informarán de las novedades de la asignatura.

En el aula virtual del Curso de introducción al campus virtual encontrarás siempre disponible la documentación donde te explicamos cómo se estructuran los temas y qué podrás encontrar en cada una de sus secciones.

Recuerda que en el aula virtual del Curso de introducción al campus virtual puedes consultar el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Sesiones presenciales virtuales, Envío de actividades, etc.

Ten en cuenta estos consejos...

  • Sea cual sea tu plan de estudio, accede periódicamente al aula Virtual, ya que de esta forma estarás al día de las novedades del curso y en contacto con tu profesor y con tu tutor personal.
  • Recuerda que no estás solo: consulta todas tus dudas con tu profesor-tutor utilizando el correo electrónico. Además, siempre puedes consultar tus dudas sobre el temario en los foros que encontrarás en cada asignatura (Pregúntale al profesor).
  • ¡Participa! Siempre que te sea posible accede a los foros de debate. El intercambio de opiniones, materiales e ideas nos enriquece a todos.
  • Y ¡recuerda!, estás estudiando con metodología on line: tu esfuerzo y constancia son imprescindibles para conseguir buenos resultados. ¡No dejes todo para el último día!