Última revisión realizada: 05/07/2023 |
|
Denominación de la asignatura: | Técnicas Multivariantes y Machine Learning |
Postgrado al que pertenece: | Máster universitario en Ingeniería Matemática y Computación |
Créditos ECTS: | 6 |
Cuatrimestre en el que se imparte: | Primer cuatrimestre |
Carácter de la asignatura: | Obligatoria |
Presentación
El análisis de un conjunto de datos lleva aparejado el estudio de distintas variables que pueden estar relacionadas entre sí. Ya sea en el caso de que se requiera estudiar cómo se ve afectada una variable determinada (variable dependiente) en función de otras variables (predictores), o si se quiere conocer cómo se ven afectadas múltiples variables (dependientes) en función de una o de varias variables (predictores), es necesaria la aplicación de técnicas multivariantes.
Técnicas Multivariantes es una asignatura donde se estudian distintos conceptos estadísticos y se abordan diversas técnicas para el tratamiento de datos y la resolución de problemas desde un enfoque eminentemente aplicado, aunque sin perder de vista el rigor matemático. Los primeros temas (temas 1, 2 y 3) de la asignatura tratan sobre conceptos estadísticos básicos, sobre los cuales se asientan el resto de los temas y de las técnicas explicadas. Posteriormente se detallan distintas técnicas multivariantes, dentro de lo que se conoce como machine learning (o ‘aprendizaje automático’). Dentro de este aprendizaje se puede distinguir entre el aprendizaje supervisado (temas 4, 5, 6, 7 y 8) y el no supervisado (tema 9). Por último, en el tema 10, se presenta la importancia de la representación de los datos en el análisis descriptivo.
Esta asignatura dotará al alumno de las herramientas necesarias para poder realizar el análisis estadístico de un conjunto de datos, realizar correctamente diseños de experimentos y aplicar las últimas tendencias en las técnicas de machine learning. El lenguaje vehicular de la asignatura será Python, el cual es el lenguaje de programación empleado mayoritariamente en el Máster de Ingeniería Matemática y Computación. En cada uno de los temas se desarrollará el contenido teórico y este se pondrá en práctica mediante un caso de aplicación. Se adjuntará dentro de las ideas clave la parte de código empleado junto con los comentarios pertinentes para su mejor interpretación.
Competencias básicas
- CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
- CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
- CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
- CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
Competencias generales
- CG1. Aplicar pensamiento crítico, lógico y creativo, en la vanguardia del campo de estudio, en un contexto de investigación.
- CG3. Que los estudiantes tomen decisiones a partir de consideraciones abstractas, para organizar, planificar y optimizar cuestiones de carácter matemático y computacional
- CG4. Buscar y utilizar los recursos bibliográficos, físicos y/o electrónicos necesarios para abordar un problema.
- CG5. Presentar ideas, procedimientos o informes de investigación, así como asesorar a personas u organizaciones en su ámbito de especialización en Ingeniería Matemática y la Computación.
- CG6. Comprender y utilizar de manera avanzada el lenguaje y las herramientas matemáticas para modelizar, simular y resolver problemas complejos del ámbito de la ingeniería y de la industria, reconociendo y valorando las situaciones y problemas susceptibles de ser tratados matemáticamente.
- CG7. Integrar de forma autónoma diferentes teorías y modelos haciendo una reflexión personal y creativa adaptada a sus propias necesidades profesionales.
- CG8. Elaborar adecuadamente y con argumentos motivados, proyectos de trabajo, redactar planes, así como formular hipótesis y conejturas razonables en el ámbito de la Ingeniería Matemática y la Computación.
Competencias específicas
- CE11. Capacidad para aplicar los conocimientos adquiridos y resolver problemas en entornos nuevos o poco conocidos dentro de contextos o multidisciplinares relacionados con el Análisis de Datos Multivariantes.
- CE12. Capacidad para utilizar diferentes entornos de Computación Estadística en la resolución de problemas en entornos multidisciplinares..
- CE13. Capacidad para analizar y procesar datos que permitan generar y gestionar información útil en la toma de decisiones relacionadas con la ingeniería y la industria..
Competencias transversales
- CT1. Organizar y planificar las tareas aprovechando los recursos, el tiempo y las competencias de manera óptima.
- CT2. Identificar las nuevas tecnologías como herramientas didácticas para el intercambio comunicacional en el desarrollo de procesos de indagación y de aprendizaje.
- CT4. Adquirir la capacidad de trabajo independiente, impulsando la organización y favoreciendo el aprendizaje autónomo.
Tema 1. Variables aleatorias y muestreo
- Introducción y objetivos
- Variables
- Distribuciones
- Muestreo
- Inferencia estadística
- El entorno de trabajo: Python
- Referencias bibliográficas
- Ejercicios resueltos
Tema 2. Estadística robusta
- Introducción y objetivos
- Métodos paramétricos
- Métodos no paramétricos
- Tratamiento de outliers
- Estimadores robustos
- Referencias bibliográficas
- Ejercicios resueltos
Tema 3. Introducción al aprendizaje automático
- Introducción y objetivos
- El aprendizaje automático
- Ajuste y predicción del modelo
- El dilema sesgo-varianza
- Técnicas de validación
- Técnicas de remuestreo
- Referencias bibliográficas
- Ejercicios resueltos
Tema 4. Técnicas de regresión
- Introducción y objetivos
- Regresión lineal simple
- Parámetros del modelo de regresión lineal simple
- Atribución
- Predicción
- Descomposición de la suma de cuadrados
- La regresión lineal simple con Python
- Comprobación del modelo
- Referencias bibliográficas
- Ejercicios resueltos
Tema 5. Técnicas de regresión avanzadas I
- Introducción y objetivos
- Regresión lineal múltiple
- La descomposición en suma de cuadrados
- Selección de variables
- Extensiones de los Modelos lineales
- Regresión lineal múltiple en la práctica
- Referencias bibliográficas
- Ejercicios resueltos
Tema 6. Técnicas de regresión avanzadas II
- Introducción y objetivos
- Mínimos cuadrados recortados
- La regresión penalizada
- Referencias bibliográficas
- Ejercicios resueltos
Tema 7. Técnicas de clasificación
- Introducción y objetivos
- Problemas de clasificación
- Alternativas a la regresión lineal
- La regresión logística
- Método de los K vecinos más cercanos
- Aplicación en Python del método de los K vecinos más
cercanos - Referencias bibliográficas
- Ejercicios resueltos
Tema 8. Árboles de decisión y métodos de ensamble
- Introducción y objetivos
- Árboles de decisión
- Métodos de ensamble
- Random Forests
- Boosting
- Referencias bibliográficas
- Ejercicios resueltos
Tema 9. Reducción de la dimensión y clustering
- Introducción y objetivos
- Análisis de componentes principales
- Otros métodos de reducción de la dimensión
- Técnicas de aprendizaje no supervisado
- Clustering
- Métodos de creación de clusters: K-medias
- Referencias bibliográficas
- Ejercicios resueltos
Tema 10. Visualización de los datos
- Introducción y objetivos
- Visualización como análisis descriptivo
- Visualización para la difusión de los resultados
- Principales tipos de datos y tipos de gráficos
- Gráficos en Python
- Otras librerías en Python
- Referencias bibliográficas
- Ejercicios resueltos
Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.
Las actividades formativas de esta asignatura son las siguientes:
- Trabajos: Actividades de cierta complejidad que conllevan por ejemplo una búsqueda de información, análisis y crítica de lecturas, resolución de problemas, etc.
- Casos prácticos: El objetivo pedagógico es que el estudiante detecte situaciones relevantes, analice la información complementaria, tome decisiones en relación con el escenario que se plantea y proponga soluciones o indique cómo mejorar la situación de partida.
- Laboratorios virtuales: Son sesiones presenciales virtuales que se llevan a cabo con herramientas de videoconferencia cuyo objetivo es que los alumnos utilicen algún tipo de herramienta informática para realizar uno o varios supuestos prácticos.
- Test de evaluación: al final de cada tema, los estudiantes pueden realizar este tipo de test, que permite al profesor valorar el interés del estudiante en la asignatura.
Estas actividades formativas prácticas se completan, por supuesto, con estas otras:
- Estudio personal
- Tutorías. Las tutorías se pueden articular a través de diversas herramientas y medios. Durante el desarrollo de la asignatura, el profesor programa tutorías en días concretos para la resolución de dudas de índole estrictamente académico a través de las denominadas “sesiones de consultas”. Como complemento de estas sesiones se dispone también del foro “Pregúntale al profesor de la asignatura” a través del cual se articulan algunas preguntas de alumnos y las correspondientes respuestas en el que se tratan aspectos generales de la asignatura. Por la propia naturaleza de los medios de comunicación empleados, no existen horarios a los que deba ajustarse el alumno.
- Examen final presencial u online
Las horas de dedicación a cada actividad se detallan en la siguiente tabla:
ACTIVIDADES FORMATIVAS | HORAS POR ASIGNATURA | % PRESENCIAL |
---|---|---|
Sesiones presenciales virtuales | 15 horas | 100% |
Lecciones magistrales | 6 horas | 0 |
Estudio del material básico | 50 horas | 0 |
Lectura del material complementario | 25 horas | 0 |
Trabajos, casos prácticos, test de evaluación | 17 horas | 0 |
Sesiones prácticas de laboratorio virtual | 12 horas | 0 |
Tutorías | 16 horas | 0 |
Trabajo colaborativo | 7 horas | 0 |
Examen final | 2 horas | 0% |
Total | 150 horas | - |
Bibliografía básica
Recuerda que la bibliografía básica es imprescindible para el estudio de la asignatura. Cuando se indica que no está disponible en el aula virtual, tendrás que obtenerla por otros medios: librería UNIR, biblioteca...
Los textos necesarios para el estudio de la asignatura han sido elaborados por UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.
Bibliografía complementaria
- Evans, M. J. (2015). Probabilidad y Estadística: La ciencia de la incertidumbre. Barcelona: Reverté.
- Géron, A. (2017). Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems. Sebastopol, CA: O'Reilly Media. ISBN: 978-1491962299.
- Harrell, F. E. (2016). Regression Modeling Strategies: With Applications to Linear Models, Logistic and Ordinal Regression, and Survival Analysis. Springer.
- Hastie, T., Tibshirani, R., Friedman, J. (2009). The elements of statistical learning: data mining, inference and prediction. Springer.
- James, G., Witten, D., Hastie, T., & Tibshirani, R. (2017). An introduction to statistical learning: With applications in R. Springer.
- McElreath, R. (2020). Statistical Rethinking. New York: Chapman and Hall/CRC, https://doi.org/10.1201/9780429029608.
- Müller, A. C., Guido, S., & O'Reilly Media. (2018). Introduction to machine learning with Python: A guide for data scientists. Sebastopol: O'Reilly Media.
El sistema de calificación se basa en la siguiente escala numérica:
0 - 4, 9 | Suspenso | (SS) |
5,0 - 6,9 | Aprobado | (AP) |
7,0 - 8,9 | Notable | (NT) |
9,0 - 10 | Sobresaliente | (SB) |
La calificación se compone de dos partes principales:
El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL u ONLINE y OBLIGATORIO. Supone el 60% de la calificación final y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO.
La evaluación continua supone el 40% de la calificación final. Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.
Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua permite que realices las que prefieras hasta conseguir el máximo puntuable mencionado. En la programación semanal de la asignatura, se detalla la calificación máxima de cada actividad o evento concreto puntuables.
Sistema de evaluación | Ponderación min - max |
---|---|
Participación del estudiante (sesiones, foros, tutorías) | 0% - 40% |
Trabajos, proyectos, laboratorios/talleres y casos | 00% - 40% |
Test de evaluación | 0% - 40% |
Examen final | 60% - 60% |
Daniel González Sánchez
Formación académica: Daniel es Doctor en Matemática Aplicada. En su tesis de doctorado realizó estudios relacionados con la convergencia de procesos iterativos en espacios de Banach, desarrollando nuevas teorías aplicándolas a diversas ecuaciones no lineales y a sistemas de ecuaciones, también no lineales.
Experiencia: Daniel ha impartido diversas asignaturas a nivel de educación superior en el ámbito de ingeniería, relacionadas con matemáticas e informática. Además, ha realizado actividades docentes en programas de máster y dirigiendo trabajos de final de estudios. También ha impartido cursos de didáctica matemática utilizando diferentes metodologías a estudiantes de escuelas e institutos, interesado en el desarrollo e implementación de nuevos procesos metodológicos.
Líneas de investigación: Las principales líneas de investigación de Daniel son:
- Métodos iterativos en espacios de Banach.
- Resolución de ecuaciones y sistemas de ecuaciones no lineales.
- Resolución de ecuaciones integrales y problemas de valores en la frontera mediante procesos iterativos.
- Análisis de la convergencia de métodos iterativos.
- Didáctica de las matemáticas.
Posee 37 publicaciones en Scopus con diferentes artículos y capítulos de libros relacionados con las líneas de investigación anteriores.
Obviamente, al tratarse de formación online puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de actividades, trabajos y exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:
- Desde el Campus virtual podrás acceder al aula virtual de cada asignatura en la que estés matriculado y, además, al aula virtual del Curso de introducción al campus virtual. Aquí podrás consultar la documentación disponible sobre cómo se utilizan las herramientas del aula virtual y sobre cómo se organiza una asignatura en la UNIR y también podrás organizar tu plan de trabajo con tu tutor personal.
- Observa la programación semanal. Allí te indicamos qué parte del temario debes trabajar cada semana.
- Ya sabes qué trabajo tienes que hacer durante la semana. Accede ahora a la sección Temas del aula virtual. Allí encontrarás el material teórico y práctico del tema correspondiente a esa semana.
- Comienza con la lectura de las Ideas clave del tema. Este resumen te ayudará a hacerte una idea del contenido más importante del tema y de cuáles son los aspectos fundamentales en los que te tendrás que fijar al estudiar el material básico. Consulta, además, las secciones del tema que contienen material complementario.
- Dedica tiempo al trabajo práctico (sección Actividades y Test). En la programación semanal te detallamos cuáles son las actividades correspondientes a cada semana y qué calificación máxima puedes obtener con cada una de ellas.
- Te recomendamos que participes en los eventos del curso (sesiones presenciales virtuales, foros de debate…). Para conocer la fecha concreta de celebración de los eventos debes consultar las herramientas de comunicación del aula vitual. Tu profesor y tu tutor personal te informarán de las novedades de la asignatura.
En el aula virtual del Curso de introducción al campus virtual encontrarás siempre disponible la documentación donde te explicamos cómo se estructuran los temas y qué podrás encontrar en cada una de sus secciones.
Recuerda que en el aula virtual del Curso de introducción al campus virtual puedes consultar el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Sesiones presenciales virtuales, Envío de actividades, etc.
Ten en cuenta estos consejos...
- Sea cual sea tu plan de estudio, accede periódicamente al aula Virtual, ya que de esta forma estarás al día de las novedades del curso y en contacto con tu profesor y con tu tutor personal.
- Recuerda que no estás solo: consulta todas tus dudas con tu tutor personal utilizando el correo electrónico. Además, siempre puedes consultar tus dudas sobre el temario en los foros que encontrarás en cada asignatura (Pregúntale al profesor).
- ¡Participa! Siempre que te sea posible accede a los foros de debate. El intercambio de opiniones, materiales e ideas nos enriquece a todos.
- Y ¡recuerda!, estás estudiando con metodología on line: tu esfuerzo y constancia son imprescindibles para conseguir buenos resultados. ¡No dejes todo para el último día!