Última revisión realizada: 16/08/2023

Denominación de la asignatura: Análisis Multivariante
Grado al que pertenece: Grado en Ciencia de Datos
Créditos ECTS: 6
Curso y cuatrimestre en el que se imparte: Primer curso, segundo cuatrimestre
Carácter de la asignatura: Básica
Materia a la que pertenece: Fundamentos Matemáticos de la Informática

Presentación

Actualmente, en la mayoría de los trabajos donde se toman datos experimentales se debe aplicar la estadística, en gran parte métodos estadísticos multivariantes debido a la cantidad de información de la que se dispone. Por esta sencilla razón, es necesario que los alumnos que cursan el Grado en Ciencia de Datos se habitúen rápidamente a analizar y tomar decisiones estadísticas a partir de un estudio con un elevado número de variables.

Se desea que el estudiante obtenga una comprensión de uso de las técnicas multivariantes y las ponga en práctica. Para ello, se analizan en detalle las más empleadas en el ámbito laboral y se verán aplicadas en áreas donde juegan un papel relevante. Además, se pretende que el alumno conozca el entorno donde se podría desarrollar su función laboral y que esta materia sirva de soporte y herramienta para otras asignaturas.

El papel que desempeña la asignatura de Análisis Multivariante dentro de la titulación es desarrollar un curso sobre conceptos para: examinar una gran cantidad de campos conjuntamente en contraposición con la estadística tradicional que las variables a analizar se estudian de manera individual, saber diferenciar y elegir la técnica multivariante adecuada, saber interpretar los resultados obtenidos, manejar el programa R-Studio y conocer las herramientas de análisis multivariante. El bloque formativo al que pertenece la materia es Introducción a la Ciencia de Datos, Bases de Datos, Bases de Datos Avanzadas y Distribuidas, Análisis Bayesiano de Datos y Minería de Datos Masivos.

Competencias básicas

  • CB1: Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio.
  • CB2: Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • CB3: Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • CB4: Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • CB5: Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.

Competencias generales

  • CG1: Ser capaz de aplicar los conocimientos matemáticos y estadísticos de forma rigurosa por medio de la elaboración y defensa de argumentos y en la resolución de problemas.
  • CG2: Capacidad de obtener información y saber interpretarla utilizando el software más adecuado en cada caso.
  • CG3: Capacidad de reunir e interpretar datos relevantes, dentro del área de la ciencia de datos, para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • CG4: Capacidad de tomar decisiones a partir de consideraciones abstractas, para organizar, planificar y optimizar cuestiones relacionadas con la ciencia de datos.
  • CG5: Capacidad de desarrollar aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores en el ámbito de la ciencia de datos con un alto grado de autonomía.
  • CG6: Capacidad de presentar ideas, procedimientos o redactar informes, así como asesorar a personas u organizaciones en su ámbito de especialización en ciencia de datos.
  • CG7: Capacidad para saber comunicar y transmitir los conocimientos y habilidades relacionados con la ciencia de datos.
  • CG8: Ser capaz de aplicar la capacidad analítica y de abstracción, y el pensamiento lógico adquiridos para identificar y analizar problemas complejos y formular soluciones en un entorno multidisciplinar relacionado con la ciencia de datos.
  • CG9: Capacidad para dirigir las actividades objeto de los proyectos del ámbito de la ciencia de datos.
  • CG10: Conocer y saber aplicar los elementos básicos de economía y de gestión de recursos humanos, organización y planificación en el ámbito de los proyectos informáticos propios de la ciencia de datos.

Competencias específicas

  • CE1: Ser capaz de identificar correctamente problemas de clasificación correspondientes a unos objetivos y unos datos determinados y emplear los resultados básicos del análisis multivariante como fundamento básico de los métodos de clasificación, clustering y reducción de la dimensión.
  • CE2: Ser capaz de identificar correctamente problemas de tipo predictivo correspondientes a unos objetivos y unos datos determinados y emplear los resultados básicos del análisis de regresión como fundamento básico de los métodos de predicción.
  • CE3: Ser capaz de conocer y aplicar las características, funcionalidades y estructura de las bases de datos que permitan su adecuado uso, diseño y programación.
  • CE4: Ser capaz de interpretar la influencia de las distintas variables, la relación entre ellas y la complejidad del modelo en los problemas de ciencia de datos.
  • CE5: Conocer y ser capaz de aplicar los procedimientos algorítmicos básicos de las tecnologías informáticas para diseñar soluciones a problemas, analizando la idoneidad y complejidad de los algoritmos propuestos.
  • CE6: Ser capaz de formular modelos matemáticos que permitan calcular soluciones o la evolución de un determinado sistema de un problema de aplicación directa, e interpretar otros modelos existentes.
  • CE7: Ser capaz de utilizar aplicaciones informáticas de análisis estadístico, cálculo numérico y simbólico, visualización gráfica y optimización para la resolución de problemas.
  • CE8: Ser capaz de conocer y desarrollar técnicas de aprendizaje computacional y aprendizaje profundo y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos.
  • CE9: Ser capaz de identificar y aplicar las herramientas adecuadas para el análisis de datos en problemas matemáticos.
  • CE10: Ser capaz de hacer uso de técnicas de programación específicas para resolver problemas relacionados con la Ciencia de Datos.
  • CE11: Comprender y dominar los fundamentos y técnicas para el procesado de datos escritos, tanto en lenguaje formal como en lenguaje natural.
  • CE12: Ser capaz de conocer los fundamentos de la programación de ordenadores y su aplicación para la resolución de problemas.
  • CE13: Ser capaz de conocer y aplicar los principios fundamentales y técnicas básicas de la programación, guiada por eventos, orientada a objetos y concurrente.
  • CE14: Conocer las principales técnicas del análisis de datos, así como aplicaciones donde han sido utilizadas exitosamente.
  • CE15: Conocer y saber desarrollar las características, funcionalidades y estructura de los Sistemas y Bases de Datos Distribuidos a través de las Redes de Computadores e Internet.
  • CE16: Ser capaz de diseñar, desarrollar, seleccionar y evaluar aplicaciones y proyectos de sistemas informáticos aplicados a la ciencia de datos, asegurando su fiabilidad y calidad.
  • CE17: Ser capaz de analizar y manipular señales analógicas y digitales en los dominios temporal y frecuencial.
  • CE18: Ser capaz de conocer los principios y bloques fundamentales, características, funcionalidades, capacidades y estructura de los Sistemas Operativos y diseñar e implementar aplicaciones basadas en sus servicios.
  • CE19: Ser capaz de conocer y aplicar las características, funcionalidades, seguridad y estructura de las Redes de Computadores e Internet.
  • CE20: Ser capaz de elaborar, desarrollar, documentar y defender un trabajo de carácter aplicado en el ámbito de la Ciencia de Datos.
  • CE21: Conocer y ser capaz de aplicar los principios fundamentales y técnicas básicas de los sistemas inteligentes y su aplicación práctica.
  • CE22: Ser capaz de diseñar y utilizar de forma eficiente los tipos y estructuras de datos más adecuados a la resolución de un problema.
  • CE23: Conocer adecuadamente el concepto de empresa, su clasificación y su marco institucional y jurídico.
  • CE24: Conocer los requisitos de privacidad de los entornos de datos masivos y las consiguientes medidas de protección: técnicas, organizativas y legales.
  • CE25: Saber diseñar soluciones basadas en redes neuronales artificiales.
  • CE26: Capacidad para comprender la importancia de la negociación, los hábitos de trabajo efectivos, el liderazgo y las habilidades de comunicación en los entornos de uso de datos masivos.

Competencias transversales

  • CT1: Aplicar las nuevas tecnologías como herramientas para el intercambio comunicacional en el desarrollo de procesos de indagación y de aprendizaje.
  • CT2: Desarrollar habilidades de comunicación, para redactar informes y documentos, o realizar eficaces presentaciones de los mismos.

Temario

Tema 1. Introducción al análisis multivariante

  • Introducción
  • Introducción al análisis multivariante
  • Historia
  • Concepto de análisis multivariante
  • Clasificación de las técnicas de análisis multivariante
  • Cuaderno de ejercicios

Tema 2. Herramientas matemáticas e informáticas para el análisis multivariante

  • Introducción y objetivos
  • Herramientas algebraicas
  • Herramientas informáticas
  • Cuaderno de ejercicios

Tema 3. Herramientas estadísticas para el análisis multivariante

  • Introducción y objetivos
  • Distribución multinomial o polinomial
  • Distribución hipergeométrica multivariante
  • Distribución normal multivariante
  • Distribución de Wishart
  • Distribución de Hotelling
  • Distribución de Wilks
  • Cuaderno de ejercicios

Tema 4. Análisis previo de los datos

  • Introducción y objetivos
  • Representación de los datos
  • Datos ausentes
  • Casos atípicos
  • Verificación de los supuestos del análisis multivariante
  • Cuaderno de ejercicios

Tema 5. Análisis factorial y análisis factorial jerárquico

  • Introducción y objetivos
  • Herramientas específicas
  • Procedimiento
  • Interpretación de los resultados
  • Ejemplo
  • Cuaderno de ejercicios

Tema 6. Análisis de componentes principales

  • Introducción y objetivos
  • Herramientas específicas
  • Procedimiento
  • Interpretación de los resultados
  • Ejemplo
  • Cuaderno de ejercicios

Tema 7. Análisis de correspondencias simples y múltiples

  • Introducción y objetivos
  • Herramientas específicas
  • Procedimiento
  • Interpretación de los resultados
  • Ejemplo
  • Cuaderno de ejercicios

Tema 8. Análisis de clúster

  • Introducción y objetivos
  • Herramientas específicas
  • Procedimiento
  • Interpretación de los resultados
  • Ejemplo
  • Cuaderno de ejercicios

Tema 9. Correlaciones canónicas

  • Introducción y objetivos
  • Herramientas específicas
  • Procedimiento
  • Interpretación de los resultados
  • Ejemplo
  • Cuaderno de ejercicios

Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.

Las actividades formativas de esta asignatura son las siguientes:

  • Trabajos individuales. Se trata de actividades de diferentes tipos: reflexión, análisis de casos, prácticas, análisis de textos, etc.
  • Trabajos colaborativos. Son actividades grupales en las que tendrás la oportunidad de trabajar con tus compañeros. Durante el desarrollo de la asignatura tendrás toda la información que necesites sobre cómo organizarte para trabajar en equipo.
  • Participación en eventos. Son actividades programadas todas las semanas del cuatrimestre como clases en directo o foros de debate.
Descargar programación

Estas actividades formativas prácticas se completan, por supuesto, con estas otras:

  • Estudio personal
  • Tutorías. Las tutorías se pueden articular a través de diversas herramientas y medios. Durante el desarrollo de la asignatura, el profesor programa tutorías en días concretos para la resolución de dudas de índole estrictamente académico a través de las denominadas “sesiones de consultas”. Como complemento de estas sesiones se dispone también del foro “Pregúntale al profesor de la asignatura” a través del cual se articulan algunas preguntas de alumnos y las correspondientes respuestas en el que se tratan aspectos generales de la asignatura. Por la propia naturaleza de los medios de comunicación empleados, no existen horarios a los que deba ajustarse el alumno.
  • Examen final presencial u online

Las horas de dedicación a cada actividad se detallan en la siguiente tabla:

ACTIVIDADES FORMATIVAS HORAS POR ASIGNATURA % PRESENCIAL
Sesiones presenciales virtuales 15 horas 100%
Recursos didácticos audiovisuales 6 horas 0
Estudio del material básico 52 horas 0
Lectura del material complementario 25 horas 0
Trabajos, casos prácticos y test de evaluación 29 horas 0
Tutorías 16 horas 30%
Trabajo colaborativo 7 horas 0
Total 150 horas -

Bibliografía básica

Recuerda que la bibliografía básica es imprescindible para el estudio de la asignatura. Cuando se indica que no está disponible en el aula virtual, tendrás que obtenerla por otros medios: librería UNIR, biblioteca...

Los textos necesarios para el estudio de la asignatura han sido elaborados por UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.

Bibliografía complementaria

  • Afifi, A., Clark, V., Donatello, R. A. y May, S. (2020). Practical multivariate analysis (6th ed). Chapman and Hall/CRC. 
  • Aldás, J., & Uriel, E. (2017). Análisis Multivariante Aplicado con R. Alfacentauro.
  • Batista Foguet, J. M., & Martínez Arias, M. R. (1989). Análisis Multivariante. Análisis en Componentes Principales. ESADE.
  • Caballero, A. & Pérez Lechuga, G. (2006). Análisis Multivariante: Clasificación, Organización y Validación de Resultados.
    https://www.researchgate.net/publication/228368538
  • Cayuela, L. (2011). Análisis Multivariante. Manuales Universidad Rey Juan Carlos.
    https://www.academia.edu/8308017/An%C3%A1lisis_multivariante
  • Cuadras, C. M. (1991). Métodos de Análisis Multivariante. EUNIBAR.
  • Cuadras, C. M. (2007). Nuevos Métodos de Análisis Multivariante. CMC.
    http://www.est.uc3m.es/esp/nueva_docencia/getafe/estadistica/analisis_multivariante/doc_generica/archivos/metodos.pdf
  • Denis, D. (2021). Applied univariate, bivariate and multivariate satatistics (2nd. ed). John Wiley. 
  • Hair, J. F. Black, W. C., Babin, B. J. y Anderson, R. E. (2019). Multivariate Analysis (8th ed). Cengage Learning. 
  • Montanero Fernández, J. (2008). Análisis Multivariante. Manuales UEX ON LINE.
    https://dialnet.unirioja.es/servlet/libro?codigo=637311
  • Peña, D. (2002). Análisis de datos Multivariantes.  MacGrawHill.
  • Zelterman, D. (2022). Applied Multivariate Statistics with R. (2nd ed). Springer.

El sistema de calificación se basa en la siguiente escala numérica:

0 - 4, 9 Suspenso (SS)
5,0 - 6,9 Aprobado (AP)
7,0 - 8,9 Notable (NT)
9,0 - 10 Sobresaliente (SB)

La calificación se compone de dos partes principales:

El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL u ONLINE y OBLIGATORIO. Supone el 60% de la calificación final y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO.

La evaluación continua supone el 40% de la calificación final. Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.

Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua permite que realices las que prefieras hasta conseguir el máximo puntuable mencionado. En la programación semanal de la asignatura, se detalla la calificación máxima de cada actividad o evento concreto puntuables.

Sistema de evaluación Ponderación min - max
Participación del estudiante 0% - 15%
Trabajos, proyectos, laboratorios y/o casos 25% - 40%
Test de evaluación 0% - 15%
Examen final 60% - 60%

María Antonella Gieco

Formación académica: Doctora en Matemática por la Universidad Nacional del Litoral (Argentina), Licenciada en Matemática Aplicada por la misma universidad y Profesora en Matemática por la Universidad Autónoma de Entre Ríos (Argentina).

Experiencia: Quince años de experiencia docente impartiendo asignaturas en el área de matemática básica, estadística y ciencia de datos. Seis años de experiencia investigadora desarrollados en el Instituto de Matemática Aplicada del Litoral y Facultad de Ingeniería Química, en Santa Fe - Argentina.

Líneas de investigación: A través de becas doctorales y posdoctorales, mi trabajo de investigación se ha centrado en temas de metodología estadística para problemas de muy alta dimensión y reducción suficiente de dimensiones para datos correlacionados. Actualmente trabajo en el desarrollo de nuevos métodos predictivos semiparamétricos en estadística espacial.

Al tratarse de formación online puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de las actividades y la fecha de exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:

  1. Desde el Campus virtual podrás acceder al aula virtual de cada asignatura en la que estés matriculado y, además, al aula virtual del Curso de introducción al campus virtual. Aquí podrás consultar la documentación disponible sobre cómo se utilizan las herramientas del aula virtual y sobre cómo se organiza una asignatura en UNIR. También podrás organizar tu plan de trabajo con tu tutor personal.
  2. Observa la programación semanal. Allí te indicamos qué parte del temario debes trabajar cada semana.
  3. Ya sabes qué trabajo tienes que hacer durante la semana. Accede ahora a la sección Temas del aula virtual. Allí encontrarás el material teórico y práctico del tema correspondiente a esa semana.
  4. Comienza con la lectura de las Ideas clave del tema. Este material es el que debes estudiar para superar la asignatura. Consulta, además, las secciones del tema que contienen material complementario: con esto podrás tener una visión más amplia sobre el tema que estaás trabajando..
  5. Dedica tiempo al trabajo práctico (sección Actividades). En la programación semanal te detallamos cuáles son las actividades correspondientes a cada semana y qué calificación máxima puedes obtener con cada una de ellas.
  6. Te recomendamos que participes en los eventos del curso (clases en directo, foros de debate…). Para conocer la fecha concreta de celebración de los eventos debes consultar las herramientas de comunicación del aula vitual. Tu profesor y tu tutor personal te informarán de las novedades de la asignatura.

En el aula virtual del Curso de introducción al campus virtual encontrarás siempre disponible la documentación donde te explicamos cómo se estructuran los temas y qué podrás encontrar en cada una de sus secciones. Tambén puedes consulltar ahí el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Clases en directo, Envío de actividades, etc.

Ten en cuenta estos consejos...

  • Sea cual sea tu plan de estudio, accede periódicamente al aula Virtual, ya que de esta forma estarás al día de las novedades del curso y en contacto con tu profesor y con tu tutor personal.
  • Recuerda que no estás solo: consulta todas tus dudas con tu tutor personal utilizando el correo electrónico. Además, siempre puedes consultar tus dudas sobre el temario en los foros que encontrarás en cada asignatura (Pregúntale al profesor).
  • ¡Participa! Siempre que te sea posible accede a los foros de debate. El intercambio de opiniones, materiales e ideas nos enriquece a todos.
  • Y ¡recuerda!, estás estudiando con metodología on line: tu esfuerzo y constancia son imprescindibles para conseguir buenos resultados. ¡No dejes todo para el último día!