Última revisión realizada: 24/11/2022

Denominación de la asignatura: Análisis e Interpretación de Datos
Postgrado al que pertenece: Máster universitario en Análisis y Visualización de Datos Masivos / Visual Analytics & Big Data
Créditos ECTS: 6
Cuatrimestre en el que se imparte: Primero
Carácter de la asignatura: Obligatoria
Materia a la que pertenece: Procesado Inteligente de Datos

Presentación

La era de la información en que vivimos requiere que sepamos manejar datos. La ciencia que se encarga de «aprender» a partir de estos datos es la estadística. Para aprender o leer estos datos debemos saber producirlos, analizarlos y sacar conclusiones de ellos. Cuanto mayor sea nuestra comprensión del uso de las herramientas estadísticas, mayor será nuestra capacidad de analizar la realidad (o leer la «historia» que hay en los datos), lo que nos permitirá tomar decisiones lo más correctas posibles. A día de hoy, no podemos tomar una decisión con garantías basándonos tan solo en nuestra intuición, es preciso echar mano de la estadística y sus herramientas.

Más específicamente, en esta asignatura aprenderéis los conceptos introductorios de la estadística, así como a razonar estadísticamente. Aprenderéis, entre otras cosas, a graficar las representaciones de datos más habituales, a manejar con soltura las relaciones lineales entre dos variables, etc.

Se hará hincapié en la estadística inferencial, para ello se repasarán los principios de probabilidad en los que esta descansa. Las técnicas inferenciales son importantes, pues nos permitirán contrastar conjeturas que hacemos constantemente sobre cómo es una determinada población a través de los llamados contrastes de hipótesis.

Por último, cabe destacar el carácter aplicado, dinámico y actual en el que se enmarca la asignatura, ya que se estudiarán casos reales de aplicación e informes estadísticos recientes de diferentes campos. Además, el enfoque didáctico que se va a emplear, dentro de la seriedad que se le presupone, procurará generar interés y aprecio por la ciencia estadística en el alumno.

Competencias básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones, y los conocimientos y razones últimas que las sustentan, a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias generales

  • CG1. Diseñar y elaborar planes de intervención profesional relacionados con el entorno de análisis de datos y visualización de la información, e implementarlos y desarrollarlos mediante los métodos y procesos adecuados.
  • CG2. Tener la capacidad necesaria para ejercer las funciones profesionales requeridas para el análisis de datos y la visualización de la información en el seno de las entidades de TI.
  • CG3. Evaluar los recursos necesarios, planificar y organizar las actividades, sin olvidar la revisión del propio progreso y desempeño en el análisis de datos y visualización de la información.

Competencias específicas

  • CE5. Identificar los descriptores más habituales para un conjunto de datos y valorar su aplicabilidad a un conjunto de datos conocido.
  • CE6. Explicar las características de una situación física o virtual a partir del conjunto de datos que la define y construir diagramas que representen de forma visual dicha situación.
  • CE7. Evaluar y asesorar sobre las técnicas de inteligencia artificial aplicables para el procesado masivo de datos sobre un conjunto dado de datos y de acuerdo a unos requisitos establecidos.
  • CE8. Diseñar e implementar una estrategia integrada de técnicas estadísticas y de inteligencia artificial para el desarrollo de sistemas descriptivos y predictivos.
  • CE9. Comprender el funcionamiento y características de las técnicas habituales de procesamiento masivo de datos.
  • CE10. Anticipar los riesgos y beneficios derivados de la aplicación de las técnicas de procesamiento masivo de datos en una situación real.
  • CE11. Identificar las herramientas comerciales y de software libre orientadas al análisis estadístico, inteligencia artificial y procesamiento masivo de datos.
  • CE21. Diseñar e implementar un sistema que combine técnicas de captura y almacenamiento, análisis y visualización de datos, de modo que el sistema sea capaz de representar la realidad subyacente

Competencias transversales

  • CT2. Identificar las nuevas tecnologías como herramientas didácticas para el intercambio comunicacional en el desarrollo de procesos de indagación y de aprendizaje.
  • CT4. Adquirir la capacidad de trabajo independiente, impulsando la organización y favoreciendo el aprendizaje autónomo.

Tema 1. Introducción a la estadística

  • ¿Cómo estudiar este tema?
  • ¿Qué es la estadística?
  • Población, muestra y muestreo
  • Tipos de variables estadísticas
  • Diseños de experimentos
  • Razonamiento estadístico
  • Representando los datos: distribución de frecuencias
  • Tabulación de variables
  • Graficas básicas
  • El arte de elegir el gráfico adecuado
  • Retos de la estadística en Big Data

Tema 2. Estadística computacional

  • ¿Cómo estudiar este tema?
  • Principios básicos
  • Ámbitos de aplicación
  • Técnicas básicas de programación
  • Presentación del software R

Tema 3. Medidas que resumen la información

  • ¿Cómo estudiar este tema?
  • Medidas de tendencia central
  • Medidas de tendencia central robustas
  • Medidas de dispersión
  • Medidas de dispersión robustas
  • Medidas de posición y forma
  • Gráficos de caja
  • Datos atípicos y análisis exploratorio de datos

Tema 4. Regresión y correlación

  • ¿Cómo estudiar este tema?
  • Introducción
  • Correlación
  • Regresión lineal
  • Gráfico de residuos
  • Regresión lineal multivariante
  • Regresión no lineal
  • LTS (Least Trimmed Squares)

Tema 5. Probabilidad condicional y variables aleatorias

  • ¿Cómo estudiar este tema?
  • Introducción a la teoría de la probabilidad
  • Principios de la teoría de la probabilidad
  • Probabilidad condicional e independencia
  • Variable aleatoria
  • Modelos discretos
  • Modelos continuos

Tema 6. Distribución en el muestreo

  • ¿Cómo estudiar este tema?
  • Distribución en el muestreo del conteo y la proporción muestral
  • Teorema Central del Límite y distribución de la media muestral
  • Aplicabilidad del Teorema Central del Límite en ámbitos Big Data
  • Estimación puntual vs. estimación por intervalos
  • Propiedades de los estimadores

Tema 7. Intervalos de confianza

  • ¿Cómo estudiar este tema?
  • Introducción a los intervalos de confianza
  • Intervalo de confianza para la media de una población normal: varianza conocida y desconocida
  • Calculando el tamaño de la muestra
  • Intervalo de confianza para la proporción
  • Intervalo de confianza para la varianza de una población normal
  • Intervalo de confianza para la diferencia de medias y proporciones
  • Intervalos de confianza robustos

Tema 8. Contrastes de hipótesis

  • ¿Cómo estudiar este tema?
  • Introducción a los contrastes de hipótesis
  • Dos tipos de error en la significancia estadística
  • Pasos a seguir en un contraste de hipótesis
  • Contrastes de hipótesis para una media
  • Contrastes de hipótesis para la proporción
  • Contrastes de hipótesis sobre la varianza
  • Contrastes paramétricos para dos muestras
  • Contrastes de hipótesis robustos

Tema 9. Regresión

  • ¿Cómo estudiar este tema?
  • El modelo de regresión simple
  • Contrastando la regresión
  • Contrastando la regresión con el programa
  • La regresión como suma de cuadrados
  • Aplicación de las TIC

Tema 10. Análisis de componentes principales

  • ¿Cómo estudiar este tema?
  • Motivación
  • Definición
  • Aplicaciones
  • Ejemplo de aplicación en R

Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.

Las actividades formativas de esta asignatura son las siguientes:

  • Trabajos: Actividades de cierta complejidad que conllevan por ejemplo una búsqueda de información, análisis y crítica de lecturas, resolución de problemas, etc.
  • Casos prácticos: El objetivo pedagógico es que el estudiante detecte situaciones relevantes, analice la información complementaria, tome decisiones en relación con el escenario que se plantea y proponga soluciones o indique cómo mejorar la situación de partida.
  • Laboratorios virtuales: Son sesiones presenciales virtuales que se llevan a cabo con herramientas de videoconferencia cuyo objetivo es que los alumnos utilicen algún tipo de herramienta informática para realizar uno o varios supuestos prácticos.
  • Test de evaluación: Al final de cada tema, los estudiantes pueden realizar este tipo de test, que permite al profesor valorar el interés del estudiante en la asignatura.
Descargar programación

Estas actividades formativas prácticas se completan, por supuesto, con estas otras:

  • Estudio personal
  • Tutorías. Las tutorías se pueden articular a través de diversas herramientas y medios. Durante el desarrollo de la asignatura, el profesor programa tutorías en días concretos para la resolución de dudas de índole estrictamente académico a través de las denominadas “sesiones de consultas”. Como complemento de estas sesiones se dispone también del foro “Pregúntale al profesor de la asignatura” a través del cual se articulan algunas preguntas de alumnos y las correspondientes respuestas en el que se tratan aspectos generales de la asignatura. Por la propia naturaleza de los medios de comunicación empleados, no existen horarios a los que deba ajustarse el alumno. El profesor atenderá a las preguntas formuladas por los estudiantes en el foro en un plazo no superior a los dos días lectivos.
  • Examen final presencial u online

Las horas de dedicación a cada actividad se detallan en la siguiente tabla:

ACTIVIDADES FORMATIVAS HORAS POR ASIGNATURA % PRESENCIAL
Sesiones presenciales virtuales 15 horas 100%
Recursos didácticos audiovisuales 6 horas 0
Estudio del material básico 60 horas 0
Lectura del material complementario 45 horas 0
Casos prácticos y laboratorios virtuales 15 horas 13.3%
Trabajos y test de evaluación 14 horas 0
Tutorías 16 horas 30%
Trabajo colaborativo 7 horas 0
Examen final 2 horas 100%
Total 180 horas -

Bibliografía básica

Recuerda que la bibliografía básica es imprescindible para el estudio de la asignatura. Cuando se indica que no está disponible en el aula virtual, tendrás que obtenerla por otros medios: librería UNIR, biblioteca...

Los textos necesarios para el estudio de la asignatura han sido elaborados por UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.

Además, en estos temas deberás estudiar la siguiente bibliografía:

Tema 1, tema 3, tema 4 y tema 5, tema 6, tema 7

Ríus, F. (1998). Bioestadística: Métodos y aplicaciones. Málaga: Universidad de Málaga. Publicaciones. Versión electrónica: https://www.bioestadistica.uma.es/baron/apuntes/clase/apuntes/pdf/

Tema 6

Triola, M. F. (2009). Estadística (10ª ed), p. 269-277, 280-286, 291-298. México: Pearson. ISBN: 978-970-26-1287-2.

Tema 7

Triola, M. F. (2009). Estadística (10ª ed), p. 320-331, 338345, 349-354. México: Pearson. ISBN: 978-970-26-1287-2.

Tema 8

Triola, M. F. (2009). Estadística (10ª ed), p. 389-398. México: Pearson. ISBN: 978-970-26-1287-2.

Tema 9

Newbold, P., Carlson, W. y Thorne, B. (2008). Estadística para administración y Economía (6ª Edición), p. 431-496. Madrid. Pearson Educación. ISBN: 9788415552208

Bibliografía complementaria

  • Amón, J. (1984). Estadística para Psicólogos. Vol 2: Probabilidad y Estadística Inferencial. Madrid: Pirámide.
  • Field, A. (2009). Discovering statistics using SPSS. California: SAGE.
  • Gutiérrez, E. y Vladimirovna, O. (2016). Estadística inferencial 1 para ingeniería y ciencias. México: Grupo Editorial Patria.
  • Kreyszig, E. (1983). Introducción a la Estadística Matemática. México: Limusa.
  • Martín, A. (2004). Bioestadística para las ciencias de la salud. Madrid: Norma-Capitel.
  • Moore, D.S. (2006). Introduction to the practice of statistics (5th ed.). New York: Freeman and Company.
  • Puente, C. (2018). Estadística descriptiva e inferencial. Madrid: Ediciones IDT.
  • Stigler, S.M. (1998). The history of statistics: The measurement of uncertainty before 1900 (7 ed.). London: Belknap Press of Harvard University Press.
  • Tomeo, V. & Uña, I. (1990). Diez lecciones de estadística descriptiva. Madrid: AC.

El sistema de calificación se basa en la siguiente escala numérica:

0 - 4, 9 Suspenso (SS)
5,0 - 6,9 Aprobado (AP)
7,0 - 8,9 Notable (NT)
9,0 - 10 Sobresaliente (SB)

La calificación se compone de dos partes principales:

El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL U ONLINE Y OBLIGATORIO. Supone el 60% de la calificación final y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO.

La evaluación continua supone el 40% de la calificación final. Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.

Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua permite que realices las que prefieras hasta conseguir el máximo puntuable mencionado. En la programación semanal de la asignatura, se detalla la calificación máxima de cada actividad o evento concreto puntuables.

Sistema de evaluación Ponderación min - max
Participación del estudiante (sesiones, foros, tutorías) 0% - 10%
Trabajos, proyectos, laboratorios/talleres y casos 20% - 30%
Test de evaluación 0% - 10%
Examen final 60% - 60%

Observaciones: es necesario que el estudiante obtenga una calificación mínima de 5 sobre 10 en el examen final para que pueda computarse la nota obtenida en la evaluación continua.

Miller Janny Ariza Garzón

Formación académica: Es Doctorando en Data Science, tiene un Máster en Economía, con formación de base dos grados, uno de Estadística y otro de Licenciado en Matemáticas.

Experiencia: Profesor de diferentes asignaturas de estadística, econometría y de ciencia de datos. Director de más 30 TFGs y TFMs en diferentes universidades. Consultor en diferentes organismos gubernamentales y no gubernamentales en el tratamiento, análisis de datos y modelaje en proyectos financieros, económicos y sociales. Investigador en proyectos de inteligencia artificial aplicados en riesgo y pronóstico financiero. Director de áreas de modelos de riesgo en entidades financieras.

Líneas de investigación: Autor y coautor de varios artículos de investigación en temas de pronóstico, riesgo, finanzas, evaluación y aplicaciones de la ciencia de datos. Sus líneas de interes se asocian con la ciencia de datos aplicada en finanzas, ciencias sociales, pronóstico financiero y métodos cuantitativos de evaluación de programas y proyectos sociales. Actualmente está investigando en temas de explicabilidad del machine learning en la evaluación de riesgos financieros.

Obviamente, al tratarse de formación online puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de actividades, trabajos y exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:

  1. Desde el Campus virtual podrás acceder al aula virtual de cada asignatura en la que estés matriculado y, además, al aula virtual del Curso de introducción al campus virtual. Aquí podrás consultar la documentación disponible sobre cómo se utilizan las herramientas del aula virtual y sobre cómo se organiza una asignatura en la UNIR y también podrás organizar tu plan de trabajo con tu tutor personal.
  2. Observa la programación semanal. Allí te indicamos qué parte del temario debes trabajar cada semana.
  3. Ya sabes qué trabajo tienes que hacer durante la semana. Accede ahora a la sección Temas del aula virtual. Allí encontrarás el material teórico y práctico del tema correspondiente a esa semana.
  4. Comienza con la lectura de las Ideas clave del tema. Este resumen te ayudará a hacerte una idea del contenido más importante del tema y de cuáles son los aspectos fundamentales en los que te tendrás que fijar al estudiar el material básico. Consulta, además, las secciones del tema que contienen material complementario.
  5. Dedica tiempo al trabajo práctico (sección Actividades y Test). En la programación semanal te detallamos cuáles son las actividades correspondientes a cada semana y qué calificación máxima puedes obtener con cada una de ellas.
  6. Te recomendamos que participes en los eventos del curso (sesiones presenciales virtuales, foros de debate…). Para conocer la fecha concreta de celebración de los eventos debes consultar las herramientas de comunicación del aula vitual. Tu profesor y tu tutor personal te informarán de las novedades de la asignatura.

En el aula virtual del Curso de introducción al campus virtual encontrarás siempre disponible la documentación donde te explicamos cómo se estructuran los temas y qué podrás encontrar en cada una de sus secciones.

Recuerda que en el aula virtual del Curso de introducción al campus virtual puedes consultar el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Sesiones presenciales virtuales, Envío de actividades, etc.

Ten en cuenta estos consejos...

  • Sea cual sea tu plan de estudio, accede periódicamente al aula virtual, ya que de esta forma estarás al día de las novedades del curso y en contacto con tu profesor y con tu tutor personal.
  • Recuerda que no estás solo: consulta todas tus dudas con tu tutor personal utilizando el correo electrónico. Además, siempre puedes consultar tus dudas sobre el temario en los foros que encontrarás en cada asignatura (Pregúntale al profesor).
  • ¡Participa! Siempre que te sea posible accede a los foros de debate. El intercambio de opiniones, materiales e ideas nos enriquece a todos.
  • Y ¡recuerda!, estás estudiando con metodología online: tu esfuerzo y constancia son imprescindibles para conseguir buenos resultados. ¡No dejes todo para el último día!