Última revisión realizada: 14/12/2022

Denominación de la asignatura: Análisis de Datos Masivos para el Negocio
Postgrado al que pertenece: Máster Universitario en Inteligencia de Negocio
Créditos ECTS: 6
Cuatrimestre en el que se imparte: Primero
Carácter de la asignatura: Obligatoria

Presentación

En esta asignatura el alumno obtendrá los conocimientos básicos de la ciencia basada en datos. La asignatura se divide en dos bloques. El primero es un bloque de introducción a la ciencia de los datos donde se presentan las metodologías disponibles y las fases o ciclo de vida de un proyecto orientado a datos. El segundo bloque es más técnico y está dedicado al análisis y modelado basado en datos.

El primer bloque presenta el concepto de ciclo de vida de un proyecto basdo en la ciencia de los datos y se presentan técnicas de extracción, preparación y almacenamiento de datos. Se profundiza en las técnicas de almacenamiento para información no estructurada y Big data.

El segundo bloque comienza con un conjunto de técnicas de análisis estadístico. Se incluyen técnicas de análisis estadístico univariante, tanto descriptivos como técnicas estadísticas concretas; técnicas para el análisis de diversos tipos de datos, que permiten conocer la interrelación existente entre las distintas variables que componen un sistema de información; y técnicas de análisis estadístico multivariante, con gran aplicabilidad en el proceso de toma de decisiones de negocio. El bloque continúa presentando técnicas predictivas para la estimación de variables cuantitativas, por medio de la explicación teórica y práctica de los modelos de series temporales y su aplicación en los negocios para las previsiones de resultados (operativos, ventas, marketing, etc.). A continuación, se presenta el concepto de aprendizaje automático y se muestras sus técnicas más importantes. Finalmente se analizan las técnicas de NLP para el análisis de datos de textos provenientes de fuentes no estructuradas.

Competencias básicas

  • CB6: Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7: Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB9: Que los estudiantes sepan comunicar sus conclusiones más los conocimientos y razones que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10: Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida auto dirigido o autónomo.

Competencias generales

  • CG2: Desarrollar habilidades analíticas para la resolución de problemas de negocio.
  • CG4: Desarrollar habilidades de trabajo en equipos multidisciplinares para el desarrollo de soluciones consensuadas, en el ámbito de la inteligencia de negocio.

Competencias transversales

  • CT1: Aplicar las nuevas tecnologías como herramientas didácticas para el intercambio comunicacional en el desarrollo de procesos de indagación y de aprendizaje.

Competencias específicas

  • CE6: Analizar los procesamientos y las técnicas de análisis de datos para convertir los datos en conocimiento accionable.
  • CE9: Evaluar el aporte de valor de la minería de datos al sistema de inteligencia de negocio en la organización.

Tema 1. Modelo de proceso de un proyecto orientado a datos

  • La ciencia de los datos
  • Fases de un proyecto orientado a datos
  • Modelos de proceso de un proyecto orientado a datos

Tema 2. Extracción, preparación y almacenamiento de datos

  • Introducción y objetivos
  • Extracción de datos
  • Validación de datos
  • Transformación de datos
  • Reducción de los datos
  • Almacenamiento de datos

Tema 3: Técnicas estadísticas de análisis de datos

  • Estadística descriptiva
  • Análisis de correlación
  • Análisis de regresión
  • Intervalos de confianza y contrastes de hipótesis

Tema 4. Series temporales

  • ¿Qué es una serie temporal?
  • Métodos de análisis y predicción de series temporales.

Tema 5. Proceso del modelado de datos

  • El modelado de datos
  • El proceso de modelado de datos
  • Aprendizaje automático

Tema 6. Técnicas de aprendizaje supervisado

  • Introducción a las técnicas de predicción
  • Técnicas de predicción
  • Introducción a las técnicas de clasificación
  • Técnicas de clasificación

Tema 7. Técnicas de aprendizaje no supervisado

  • Introducción a las técnicas de clusterización
  • Técnicas de clusterización
  • Introducción a las técnicas de reducción de la dimensión
  • Técnicas de reducción de la dimensión

Tema 8. Técnicas de procesamiento del lenguaje natural

  • Información basada en texto
  • Técnicas básicas de procesamiento de lenguaje natural
  • Minería de textos. Aplicaciones

Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.

Las actividades formativas de esta asignatura son las siguientes:

  • Casos prácticos. Situarán al alumno ante situaciones reales que tendrán que analizar y tras ello tomar decisiones, evaluar consecuencias y alternativas.
  • Participación en eventos. Son eventos programados todas las semanas del cuatrimestre: sesiones presenciales virtuales, foros de debate.
Descargar programación

Estas actividades formativas prácticas se completan, por supuesto, con estas otras:

  • Estudio personal
  • Tutorías. Las tutorías se pueden articular a través de diversas herramientas y medios. Durante el desarrollo de la asignatura, el profesor programa tutorías en días concretos para la resolución de dudas de índole estrictamente académico a través de las denominadas “sesiones de consultas”. Como complemento de estas sesiones se dispone también del foro “Pregúntale al profesor de la asignatura” a través del cual se articulan algunas preguntas de alumnos y las correspondientes respuestas en el que se tratan aspectos generales de la asignatura. Por la propia naturaleza de los medios de comunicación empleados, no existen horarios a los que deba ajustarse el alumno.
  • Examen final presencial u online

Las horas de dedicación a cada actividad se detallan en la siguiente tabla:

ACTIVIDADES FORMATIVAS HORAS POR ASIGNATURA % PRESENCIAL
Sesiones presenciales virtuales 15 horas 100%
Recursos didácticos audiovisuales 6 horas 0
Estudio del material básico 60 horas 0
Lectura del material complementario 45 horas 0
Trabajos, casos prácticos 29 horas 0
Tutorías 16 horas 30%
Trabajo colaborativo 7 horas 0
Examen final 2 horas 100%
Total 180 horas -

Bibliografía básica

Recuerda que la bibliografía básica es imprescindible para el estudio de la asignatura. Cuando se indica que no está disponible en el aula virtual, tendrás que obtenerla por otros medios: librería UNIR, biblioteca...

Los textos necesarios para el estudio de la asignatura han sido elaborados por UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.

 

Bibliografía complementaria

  • Ciaburro, G. (2020). Reinforcement Learning with R. Pack.
  • García S., Luengo J. y Herrera F. (2015). Data Preprocessing in Data Mining. Springer International Publishing AG.

  • Kevin P. M. (2022). Probabilistic Machine Learning: An introduction.
  • Martínez Llario J.C.(2013). PostGIS 2. Análisis Espacial Avanzado. Universidad Politécnica de Valencia.
  • Marz, N., & Warren, J. (2015). Big Data: Principles and best practices of scalable real-time data systems. New York; Manning Publications Co.
  • Mayer-Schonberger V. y Cukier K. (2013) Big data : a revolution that will transform how we live, work, and think. Houghton Mifflin Harcourt. (Versión Castellano: Big Data, La revolución de los Datos Masivos).
  • Sarasa A. (2016). Introducción a las Bases de Datos NoSQL usando MongoDB. Editorial UOC.
  • Siegel, E.  (2013) Analitica predictiva: Predecir el futuro utilizando Big Data. Madrid. Anaya Multimedia.
  • Suthaharan, S. (2016). Machine learning models and algorithms for big data classification. Integr. Ser. Inf. Syst, 36, 1-12
  • Zikopoulos P. y Eaton C. (2015). Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data. IBM. McGraw Hill Professional. http://www-01.ibm.com/software/data/bigdata/

El sistema de calificación se basa en la siguiente escala numérica:

0 - 4, 9 Suspenso (SS)
5,0 - 6,9 Aprobado (AP)
7,0 - 8,9 Notable (NT)
9,0 - 10 Sobresaliente (SB)

La calificación se compone de dos partes principales:

El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL U ONLINE y OBLIGATORIO. Supone el 60% de la calificación final y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO.

La evaluación continua supone el 40% de la calificación final. Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.

Sistema de evaluación Ponderación min - max
Participación del estudiante 0% - 10%
Trabajos, proyectos, y/o casos 20% - 40%
Test de evaluación 0% - 10%
Examen final 60% - 60%

Antonio Rodríguez Andrés

Formación

Doctor en Económicas por la University of Southern Denmark (SDU), Máster en Economía Industrial por la Universidad Carlos III y Máster en Economía por la Universidad de Lausana.

Experiencia

Durante una década ha sido profesor en los departamentos de Económicas de universidades de todo el mundo en países como Dinamarca, Colombia, Chile, Marruecos, Chipre y España. En la actualidad, es investigador en la VSB Technical University of Ostrava (República Checa).

Líneas de investigación

Su investigación se centra en métodos cuantitativos, economía aplicada a la salud, derecho y economía. Además, trabaja en técnicas de aprendizaje automático, que son aplicadas por empresas y gobiernos para solucionar problemas de impacto social. Publica sus investigaciones en revistas internacionales de prestigio como Journal of Business Ethics, Health Policy o Technological Forecasting and Social Change.

 

Obviamente, al tratarse de formación online puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de actividades, trabajos y exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:

  1. Desde el Campus virtual podrás acceder al aula virtual de cada asignatura en la que estés matriculado y, además, al aula virtual del Curso de introducción al campus virtual. Aquí podrás consultar la documentación disponible sobre cómo se utilizan las herramientas del aula virtual y sobre cómo se organiza una asignatura en la UNIR y también podrás organizar tu plan de trabajo personal con tu profesor-tutor.
  2. Observa la programación semanal. Allí te indicamos qué parte del temario debes trabajar cada semana.
  3. Ya sabes qué trabajo tienes que hacer durante la semana. Accede ahora a la sección Temas del aula virtual. Allí encontrarás el material teórico y práctico del tema correspondiente a esa semana.
  4. Comienza con la lectura de las Ideas clave del tema. Este resumen te ayudará a hacerte una idea del contenido más importante del tema y de cuáles son los aspectos fundamentales en los que te tendrás que fijar al estudiar el material básico. Consulta, además, las secciones del tema que contienen material complementario.
  5. Dedica tiempo al trabajo práctico (sección Actividades y Test). En la programación semanal te detallamos cuáles son las actividades correspondientes a cada semana y qué calificación máxima puedes obtener con cada una de ellas.
  6. Te recomendamos que participes en los eventos del curso (sesiones presenciales virtuales, foros de debate…). Para conocer la fecha concreta de celebración de los eventos debes consultar las herramientas de comunicación del aula vitual. Tu profesor y tu profesor-tutor te informarán de las novedades de la asignatura.

En el aula virtual del Curso de introducción al campus virtual encontrarás siempre disponible la documentación donde te explicamos cómo se estructuran los temas y qué podrás encontrar en cada una de sus secciones.

Recuerda que en el aula virtual del Curso de introducción al campus virtual puedes consultar el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Sesiones presenciales virtuales, Envío de actividades, etc.

Ten en cuenta estos consejos...

  • Sea cual sea tu plan de estudio, accede periódicamente al aula Virtual, ya que de esta forma estarás al día de las novedades del curso y en contacto con tu profesor y con tu profesor tutor.
  • Recuerda que no estás solo: consulta todas tus dudas con tu profesor-tutor utilizando el correo electrónico. Además, siempre puedes consultar tus dudas sobre el temario en los foros que encontrarás en cada asignatura (Pregúntale al profesor).
  • ¡Participa! Siempre que te sea posible accede a los foros de debate. El intercambio de opiniones, materiales e ideas nos enriquece a todos.
  • Y ¡recuerda!, estás estudiando con metodología on line: tu esfuerzo y constancia son imprescindibles para conseguir buenos resultados. ¡No dejes todo para el último día!