Última revisión realizada: 26/05/2022

Denominación de la asignatura: Introducción a la Ciencia de Datos
Postgrado al que pertenece: Grado en Ciencia de Datos
Créditos ECTS: 6
Curso y cuatrimestre en el que se imparte: Primer curso, primer cuatrimestre
Carácter de la asignatura: Básica
Materia a la que pertenece: Estructura de la Información

Presentación

El objetivo principal de esta asignatura es introducir al alumno a la ciencia de datos, el ciclo de vida de los datos, las tecnologías big data y las principales aplicaciones de la ciencia de datos en la sociedad y la empresa, sirviendo de referencia y punto de partida a los estudios del Grado en Ciencia de Datos. El término ciencia de datos o data science se ha convertido en tendencia en los últimos años, sobre todo desde la irrupción masiva de los sistemas big data. Con él se define de forma específica una nueva profesión que tiene por objeto dar sentido a los vastos volúmenes de datos que se manejan en la actualidad. Sus cimientos están basados en la utilización conjunta de dos disciplinas clave, como son la estadística y la informática (y, por ende, las matemáticas), haciendo uso del método científico para extraer conocimiento de un conjunto de datos disponibles.

Gracias a ellas se desarrollan métodos, procesos, algoritmos, teorías, sistemas y, en último término, soluciones, que extraen información relevante y útil de los datos. Dentro del ciclo de vida de los datos nos encontramos con diferentes etapas como la captura, el almacenamiento, el tratamiento de los datos, el análisis de los datos (donde es habitual emplear algoritmos de inteligencia artificial y, más concretamente, machine learning o aprendizaje automático) y, finalmente, la explotación de los datos mediante la presentación de informes y el uso de herramientas de visualización o inteligencia empresarial (business inteligence). En esta asignatura se tratarán las diferentes etapas del ciclo de vida de los datos, las tecnologías más importantes involucradas en el tratamiento de datos masivos, la importancia de esta ciencia en la sociedad y la empresa, así como los aspectos de privacidad y protección de datos más relevantes para tener en cuenta en la actualidad.

Competencias básicas

  • CB1: Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio.
  • CB2: Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • CB3: Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • CB4: Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • CB5: Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.

Competencias generales

  • CG2: Capacidad de obtener información y saber interpretarla utilizando el software más adecuado en cada caso.
  • CG3: Capacidad de reunir e interpretar datos relevantes, dentro del área de la ciencia de datos, para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética.
  • CG4: Capacidad de tomar decisiones a partir de consideraciones abstractas, para organizar, planificar y optimizar cuestiones relacionadas con la ciencia de datos.
  • CG5: Capacidad de desarrollar aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores en el ámbito de la ciencia de datos con un alto grado de autonomía.
  • CG6: Capacidad de presentar ideas, procedimientos o redactar informes, así como asesorar a personas u organizaciones en su ámbito de especialización en ciencia de datos.
  • CG7: Capacidad para saber comunicar y transmitir los conocimientos y habilidades relacionados con la ciencia de datos.
  • CG8: Ser capaz de aplicar la capacidad analítica y de abstracción, y el pensamiento lógico adquiridos para identificar y analizar problemas complejos y formular soluciones en un entorno multidisciplinar relacionado con la ciencia de datos.
  • CG9: Capacidad para dirigir las actividades objeto de los proyectos del ámbito de la ciencia de datos.

Competencias específicas

  • CE3: Ser capaz de conocer y aplicar las características, funcionalidades y estructura de las bases de datos que permitan su adecuado uso, diseño y programación.
  • CE5: Conocer y ser capaz de aplicar los procedimientos algorítmicos básicos de las tecnologías informáticas para diseñar soluciones a problemas, analizando la idoneidad y complejidad de los algoritmos propuestos.
  • CE14: Conocer las principales técnicas del análisis de datos, así como aplicaciones donde han sido utilizadas exitosamente.
  • CE15: Conocer y saber desarrollar las características, funcionalidades y estructura de los sistemas y bases de datos distribuidos a través de las redes de computadores e Internet.
  • CE22: Ser capaz de diseñar y utilizar de forma eficiente los tipos y estructuras de datos más adecuados a la resolución de un problema.
  • CE24: Conocer los requisitos de privacidad de los entornos de datos masivos y las consiguientes medidas de protección: técnicas, organizativas y legales.

Competencias transversales

  • CT1: Aplicar las nuevas tecnologías como herramientas para el intercambio comunicacional en el desarrollo de procesos de indagación y de aprendizaje.
  • CT2: Desarrollar habilidades de comunicación, para redactar informes y documentos, o realizar eficaces presentaciones de los mismos.

Tema 1. Qué son los datos y cuál es su ciclo de vida

  • Origen e historia de la ciencia de datos
  • ¿Qué son los datos?
  • Ciclo de vida de un dato
  • Cuaderno de ejercicios

Tema 2. Captura de la información

  • Organización de los datos
  • Métodos de captura
  • Evaluación de la calidad de recogida
  • Cuaderno de ejercicios

Tema 3. Almacenamiento de la información

  • Métodos de almacenamiento
  • Métodos de exposición
  • Cuaderno de ejercicios

Tema 4. Tratamiento de datos

  • Conceptos básicos del tratamiento de datos
  • Operaciones de preparación comunes
  • Métricas y agregaciones
  • ETL
  • Cuaderno de ejercicios

Tema 5. Análisis y modelos estadísticos

  • Conceptos básicos de estadística
  • Medidas que resumen la información
  • Probabilidad condicional y variables aleatorias
  • Regresión y correlación
  • Distribución
  • Cuaderno de ejercicios

Tema 6. Visualización de datos

  • Historia y evolución de la visualización de datos
  • Aplicaciones por sectores y ejemplos
  • Conceptos generales de la visualización
  • De los datos al conocimiento a través de la visualización
  • Herramientas de visualización
  • Cuaderno de ejercicios

Tema 7. Big data y volúmenes de datos masivos

  • La era de los datos masivos
  • Retos e implicaciones
  • Almacenamiento de datos masivos
  • Tecnologías para el procesamiento de datos masivos
  • Arquitecturas big data
  • Cuaderno de ejercicios

Tema 8. Datos y sociedad

  • Ámbitos de aplicación
  • Implicaciones en la sociedad
  • Implicaciones éticas
  • Cuaderno de ejercicios

Tema 9. Datos y empresa

  • Datos como activo empresarial
  • Estructuración de datos en la empresa
  • Casos de uso de la aplicación de la ciencia de datos en diferentes sectores
  • Cuaderno de ejercicios

Tema 10. Privacidad y protección de datos

  • Definiciones previas
  • RGPD - Reglamento General de Protección de Datos
  • CCPA - California Consumer Privacy Act
  • Disociación y anonimización de datos
  • Cuaderno de ejercicios

Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.

Las actividades formativas de esta asignatura son las siguientes:

  • Trabajos individuales. Se trata de actividades de diferentes tipos: reflexión, análisis de casos, prácticas, análisis de textos, etc.
  • Trabajos colaborativos. Son actividades grupales en las que tendrás la oportunidad de trabajar con tus compañeros. Durante el desarrollo de la asignatura tendrás toda la información que necesites sobre cómo organizarte para trabajar en equipo.
  • Participación en eventos. Son actividades programadas todas las semanas del cuatrimestre como clases en directo o foros de debate.
Descargar programación

Estas actividades formativas prácticas se completan, por supuesto, con estas otras:

  • Estudio personal
  • Tutorías. Las tutorías se pueden articular a través de diversas herramientas y medios. Durante el desarrollo de la asignatura, el profesor programa tutorías en días concretos para la resolución de dudas de índole estrictamente académico a través de las denominadas “sesiones de consultas”. Como complemento de estas sesiones se dispone también del foro “Pregúntale al profesor de la asignatura” a través del cual se articulan algunas preguntas de alumnos y las correspondientes respuestas en el que se tratan aspectos generales de la asignatura. Por la propia naturaleza de los medios de comunicación empleados, no existen horarios a los que deba ajustarse el alumno.
  • Examen final presencial u online

Las horas de dedicación a cada actividad se detallan en la siguiente tabla:

ACTIVIDADES FORMATIVAS HORAS POR ASIGNATURA % PRESENCIAL
Sesiones presenciales virtuales 15 horas 100 %
Recursos didácticos audiovisuales 6 horas 0
Estudio del material básico 52 horas 0
Lectura del material complementario 25 horas 0
Trabajos, casos prácticos y test de evaluación 19 horas 0
Laboratorios virtuales 10 horas 16,7 %
Tutorías 16 horas 0
Trabajo colaborativo 7 horas 0
Total 150 horas -

Bibliografía básica

Recuerda que la bibliografía básica es imprescindible para el estudio de la asignatura. Cuando se indica que no está disponible en el aula virtual, tendrás que obtenerla por otros medios: librería UNIR, biblioteca...

Los textos necesarios para el estudio de la asignatura han sido elaborados por UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.

  • Bishop, C. M. (2006). Pattern Recognition and Machine Learning (Information Science and Statistics). Springer.
  • Blum, A., Hopcroft, J. y Kannan, R. (2020). Foundations of data science. Cambridge University Press.
  • Bruce, P., Bruce, A. y Gedeck, P. (2020). Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python. O'Reilly Media.
  • Gelman, A. y Hill, J. (2006). Data analysis using regression and multilevel/hierarchical models. Cambridge university press.
  • Géron, A. (2019). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, tools, and techniques to build intelligent systems. O'Reilly Media.
  • Hastie, T., Tibshirani, R. y Friedman, J. (2017). The elements of statistical learning data mining, inference, and prediction (12ª ed.). Springer.
  • Kane, F. (2017). Hands-on data science and python machine learning. Packt Publishing Ltd.
  • Kirk, A. (2016). Data visualisation: A handbook for data driven design. Sage.
  • VanderPlas, J. (2016). Python data science handbook: Essential tools for working with data. O'Reilly Media.
  • White, T. (2012). Hadoop: The definitive guide. O'Reilly Media.

El sistema de calificación se basa en la siguiente escala numérica:

0 - 4, 9 Suspenso (SS)
5,0 - 6,9 Aprobado (AP)
7,0 - 8,9 Notable (NT)
9,0 - 10 Sobresaliente (SB)

La calificación se compone de dos partes principales:

El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL u ONLINE y OBLIGATORIO. Supone el 60% de la calificación final y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO.

La evaluación continua supone el 40% de la calificación final. Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.

Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua permite que realices las que prefieras hasta conseguir el máximo puntuable mencionado. En la programación semanal de la asignatura, se detalla la calificación máxima de cada actividad o evento concreto puntuables.

Sistema de evaluación Ponderación min - max
Participación del estudiante 0% - 15%
Trabajos, proyectos, laboratorios y/o casos 25% - 40%
Test de evaluación 0% - 15%
Examen final 60% - 60%

Ricardo Serafín Alonso Rincón

Formación académica: Doctor en Ingeniería Informática por la Universidad de Salamanca (España), Máster Universitario en Sistemas Inteligentes por la misma universidad. Ingeniero de Telecomunicación por la Universidad de Valladolid (España).

Experiencia: su experiencia como docente incluye la impartición de la asignatura IoT Industrial, Plataformas IoT y Aplicaciones por Sectores en el Máster Universitario en Industria 4.0. Ha sido profesor de la asignatura Técnicas de Inteligencia Artificial y director de TFM en el Máster Universitario en Análisis y Visualización de Datos Masivos, profesor en el Especialista Universitario en Inteligencia de Datos y en el módulo Técnicas de Inteligencia Artificial en el Máster en Big Data and Fintech.

Líneas de investigación: Ricardo es investigador en el Grupo de Investigación BISITE de la Universidad de Salamanca. Sus principales líneas de investigación y desarrollo incluyen tecnologías como el Internet of things, el edge computing, los sistemas embebidos, los sistemas de localización en interiores, el cloud computing y la inteligencia artificial. Ha publicado más de quince artículos de investigación en revistas internacionales y más de treinta en conferencias internacionales.

Óscar García García

Formación académica: Doctor en Ingeniería Informática por la Universidad de Salamanca e Ingeniero de Telecomunicación por la Universidad de Valladolid. Máster para el Desarrollo de Sistemas de Comercio Electrónico por la Universidad de Salamanca (título propio).

Experiencia: docente en el Máster Universitario en Inteligencia Artificial de UNIR. Investigador en el grupo BISITE (Universidad de Salamanca). Anteriormente profesor asociado y colaborador en el grupo GSIC-EMIC en la Universidad de Valladolid. Ha participado en múltiples proyectos de investigación nacionales y europeos. En el ámbito empresarial es gestor de proyectos de software de eficiencia energética y cofundador de una startup especializada en sistemas RTLS y WSN.

Líneas de investigación: investigador y colaborador del grupo de investigación BISITE (USAL) es autor de más de treinta y cinco publicaciones científicas y de varias propiedades intelectuales. Sus líneas de investigación giran en torno a los sistemas WSN y RTLS como fuentes de información para el desarrollo de sistemas de eficiencia energética (demand-response, disaggregation, etc.), haciendo uso de técnicas big data, data analytics y social computing, que permitan mejorar el comportamiento energético de personas y máquinas.

Al tratarse de formación online puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de las actividades y la fecha de exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:

  1. Desde el Campus virtual podrás acceder al aula virtual de cada asignatura en la que estés matriculado y, además, al aula virtual del Curso de introducción al campus virtual. Aquí podrás consultar la documentación disponible sobre cómo se utilizan las herramientas del aula virtual y sobre cómo se organiza una asignatura en UNIR. También podrás organizar tu plan de trabajo con tu tutor personal.
  2. Observa la programación semanal. Allí te indicamos qué parte del temario debes trabajar cada semana.
  3. Ya sabes qué trabajo tienes que hacer durante la semana. Accede ahora a la sección Temas del aula virtual. Allí encontrarás el material teórico y práctico del tema correspondiente a esa semana.
  4. Comienza con la lectura de las Ideas clave del tema. Este material es el que debes estudiar para superar la asignatura. Consulta, además, las secciones del tema que contienen material complementario: con esto podrás tener una visión más amplia sobre el tema que estás trabajando.
  5. Dedica tiempo al trabajo práctico (sección Actividades). En la programación semanal te detallamos cuáles son las actividades correspondientes a cada semana y qué calificación máxima puedes obtener con cada una de ellas.
  6. Te recomendamos que participes en los eventos del curso (clases en directo, foros de debate…). Para conocer la fecha concreta de celebración de los eventos debes consultar las herramientas de comunicación del aula virtual. Tu profesor y tu tutor personal te informarán de las novedades de la asignatura.

En el aula virtual del Curso de introducción al campus virtual encontrarás siempre disponible la documentación donde te explicamos cómo se estructuran los temas y qué podrás encontrar en cada una de sus secciones. Tambén puedes consultar ahí el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Clases en directo, Envío de actividades, etc.

Ten en cuenta estos consejos...

  • Sea cual sea tu plan de estudio, accede periódicamente al aula virtual, ya que de esta forma estarás al día de las novedades del curso y en contacto con tu profesor y con tu tutor personal.
  • Recuerda que no estás solo: consulta todas tus dudas con tu tutor personal utilizando el correo electrónico. Además, siempre puedes consultar tus dudas sobre el temario en los foros que encontrarás en cada asignatura (Pregúntale al profesor).
  • ¡Participa! Siempre que te sea posible accede a los foros de debate. El intercambio de opiniones, materiales e ideas nos enriquece a todos.
  • Y ¡recuerda!, estás estudiando con metodología online: tu esfuerzo y constancia son imprescindibles para conseguir buenos resultados. ¡No dejes todo para el último día!