Denominación de la asignatura |
Métodos de Captura y Almacenamiento de los Datos |
Maestría a la que pertenece |
Análisis y Visualización de Datos Masivos |
Créditos ECTS |
5 |
La captura y el almacenamiento de la información son frecuentemente las fases iniciales en un proceso de análisis y representación de datos. La eficiencia del proceso general de análisis depende en gran proporción de seleccionar los métodos correctos, tanto para obtener como para almacenar datos sin procesar.
Esta asignatura proporciona los conceptos y las técnicas necesarias para, en un inicio, saber identificar posibles fuentes de datos y evaluar la aplicabilidad de los datos utilizando parámetros de calidad.
Además, se proporciona un resumen de las distintas tecnologías para el almacenamiento de información, comenzando con formatos de ficheros planos, tales como CSV, XML y JSON. El resumen incluye un breve repaso de SQL y la descripción de nuevas tecnologías NoSQL, aplicadas comúnmente en entornos Big Data.
Durante la asignatura se trabaja con el motor de base de datos MongoDB, cuya aplicabilidad se ve reflejada en el creciente número de usuarios y recursos de documentación como libros y artículos. La relevancia de esta tecnología hace meritorio un estudio en profundidad de patrones de diseño de esquemas en bases de datos orientadas a documentos.
Aparte de aprender las operaciones básicas para el tratamiento de datos en MongoDB, también conoceremos operaciones comunes durante la gestión de este tipo de bases de datos. Concretamente, aprenderemos los métodos de migración y distribución de bases de datos, así como conocer los parámetros de configuración adecuados para un entorno de producción.
Tema 1. Métodos de captura de información
Origen y calidad de los datos
Organización de los datos
Casos de estudio
Referencias
Tema 2. NoSQL
Descripción y tipos de bases de datos NoSQL
Algunos ejemplos rápidos
NoSQL vs SQL
Tema 3. MongoDB
Descarga e instalación
Software de apoyo
Flexibilidad del modelo
Inserción de datos
Lectura de datos
Actualización de datos
Caso práctico
Tema 4. Agregación
Concepto
Map-Reduce
Aggregation Framework
Tema 5. Gestión de MongoDB
Seguridad
Respaldo
Rendimiento
Sharding
Tema 6. Drivers
Introducción y descripción
Referencias: dónde consultar cada driver
Ejemplos de uso
Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.
Las actividades formativas con el docente son las siguientes:
Las actividades formativas independientes son las siguientes:
En la programación semanal puedes consultar cuáles son las actividades concretas que tienes que realizar en esta asignatura.
Estas actividades formativas prácticas se completan, por supuesto, con estas otras:
Bibliografía básica.
Los textos necesarios para el estudio de la asignatura han sido elaborados por la UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.
Además de este material disponible en el aula virtual, se utilizan los siguientes manuales:
Tema 2
Date, J. C. (2001). Introducción a los sistemas de bases de datos. México: Pearson. ISBN: 978-968-444-419-5.
Bibliografía complementaria
Banker, K. (2012). MongoDB in action. Nueva York: Manning Publications.
Chakrabarti, S. (2003). Mining the Web: Discovering Knowledge from Hypertext
Data (pp.17-43). California. Morgan Kaufmann.
Chodorow, K., & Dirolf, M. (2010). MongoDB: The Definitive Guide. California:
O’Reilly.
Copeland, R. (2013). MongoDB Applied Design Patterns. California: O’Reilly Media.
Davenport, T., & Prusak, L. (2000). Working Knowledge: How Organizations Manage
What They Know (pp.1-6). Massachusetts: Harvard Business Review Press.
Debenham, J. (1998). Knowledge Engineering. Unifying Knowledge Base and
Database Design (pp.15-22). Sydney: Springer.
Jarke, M., Jeusfeld, M.A., Quix, C., & Vassiliadis, P. (1998). Architecture and Quality of
Data Warehouses: An Extended Repository Approach. Advanced Information Systems
Engineering, Lecture Notes in Computer Science, 1413, 243-260.
Redman, T.C. (1996). Data Quality for the Information Age (pp.245-267).
Massachusetts: Artech House, Inc.
Shafranovich, Y. (2005). Common Format and MIME Type for Comma-Separated
Values (CSV) Files. Internet Engineering Task Force IETF RFC 4180.
Tiwari, S. (2011). Professional NoSQL. Indianapolis: John Wiley & Sons, Inc.
El sistema de calificación se basa en la siguiente escala numérica:
0 - 6, 9 |
No acreditada |
(NA) |
7,0 - 7,4 |
Suficiente |
(S) |
7,5 - 8,4 |
Regular |
(R) |
8,5 - 9,4 |
Bien |
(B) |
9,5 - 10 |
Muy bien |
(MB) |
La calificación se compone de dos partes principales:
CALIFICACIÓN | EXAMEN FINAL | 30% | |
EVALUACIÓN CONTINUA | 70% |
El examen se realiza al final del semestre y es de carácter ONLINE y OBLIGATORIO. Supone el 30% de la calificación final (3 puntos sobre 10).
La evaluación continua supone el 70% de la calificación final. Esta nota se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.
SISTEMA DE EVALUACIÓN |
% |
Participación en sesiones, foros y otros medios colaborativos en la plataforma |
15 |
Test parciales en plataforma |
5 |
Laboratorio virtual |
25 |
Trabajo: investigación e informe |
25 |
Examen final |
30 |
Total |
100 |
Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua es de 10 puntos. En la programación semanal de la asignatura, se detalla la calificación máxima de cada actividad o evento concreto puntuables.
Obviamente, al tratarse de formación on-line puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de actividades, trabajos y exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:
Recuerda que en el aula virtual de Curso de Introducción al campus virtual puedes consultar el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Sesiones presenciales virtuales, Envío de actividades, etc.
Ten en cuenta estos consejos…
|