Denominación de la asignatura: Aplicaciones Lingüísticas en la Tecnología Digital
Postgrado al que pertenece: Máster Universitario en Humanidades Digitales
Créditos ECTS: 6
Cuatrimestre en el que se imparte: Segundo
Carácter de la asignatura: Obligatoria

Presentación

¿Qué entendemos por «Humanidades»? Entendemos por Humanidades todas aquellas disciplinas que estudian el comportamiento, la condición y la actividad del ser humano, en contraste con las Ciencias Naturales que basan su estudio en el análisis de la naturaleza y de los fenómenos relacionados con ella.
El lenguaje tanto hablado como escrito es una facultad específica del ser humano.
¿Que interacción hay entre el lenguaje y las humanidades? El lenguaje es el vehiculo de comunicación imprescindible en todo tipo de actividad humana.
Todas las áreas de conocimiento disponen de documentación expresada en textos escritos y orales. Las instituciones culturales, los centros de atención públicos y privados disponen de repositorios de documentación resultante de su actividad.
Actualmente, y gracias a la tecnología digital, se dispone de grandes volúmenes de documentación escrita y oral: el problema que se plantea es, por tanto, cómo acceder de manera inteligente y organizada a dicha información.
La tecnología lingüística tiene como objetivo facilitar a los usuarios no expertos el acceso a la información digital disponible y desarrollar aplicacionnes que permitan emular el comportamiento humano cuando nos comunicamos. Para acceder a la información, los textos deben ser procesados en diferentes niveles de análisis: segmentación del texto, análisis, morfológico y sintáctico e interpretación semántica. Las aplicaciones de procesamiento del lenguaje incluyen la traducción automática, el resumen automático y la detección de la polaridad de los textos, entre otras.
Estos son los temas que nos ocuparán en este manual sobre las Humanidades y las Tecnologías del Lenguaje.

Competencias básicas

  • CB6: Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7: Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8: Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9: Que los estudiantes sepan comunicar sus conclusiones, y los conocimientos y razones últimas que las sustentan, a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10: Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias generales

  • CG1: Seleccionar las metodologías y técnicas de investigación científica más adecuadas para llevar a cabo proyectos de iniciación a la investigación en el ámbito de las humanidades digitales.
  • CG3: Exponer cuáles son los lenguajes, herramientas y aplicaciones pertinentes para la propuesta y ejecución de proyectos de iniciación a la investigación vinculados con las humanidades digitales.
  • CG4: Proponer proyectos contextualizados en las distintas líneas de investigación que ofrecen las humanidades digitales.

Competencias específicas

  • CE9: Valorar las principales funciones que el tratamiento computacional del lenguaje ofrece en el ámbito de las humanidades digitales.
  • CE10: Identificar las herramientas adecuadas para llevar a cabo tareas vinculadas con el tratamiento lingüístico de los datos.

Competencias transversales

  • CT1: Aplicar las nuevas tecnologías como herramientas didácticas para el intercambio comunicacional en el desarrollo de procesos de indagación y de aprendizaje.
  • CT2: Desarrollar habilidades de comunicación, para redactar informes y documentos, o realizar atractivas y eficaces presentaciones de los mismos.

Tema 1. Tecnologías del lenguaje: tareas y herramientas. Introducción

  • Introducción y objetivos
  • El procesamiento de la lengua
  • Preparación de los textos
  • Segmentación del texto (tokenización)
  • Plan de negocio de la película

Tema 2. Análisis morfológico y morfosintáctico

  • Introducción y objetivos
  • Análisis morfológico y stemming
  • Desambiguación morfológica
  • Analizadores morfológicos

Tema 3. Las Humanidades y las tecnologías del lenguaje

  • Introducción y objetivos
  • Análisis sintáctico
  • Análisis de constituyentes
  • Análisis en dependencias
  • Analizadores sintácticos
  • Análisis sintáctico parcial: los chunks
  • Análisis fragmental: chunking

Tema 4. Interpretación semántica

  • Introducción y objetivos
  • Semántica léxica
  • Semantica compositiva: semántica lógica
  • Semántica distribucional

Tema 5. Recursos lingüísticos: corpus lingüísticos

  • Introducción y objetivos
  • Los corpus lingüísticos y las Humanidades
  • Lingüística de corpus: procesos básicos y herramientas
  • Tipos de corpus

Tema 6. Recursos lingüísticos: ontologías y bases de conocimiento

  • Introducción y objetivos
  • ¿Qué es una ontología?
  • Bases de conocimiento
  • Lexicones y gazetteers
  • Terminologías

Tema 7. Aplicaciones básicas de las tecnologías del lenguaje

  • Introducción y objetivos
  • Extracción de información
  • Síntesis y reconocimiento del habla

Tema 8. Otras aplicaciones

  • Introducción y objetivos
  • Traducción automática
  • Búsqueda de la respuesta
  • Resumen automático
  • Generación de la lengua

Anexo 1. Prácticas. Herramientas de análisis: Análisis morfológico y morfosintáctico

  • Introducción y objetivos
  • Instalación de Python, NLTK y spaCy
  • Usando Phyton
  • Usando NLTK
  • spaCy
  • FreeLing

Anexo 2. Las Humanidades y las tecnologías del lenguaje

  • Introducción y objetivos
  • WordNet
  • AnCora

Anexo 3. Prácticas. Trabajos en grupo

  • Introducción y objetivos
  • Un sistema automático de búsqueda de la respuesta: valoración de la comprensión lectora
  • Un sistema de Resumen Automático (RA): sistema de construcción de biografías

Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.

Las actividades formativas de esta asignatura son las siguientes:

  • Trabajo. Se trata de actividades de diferentes tipos: reflexión, análisis de casos, prácticas, etc.
  • Comentario de lecturas. Es un tipo de actividad muy concreto que consiste en el análisis de textos de artículos de autores expertos en diferentes temas de la asignatura.
  • Casos prácticos. Situarán al alumno ante situaciones reales que tendrán que analizar y tras ello tomar decisiones, evaluar consecuencias y alternativas.
  • Participación en eventos. Son eventos programados todas las semanas del cuatrimestre: sesiones presenciales virtuales, foros de debate.
Descargar programación

Estas actividades formativas prácticas se completan, por supuesto, con estas otras:

  • Estudio personal
  • Tutorías. Las tutorías se pueden articular a través de diversas herramientas y medios. Durante el desarrollo de la asignatura, el profesor programa tutorías en días concretos para la resolución de dudas de índole estrictamente académico a través de las denominadas “sesiones de consultas”. Como complemento de estas sesiones se dispone también del foro “Pregúntale al profesor de la asignatura” a través del cual se articulan algunas preguntas de alumnos y las correspondientes respuestas en el que se tratan aspectos generales de la asignatura. Por la propia naturaleza de los medios de comunicación empleados, no existen horarios a los que deba ajustarse el alumno.
  • Examen final presencial

Las horas de dedicación a cada actividad se detallan en la siguiente tabla:

ACTIVIDADES FORMATIVAS HORAS POR ASIGNATURA % PRESENCIAL
Sesiones presenciales virtuales 15 horas 100%
Lecciones magistrales 6 horas 0
Estudio del material básico 62 horas 0
Lectura del material complementario 45 horas 0
Trabajos, casos prácticos 17 horas 0
Tutorías 16 horas 30%
Trabajo colaborativo 7 horas 0
Total 180 horas -

Bibliografía básica

Recuerda que la bibliografía básica es imprescindible para el estudio de la asignatura. Cuando se indica que no está disponible en el aula virtual, tendrás que obtenerla por otros medios: librería UNIR, biblioteca...

Los textos necesarios para el estudio de la asignatura han sido elaborados por UNIR y están disponibles en formato digital para consulta, descarga e impresión en el aula virtual.

Bibliografía complementaria

  • Bhargav Srinivasa-Desikan. Natural Language Processing and Computational Linguistics: A practical guide to text analysis with Python, Gensim, spaCy, and Keras. United Kingdom: Packt Publishing Limited, 2018.
  • J. Eisenstein. Introduction to Natural Language Processing. MIT, 2019.
  • M. Z. Kurdi. Natural Language Processing and Computational Linguistics 1: Speech, Morphology and Syntax. John Wiley & Sons, 2016.
  • M. A. Martí Antonín (coord.). Tecnologías del lenguaje. Barcelona: Ediciones de la UOC, 2014.
  • Clark, Alexander, Chris Fox y Shalom Lappin (eds.). The Handbook of Computational Linguistics and Natural Language Processing. Blackwell Handbooks in Linguistics. John Wiley & Sons, 2012.
  • Indurkhya, Nitin y Fred J. Damerau. Handbook of Natural Language Processing, Second Edition. Chapman & Hall/CRC Machine Learning & Pattern Recognition, 2010.

El sistema de calificación se basa en la siguiente escala numérica:

0 - 4, 9 Suspenso (SS)
5,0 - 6,9 Aprobado (AP)
7,0 - 8,9 Notable (NT)
9,0 - 10 Sobresaliente (SB)

La calificación se compone de dos partes principales:

El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL y OBLIGATORIO. Supone el 60% de la calificación final y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO.

La evaluación continua supone el 40% de la calificación final. Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.

Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua permite que realices las que prefieras hasta conseguir el máximo puntuable mencionado. En la programación semanal de la asignatura, se detalla la calificación máxima de cada actividad o evento concreto puntuables.

Sistema de evaluación Ponderación min - max
Participación del estudiante (sesiones, foros, tutorías) 0% - 30%
Trabajos, proyectos, laboratorios/talleres y casos 10% - 40%
Test de autoevaluación 0% - 30%
Examen final presencial 60% - 60%

Elisabet Comelles Pujadas

Formación académica: Licenciada en Filología Inglesa y también licenciada en Lingüística, ambos por la Universidad de Barcelona. Doctora en Ciencia Cognitiva y Lenguaje por la Universidad de Barcelona, con la tesis Automatic Machine Translation Evaluation: A Qualitative Approach. Premio extraordinario de doctorado 2014-2015. Acreditada por la AQU (Agencia por la calidad del sistema universitario de Cataluña) como profesor lector.

Experiencia: Docente del departamento de Lenguas y Literaturas Modernas y de Estudios Ingleses de la Universidad de Barcelona. Su docencia se centra en la gramática descriptiva del inglés y en el uso de la tecnología lingüística en el aula. Ha trabajado en diversas compañías de tecnología lingüística y fue miembro del grupo TALP de la Universidad Politécnica de Cataluña durante seis años, donde se dedicaba a la traducción automática y el procesamiento del lenguaje natural. Miembro del Grupo de Investigación Interuniversitario GRIAL-UB y colaboradora del Grupo de Investigación en Lexicología y Lingüística de Corpus (GERLIC). Investigadora en diversos proyectos financiados por la Unión Europea y por el Ministerio de Ciencia y Tecnología. Su investigación se centra en la lingüística computacional, en concreto, en la traducción automática y la evaluación de esta, la lingüística de corpus y el uso de la tecnología en la enseñanza del inglés como lengua extranjera.

Obviamente, al tratarse de formación online puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de actividades, trabajos y exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:

  1. Desde el Campus virtual podrás acceder al aula virtual de cada asignatura en la que estés matriculado y, además, al aula virtual del Curso de introducción al campus virtual. Aquí podrás consultar la documentación disponible sobre cómo se utilizan las herramientas del aula virtual y sobre cómo se organiza una asignatura en la UNIR y también podrás organizar tu plan de trabajo con tu tutor personal.
  2. Observa la programación semanal. Allí te indicamos qué parte del temario debes trabajar cada semana.
  3. Ya sabes qué trabajo tienes que hacer durante la semana. Accede ahora a la sección Temas del aula virtual. Allí encontrarás el material teórico y práctico del tema correspondiente a esa semana.
  4. Comienza con la lectura de las Ideas clave del tema. Este resumen te ayudará a hacerte una idea del contenido más importante del tema y de cuáles son los aspectos fundamentales en los que te tendrás que fijar al estudiar el material básico. Consulta, además, las secciones del tema que contienen material complementario.
  5. Dedica tiempo al trabajo práctico (sección Actividades y Test). En la programación semanal te detallamos cuáles son las actividades correspondientes a cada semana y qué calificación máxima puedes obtener con cada una de ellas.
  6. Te recomendamos que participes en los eventos del curso (sesiones presenciales virtuales, foros de debate…). Para conocer la fecha concreta de celebración de los eventos debes consultar las herramientas de comunicación del aula vitual. Tu profesor y tu tutor personal te informarán de las novedades de la asignatura.

En el aula virtual del Curso de introducción al campus virtual encontrarás siempre disponible la documentación donde te explicamos cómo se estructuran los temas y qué podrás encontrar en cada una de sus secciones.

Recuerda que en el aula virtual del Curso de introducción al campus virtual puedes consultar el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Sesiones presenciales virtuales, Envío de actividades, etc.

Ten en cuenta estos consejos...

  • Sea cual sea tu plan de estudio, accede periódicamente al aula Virtual, ya que de esta forma estarás al día de las novedades del curso y en contacto con tu profesor y con tu tutor personal.
  • Recuerda que no estás solo: consulta todas tus dudas con tu tutor personal utilizando el correo electrónico. Además, siempre puedes consultar tus dudas sobre el temario en los foros que encontrarás en cada asignatura (Pregúntale al profesor).
  • ¡Participa! Siempre que te sea posible accede a los foros de debate. El intercambio de opiniones, materiales e ideas nos enriquece a todos.
  • Y ¡recuerda!, estás estudiando con metodología on line: tu esfuerzo y constancia son imprescindibles para conseguir buenos resultados. ¡No dejes todo para el último día!