Denominación de la asignatura: Procesamiento del Lenguaje Natural
Postgrado al que pertenece: Máster Universitario en Inteligencia Artificial
Créditos ECTS: 6
Cuatrimestre en el que se imparte: Segundo cuatrimestre
Carácter de la asignatura: Obligatoria
Materia a la que pertenece: Inteligencia artificial aplicada

Presentación

La lingüística computacional o el procesamiento del lenguaje natural es una disciplina que se ocupa de los sistemas artificiales capaces de usar el lenguaje para extraer información del medio o incluso para comunicarse con los humanos. En esta asignatura se estudian los principales algoritmos empleados en el procesamiento de la información lingüística y se desarrollan sistemas capaces de analizar el lenguaje a nivel léxico, sintáctico y semántico. También se aborda la construcción de sistemas de representación del conocimiento extraído a partir de los contenidos lingüísticos, llegando a usar estas estructuras para la construcción de agentes virtuales conversacionales.

Competencias básicas

  • CB6: Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7: Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8: Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9: Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10: Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias generales

  • CG6: Desarrollar habilidades avanzadas de interpretación rigurosa de los resultados científico-técnicos obtenidos al aplicar algoritmos de inteligencia artificial.

Competencias específicas

  • CE6: Estimar y evaluar el rendimiento de un sistema de inteligencia artificial en base a las técnicas empleadas, los datos de entrada disponibles y el contexto de ejecución.
  • CE16: Conocer los principales modelos de aprendizaje automático y detección de anomalías, así como su aplicación práctica en diferentes casos de uso que requieren automatización.
  • CE20: Diseñar y desarrollar sistemas inteligentes que generen interacciones naturales, teniendo en cuenta los estados cognitivos y emocionales del usuario.

Competencias transversales

  • CT2: Identificar las nuevas tecnologías como herramientas didácticas para el intercambio comunicacional en el desarrollo de procesos de indagación y de aprendizaje.
  • CT3: Conocer los procesos de generación y comprensión del lenguaje en humanos, así como los principales modelos computacionales de procesamiento del lenguaje natural.
  • CT4: Adquirir la capacidad de trabajo independiente, impulsando la organización y favoreciendo el aprendizaje autónomo.

Tema 1. Introducción al procesamiento del lenguaje natural

  • Procesamiento del lenguaje natural
  • Historia del procesamiento del lenguaje natural
  • Aplicaciones del PLN
  • Conocimiento del lenguaje utilizado en el PLN
  • Referencias bibliográficas

Tema 2. Análisis morfológico

  • Morfología
  • Elementos del análisis morfológico
  • Uso de autómatas finitos para el reconocimiento morfológico
  • Análisis morfológico basado en transductores de autómatas finitos
  • Análisis morfológico utilizando un lexicón y reglas ortográficas representados como transductores de autómatas finitos
  • Referencias bibliográficas

Tema 3. Etiquetado morfosintáctico (POS tagging)

  • Categorías morfosintácticas o gramaticales
  • Funcionamiento y características del etiquetado morfosintáctico
  • Etiquetado morfosintáctico basado en modelos ocultos de Markov (HMM)
  • Etiquetado morfosintáctico basado en aprendizaje automático
  • Referencias bibliográficas

Tema 4. Gramáticas para el análisis sintácticos

  • Sintaxis
  • Gramáticas de estructura sintagmática
  • Estrategias del análisis sintáctico utilizando una gramática libre de contexto
  • Gramáticas con categorías complejas (o gramáticas de unificación)
  • Análisis sintáctico con gramáticas de unificación
  • Gramáticas de dependencias o gramáticas valenciales
  • Referencias bibliográficas

Tema 5. Análisis sintáctico

  • Ambigüedad en el análisis sintáctico
  • Métodos para el análisis sintáctico basados en programación dinámica
  • Métodos probabilistas en el análisis sintáctico
  • Referencias bibliográficas

Tema 6. Semántica y representación del significado

  • Semántica
  • Estrategias o lenguajes para representar el significado
  • Lógica de primer orden
  • Lógica descriptiva
  • Referencias bibliográficas

Tema 7. Análisis semántico

  • Análisis semántico dirigido por la sintaxis
  • Anotaciones semánticas a las gramáticas libres de contexto
  • Análisis semántico integrado con el análisis sintáctico
  • Referencias bibliográficas

Tema 8. Semántica léxica

  • Significado de las palabras
  • Relaciones entre sentidos de las palabras
  • Desambiguación del sentido de las palabras
  • Similitud entre palabras
  • Referencias bibliográficas

Tema 9. Recursos para el procesamiento del lenguaje natural

  • Recursos lingüísticos
  • WordNet
  • Corpus en español
  • Herramientas y librerías para el procesamiento del lenguaje natural
  • Servicios cloud para el procesamiento del lenguaje natural
  • Referencias bibliográficas

Tema 10. Agentes conversacionales

  • Definición de agente conversacional
  • Características de las conversaciones entre humanos
  • Tipos de agentes conversacionales
  • Estructura de los agentes conversacionales
  • Diseño de chatbots
  • Referencias bibliográficas

Las actividades formativas de la asignatura se han elaborado con el objetivo de adaptar el proceso de aprendizaje a las diferentes capacidades, necesidades e intereses de los alumnos.

Las actividades formativas de esta asignatura son las siguientes:

  • Trabajos. Son actividades de cierta complejidad que conllevan por ejemplo una búsqueda de información, análisis y crítica de lecturas, resolución de problemas, etc. En el aula virtual encontrarás toda la información sobre cómo desarrollarlos y cómo y cuándo entregarlos.
  • Participación en eventos.Son eventos programados todas las semanas del cuatrimestre: sesiones presenciales virtuales, foros de debate, test.
  • Prácticas de laboratorios virtuales. Los laboratorios virtuales son sesiones presenciales virtuales que se llevan a cabo con herramientas de videoconferencia cuyo objetivo es que los alumnos utilicen algún tipo de herramienta informática para realizar uno o varios supuestos prácticos.
Descargar programación

Estas actividades formativas prácticas se completan, por supuesto, con estas otras:

  • Estudio personal
  • Tutorías. Las tutorías se pueden articular a través de diversas herramientas y medios. Durante el desarrollo de la asignatura, el profesor programa tutorías en días concretos para la resolución de dudas de índole estrictamente académico a través de las denominadas “sesiones de consultas”. Como complemento de estas sesiones se dispone también del foro “Pregúntale al profesor de la asignatura” a través del cual se articulan algunas preguntas de alumnos y las correspondientes respuestas en el que se tratan aspectos generales de la asignatura. Por la propia naturaleza de los medios de comunicación empleados, no existen horarios a los que deba ajustarse el alumno.
  • Examen final presencial

Las horas de dedicación a cada actividad se detallan en la siguiente tabla:

ACTIVIDADES FORMATIVAS HORAS POR ASIGNATURA % PRESENCIAL
Clases en directo 15 horas 100%
Lecciones magistrales 6 horas 0
Estudio del material básico 52 horas 0
Lectura del material complementario 25 horas 0
Prácticas de laboratorio virtual 12 horas 0
Trabajos, casos prácticos y test de autoevaluación 17 horas 0
Tutorías 16 horas 0
Trabajo colaborativo 7 horas 0
Total 150 horas -

Bibliografía básica

Recuerda que la bibliografía básica es imprescindible para el estudio de la asignatura. Cuando se indica que no está disponible en el aula virtual, tendrás que obtenerla por otros medios: librería UNIR, biblioteca...

  • Tema 4
    Badia, T. (2003). Técnicas de procesamiento de lenguaje. En M. A. Martí (Coord.). Tecnologías del lenguaje (pp. 199-229). Barcelona: Editorial UOC. ISBN: 9788484298809.
    Disponible en la Biblioteca Virtual de UNIR.
  • Tema 6
    Russell, S. J. y Norvig, P. (2004). Inteligencia Artificial: un enfoque moderno (pp. 277-286). Madrid: Pearson Educación. ISBN: 9788420540030.
    Disponible en la Biblioteca Virtual de UNIR.
  • Bibliografía complementaria

    • Alshawi, H. (Ed.). (1992). Syntactic and semantic processing. En The Core Language Engine (pp. 129-147). Cambridge, Estados Unidos: MIT Press. ISBN: 9780262011266.
    • Baader, F., Horrocks, I., Lutz, C. y Sattler, U. (2017). An Introduction to Description Logic. Cambridge, Reino Unido: Cambridge University Press. ISBN: 9781139025355.
    • Dozat, T., Qi, P., y Manning, C. D. (2017). Stanford’s graph-based neural dependency parser at the CoNLL 2017 shared task. En Proceedings of the CoNLL 2017 Shared Task (pp. 20-30). Vancouver, Canadá: Association for Computational Linguistics.
    • Jurafsky, D. y Martin, J. H. (2009) Speech and Language Processing: An Introduction to Natural Language Processing, Speech Recognition and Computational Linguistics. New Jersey, Estados Unidos: Prentice-Hall. ISBN: 978-0131873216.
    • Manning, C. y Schütze, H. (1999). Foundations of Statistical Natural Language Processing. Cambridge, Estados Unidos: MIT Press. ISBN: 978-0262133609.
    • Moloney, C. (2017). How to win a Turing Test (the Loebner prize) [Blog post]. Recuperado de https://chatbotsmagazine.com/how-to-win-a-turing-test-the-loebner-prize-3ac2752250f1

El sistema de calificación se basa en la siguiente escala numérica:

0 - 4, 9 Suspenso (SS)
5,0 - 6,9 Aprobado (AP)
7,0 - 8,9 Notable (NT)
9,0 - 10 Sobresaliente (SB)

La calificación se compone de dos partes principales:

El examen se realiza al final del cuatrimestre y es de carácter PRESENCIAL y OBLIGATORIO. Supone el 60% de la calificación final y para que la nota obtenida en este examen se sume a la nota final, es obligatorio APROBARLO.

La evaluación continua supone el 40% de la calificación final. Este 40% de la nota final se compone de las calificaciones obtenidas en las diferentes actividades formativas llevadas a cabo durante el cuatrimestre.

Ten en cuenta que la suma de las puntuaciones de las actividades de la evaluación continua permite que realices las que prefieras hasta conseguir el máximo puntuable mencionado. En la programación semanal de la asignatura, se detalla la calificación máxima de cada actividad o evento concreto puntuables.

Sistema de evaluación Ponderación min - max
Participación en foros y otros medios participativos 0% - 40%
Trabajos, laboratorios y casos 0% - 40%
Prácticas de laboratorio virtual 10% - 40%
Test de autoevaluación 0% - 40%
Examen final presencial 60% - 60%

Claudia Villalonga Palliser

Formación académica: Doctora por la Universidad de Granada en Tecnologías de la Información y la Comunicación. Máster Universitario en Dirección de las Organizaciones en la Economía del Conocimiento. Ingeniera de Telecomunicación.

Experiencia: Investigadora y docente en UNIR. Más de 10 años en I+D+i sobre TIC, en industria (CGI España, SAP-Suiza, NEC-Alemania) y academia (UGR, KHU-Corea, ETH Zurich). Coordinadora de proyectos de I+D europeos (FP7) y nacionales.

Líneas de investigación: Ingeniería del conocimiento. Modelado ontológico del comportamiento humano.

Obviamente, al tratarse de formación online puedes organizar tu tiempo de estudio como desees, siempre y cuando vayas cumpliendo las fechas de entrega de actividades, trabajos y exámenes. Nosotros, para ayudarte, te proponemos los siguientes pasos:

  1. Desde el Campus virtual podrás acceder al aula virtual de cada asignatura en la que estés matriculado y, además, al aula virtual del Curso de introducción al campus virtual. Aquí podrás consultar la documentación disponible sobre cómo se utilizan las herramientas del aula virtual y sobre cómo se organiza una asignatura en la UNIR y también podrás organizar tu plan de trabajo con tu tutor personal.
  2. Observa la programación semanal. Allí te indicamos qué parte del temario debes trabajar cada semana.
  3. Ya sabes qué trabajo tienes que hacer durante la semana. Accede ahora a la sección Temas del aula virtual. Allí encontrarás el material teórico y práctico del tema correspondiente a esa semana.
  4. Comienza con la lectura de las Ideas clave del tema. Este resumen te ayudará a hacerte una idea del contenido más importante del tema y de cuáles son los aspectos fundamentales en los que te tendrás que fijar al estudiar el material básico. Consulta, además, las secciones del tema que contienen material complementario.
  5. Dedica tiempo al trabajo práctico (sección Actividades y Test). En la programación semanal te detallamos cuáles son las actividades correspondientes a cada semana y qué calificación máxima puedes obtener con cada una de ellas.
  6. Te recomendamos que participes en los eventos del curso (sesiones presenciales virtuales, foros de debate…). Para conocer la fecha concreta de celebración de los eventos debes consultar las herramientas de comunicación del aula vitual. Tu profesor y tu tutor personal te informarán de las novedades de la asignatura.

En el aula virtual del Curso de introducción al campus virtual encontrarás siempre disponible la documentación donde te explicamos cómo se estructuran los temas y qué podrás encontrar en cada una de sus secciones.

Recuerda que en el aula virtual del Curso de introducción al campus virtual puedes consultar el funcionamiento de las distintas herramientas del aula virtual: Correo, Foro, Sesiones presenciales virtuales, Envío de actividades, etc.

Ten en cuenta estos consejos...

  • Sea cual sea tu plan de estudio, accede periódicamente al aula Virtual, ya que de esta forma estarás al día de las novedades del curso y en contacto con tu profesor y con tu tutor personal.
  • Recuerda que no estás solo: consulta todas tus dudas con tu tutor personal utilizando el correo electrónico. Además, siempre puedes consultar tus dudas sobre el temario en los foros que encontrarás en cada asignatura (Pregúntale al profesor).
  • ¡Participa! Siempre que te sea posible accede a los foros de debate. El intercambio de opiniones, materiales e ideas nos enriquece a todos.
  • Y ¡recuerda!, estás estudiando con metodología on line: tu esfuerzo y constancia son imprescindibles para conseguir buenos resultados. ¡No dejes todo para el último día!