22/2/2017

Índice

  • ¿Qué es el Procesamiento de Lenguaje Natural (PLN)?

  • Habilidades y competencias del NLPer ideal

  • Grupos de Procesamiento del Lenguaje en España

  • Grupos de Procesamiento del Lenguaje en Europa

  • Grupos de Procesamiento del Lenguaje en EEUU

  • MOOCs y cursos online

  • Otros cursos presenciales y formación fuera de la universidad

  • Otras lecturas

¿Qué es el PLN?

  • Lingüística Computacional o Procesamiento del Lenguaje Natural (PLN): #NLProc

  • Área multidisciplinar que combina Lingüística, Informática, Estadística/Análisis de datos e Inteligencia Artificial.

    • PLN está íntimamente relacionado con otras disciplinas como Ingeniería, Psicología, Lógica, Estadística, Interacción Hombre-Máquina, Ciencias Cognitivas.
  • Nace como disciplina en los años 1950s con un objetivo inicial claro: construir sistemas de traducción automática.

  • Amalgama de problemas, técnicas, ideas y soluciones para procesar automáticamente el lenguaje natural.

¿Qué es el PLN?

Es la disciplina relacionada con el desarrollo de herramientas y soluciones que permitan:

  • procesar automáticamente lenguaje natural.

  • comprender el lenguaje natural.

  • interaccionar de manera eficaz con ordenadores (o máquinas) de manera natural a través del habla.

Tareas del PLN

  • Análisis morfo-sintáctico (PoS tagging, parsing).

  • Reconocimiento de entidades (named entities recognition).

  • Desambiguación semántica (word sense disambiguation).

  • Traducción automática (machine translation).

  • Extracción de información (information extraction).

Tareas del PLN

  • Reconocimiento del habla (automatic speech recognition).

  • Recuperación de información (information retrieval).

  • Resumen automático (automatic summarization).

  • Búsqueda de respuestas (question answering)

  • Análisis de opiniones (sentimen analysis)

  • Generación del lenguaje natural (natural language generation) y comprensión del lenguaje natural (natural language understanding).

Progresos en PLN

  • En 1950s y al inicio de la Guerra Fría, el objetivo era los sistemas de traducción automática.

  • En la decada de los 1960s, aparecen sistemas expertos que asistían en la toma de decisiones: sistemas de diálogo que trataban de imitar conversaciones humanas, creación de ontologías para capturar conocimiento del mundo.

  • Hasta los 1980s, la mayor parte de los sistemas de PLN estaban basados en conocimiento y manejaban complejas reglas diseñadas a mano. Influencia de la Lingüística Generativa de Chomsky.

Progresos en PLN

  • A partir de esa década, irrumplen las aproximaciones estadísticas basadas en sistemas de aprendizaje automático, que requieren grandes colecciones de datos anotados manualmente. Desarrollo paralelo al aumento de potencia de los ordenadores.

  • Actualmente, vivimos un auge de los sistemas de aprendizaje automático no supervisados (es decir, no anotados), con especial énfasis en el uso de la Web. Explosión de datos en formato electrónico.

  • En la década de los 2010s hemos visto el resurgir de los sistemas que utilizando redes neuronales.

Tareas resueltas y problemas abiertos

Language Technologies

¿Por qué es tan difícil el PLN?

El lenguaje natural es eminentemente ambiguo: es la principal diferencia entre lenguas naturales y lenguajes artificiales.

Y esta ambigüedad existe a varios niveles:

  • ambigüedad fonética y fonológica: vaca/baca, casa/caza, has sido tú/has ido tú

  • ambigüedad morfológica: casa, beso, río

  • ambigüedad sintáctica: Ayer me encontré a tu padre corriendo

  • ambigüedad semántica: banco, pie

  • ambigüedad de discurso: correferencia, resolución de anáforas

¿Por qué es tan difícil el PLN?

Language Technologies

Habilidades para trabajar en PLN

  • Lingüística: fonética, sintaxis, semántica.

  • Informática: programación, aprendizaje automático.

  • Estadística, probabilidad, análisis de datos.

  • Lógica, formalización y representación del conocimiento.

Habilidades para trabajar en PLN

Herramientas para el día a día, trabajar en equipo, compartir y reutilizar código, acceder a colecciones de datos y poner en marcha servidores en la nube.

Grupos de PLN en Madrid

Grupos de PLN en España

Grupos de PLN en España

Grupos de PLN en Europa

Grupos de PLN en EEUU

Cursos y materiales

Libros y lecturas

Libros y lecturas

¿Preguntas?