Curso:

Procesamiento de corpus para lexicografía y terminología


Expositores: Irene Renau, Rogelio Nazar y Nicolás Acosta
Fechas: 30 y 31 de agosto, 1 de setiembre 2023
Horario: 15 a 17h
Lugar: Facultad de Filosofía y Letras, Universidad Nacional de Cuyo, Mendoza, Argentina.

Descripción:
El curso de Procesamiento de corpus para lexicografía y terminología tiene un enfoque eminentemente práctico y orientado al tratamiento masivo de datos textuales. Se revisarán técnicas para el análisis del vocabulario separando el léxico general de la terminología especializada. Se plantea un recorrido por distintas técnicas de análisis computacional de textos dispuestas en un orden progresivo de complejidad, desde el análisis de concordancias en un corpus monolingüe hasta análisis de corpus bilingüe (paralelos y comparables). Se revisarán desde herramientas web amigables hasta el empleo de instrucciones en la terminal de comandos. Al final el curso, los participantes tendrán una base metodológica como para emprender de manera autónoma un producto lexicográfico o terminológico basado en datos de corpus.

Objetivos
Proporcionar a los estudiantes herramientas teórico-metodológicas para la creación de bases de datos léxicas o terminológicas basadas en corpus.

Contenidos
  1. Fundamentos teóricos y antecedentes históricos del cruce disciplinar entre la lexicografía, la terminología y la lingüística computacional.
  2. La creación y gestión recursos léxicos y terminológicos.
  3. Aplicación de técnicas de lingüística computacional y lingüística de corpus.
  4. Herramientas, métodos y técnicas para el procesamiento de datos textuales: análisis de vocabulario, extracción de terminología, expresiones regulares y lenguajes de scripting.

Metodología de trabajo
El curso se dicta en una sala de clases dotada de computadoras para que los estudiantes puedan seguir las actividades prácticas. Las sesiones estarán constituidas por una primera sesión expositiva de 45 minutos para abordar los conceptos que se trabajarán. Esta exposición continuará con 15 minutos para consultas y diálogo. El resto del tiempo de la sesión se destinará al trabajo práctico individual o grupal de los participantes bajo la supervisión de los docentes.

Descripción de las actividades prácticas
A lo largo de las sesiones del curso, cada estudiante podrá comprender cómo distintas técnicas de la lingüística computacional y el procesamiento de lenguaje natural pueden servir para la producción de recursos terminológicos y lexicográficos, automatizando diversas tareas. Estas herramientas se presentan en orden progresivo de complejidad, comenzando por las que tienen interfaz gráfica, para pasar luego a otras más avanzadas, tales como la línea de comandos, expresiones regulares y lenguajes de scripting.

Programa de actividades:


Modalidad y requisitos de aprobación:
Porcentaje mínimo de asistencia para que el alumno acceda a la evaluación: 66%.

Software (instalable) utilizado en el curso:


Software en línea:


Corpus mencionados:


Materiales diversos y documentación sobre lingüística computacional:
http://www.tecling.com

Bibliografía

Bibliografía básica

Bibliografía complementaria
Contacto:
rogelio.nazar@pucv.cl