pullPOS - Un script Perl para la detección de plurales en castellano

Este es un proyecto de extracción de información gramatical a partir de corpus. En esta etapa inicial del proyecto, nuestros esfuerzos están enfocados en el reconocimiento del plural en castellano, para lo cual ofrecemos un script en código Perl que implementa el algoritmo descrito en la siguiente publicación:

Nazar, R., & Galdames, A. (2020). Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas. Linguamática, 11(2), 17-32. https://doi.org/10.21814/lm.11.2.285

https://linguamatica.com/index.php/linguamatica/article/view/285/457

Próximamente habilitaremos una demo en esta página para que se pueda ejecutar el script directamente en línea. Por el momento, sin embargo, lo que está disponible es el código fuente del script y el modelo ya generado a partir del corpus EsTenTen.

La única documentación que tenemos disponible por el momento, además del artículo citado que ofrece una descripción detallada, son los comentarios disponibles en el mismo script. Es necesario editar las primeras líneas del código para ejecutarlo.

Script:

pullpos.pl (clic con el botón secundario y luego 'guardar como').

train20oct2018-19hs.zip (es necesario descomprimirlo).

Sitio actualizado el 5 de enero de 2020.

Para preguntas o comentarios por favor dirigir correo a rogelio . nazar at pucv . cl


©TECLING 2019.
Concepto y desarrollo: Rogelio Nazar y Amparo Galdames