pullPOS - Un script Perl para la detección de plurales en castellano



Este es un proyecto de extracción de información gramatical a partir de corpus. En esta etapa inicial del proyecto, nuestros esfuerzos están enfocados en el reconocimiento del plural en castellano, para lo cual ofrecemos un script en código Perl que implementa el algoritmo descrito en la siguiente publicación:

Nazar, R., & Galdames, A. (2020). Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas. Linguamática, 11(2), 17-32. https://doi.org/10.21814/lm.11.2.285

La única documentación que tenemos disponible por el momento, además del artículo citado que ofrece una descripción detallada, son los comentarios disponibles en el mismo script. Es necesario editar las primeras líneas del código para ejecutarlo.

A continuación puede descargar el código fuente del script y el modelo ya generado a partir del corpus EsTenTen:

Demo:





Con la colaboración de Nicolás Acosta y Ricardo Martínez

© Tecling, 2020