pullPOS

Un script Perl para la detección de plurales en castellano

Este es un proyecto de extracción de información gramatical a partir de corpus que por el momento está centrado en el reconocimiento del plural en castellano. Es un proyecto de código abierto consistente en un script en código Perl que implementa el algoritmo descrito en la siguiente publicación:

Nazar, R., & Galdames, A. (2020). Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas. Linguamática, 11(2), 17-32. https://doi.org/10.21814/lm.11.2.285

Además del artículo citado, existe como documentación la serie de comentarios disponibles en el mismo script. Es necesario editar las primeras líneas del código para ejecutarlo.

A continuación puede descargar el código fuente del script y el modelo ya generado a partir del corpus EsTenTen. Ambos son archivos comprimidos (zip). Se tienen que descomprimir después de descargarlos y antes de ejecutar.

pullpos.zip El script
train20oct2018-19hs.zip El modelo.