Mandinga, our dear old word sense induction algorithm, is now back online, after many years forgotten. Given an input word, it tells if said unit is polysemous and, if so, it produces a list of the possible senses. Of course, it does not use any lexicographic resource. It does all using only corpora and graph-based co-occurrence algorithms. |
Con la desaparición del servidor melot.upf.edu
había quedado fuera de línea hasta hoy.
A diferencia del original, sin embargo, en esta
versión recién resucitada solamente buscamos
las palabras en el corpus TenTen, no en internet.
Hay que tener en cuenta que este corpus es del año
2012, por lo que no habrá no habrá ningún
sentido reciente hasta que consigamos un
corpus más actualizado. Inicialmente, había sido aplicado también sobre un corpus
diacrónico para detectar cambio semántico
(Nazar y Vidal, 2008)
,
pero en la versión que se ofrece aquí el corpus es solo sincrónico.
Referencias: / References:
Nazar, R. (2010). A Quantitative Approach to Concept Analysis. PhD Thesis. IULA, Universitat Pompeu Fabra.
http://tdx.cat/handle/10803/7516
Nazar, R. (2013). Word Sense Discrimination Using Statistic Analysis of Texts. Barcelona Research Art Creation, vol. 1, no. 1.
http://www.hipatiapress.info/hpjournals/index.php/brac/article/download/608/566
Nazar, R.; Vidal, V. (2008). Aproximación cuantitativa a la neología. En
Mª. Teresa Cabré, Ona Domènech, Rosa Estopà, Judit Freixa y Mercè Lorente (eds.)
Actes del I Congrés Internacional de neologia de les llengües romàniques, CD-ROM.
Barcelona: IULA.
http://www.tecling.com/nazar/CINEO_Nazar_Vidal.pdf