Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) frecuencia del término (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: frecuencia del término


Is in goldstandard

1
paper corpusSignosTxtLongLines213 - : Para determinar la capacidad de representación de un término para un documento dado, se calcula el número de veces que este aparece en dicho documento, obteniéndose la frecuencia del término en el documento (term frequency, tf). Por otra parte, si la frecuencia de un término en toda la colección de documentos es extremadamente alta, se opta por eliminarlo del conjunto de términos de la colección. Podría decirse que la capacidad de recuperación de un término es inversamente proporcional a su frecuencia en la colección de documentos. Esto es lo que se conoce como idf (inverse document frequency). Así, para calcular el peso de cada elemento del vector que representa al documento, se tiene en cuenta la frecuencia inversa del término en la colección, multiplicándola por la frecuencia del término dentro de cada documento (Harman, 1992), esto es:

2
paper corpusSignosTxtLongLines555 - : donde f[ t,d ]es la frecuencia del término t en el documento d, a[ t,l ]es el número de documentos bajo la categoría en evaluación l que contienen el término t, y

Evaluando al candidato frecuencia del término:


1) documento: 6
2) colección: 3

frecuencia del término
Lengua: spa
Frec: 5
Docs: 3
Nombre propio: / 5 = 0%
Coocurrencias con glosario:
Puntaje: 1.206 = ( + (1+3.32192809488736) / (1+2.58496250072116)));
Candidato aceptado

No se encontraron referencias bibliográficas sociadas al/ alos término(s)

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)