Tecling logo FREE PALESTINE!      ABOUT RESEARCH SOLUTIONS SOFTWARE
Technologies for Linguistic Analysis

February 9, 2026
New version of Termout.org


This version of Termout is faster and more accurate: http://termout.org
But... what is Termout, dare you ask?
Termout is a software that helps you develop terminological projects, and you may be interested if you are a terminologist, translator, interpreter or if you happen to write or deal with technical papers often.
The basic functions of Termout are:

  • to process a specialized corpus in English and Spanish
  • extract terms
  • classify them in semantic categories
  • extract information from the corpus
  • extract equivalents in the other language
  • obtain synonyms (term variants)
  • export-import term databases (CSV, HTML, TBX)

And there is even more!
A recent publication describes some of the new functions:
Nazar, R. (2026). Semi-Automatic Creation of Terminological Databases. Terminologie & Ontologie :
Théories et Applications. Presses universitaires Savoie Mont Blanc, 117-134 ( PDF ).


8 de enero, 2026
Javier Obreque defiende su Proyecto de Tesis


Comenzamos el año con una buena noticia: nuestro compañero y colega Javier Obreque, miembro del Grupo Tecling desde hace ya más de una década, acaba de defender su proyecto de tesis doctoral en el Instituto de Literatura y Ciencias del Lenguaje de la Pontificia Universidad Católica de Valparaíso.

El título del trabajo es ``Mecanismos lingüísticos de la subjetividad en el discurso científico: análisis descriptivo desde los resúmenes de proyectos de investigación concursable FONDECYT Regular''. El proyecto era dirigido inicialmente por Rogelio Nazar, pero desde su renuncia a la PUCV en setiembre de 2025, la dirección quedó a cargo de los profesores Pascal Matzler y Hernán Robledo.

El proyecto de tesis doctoral de Javier es una investigación con un diseño cualitativo-cuantitativo que pretende desentrañar el funcionamiento de las marcas de subjetividad en el discurso científico, y como tal es una contribución al modelamiento descriptivo de géneros discursivos. En contraste con la creencia socialmente compartida de que el discurso científico, como parte del carácter del conocimiento científico y sus formas de comunicación, es objetivo y neutro, lo que se comprueba en realidad es que en la producción científica y académica se encuentran diversos mecanismos de expresión de la subjetividad, como la deixis, la modalización y la despersonalización, que cumplen un propósito metadiscursivo estratégico vinculado con las estructuras argumentativas que buscan producir un efecto en el lector. Por ello, el objetivo del estudio es describir, a partir de sus marcas lingüísticas empíricas, la manifestación de subjetividad en los resúmenes de propuestas de proyectos de investigación para obtener financiamiento en concursos públicos y competitivos en Chile, concretamente en los resúmenes de Proyectos Fondecyt.

Nunca antes se ha intentado un análisis discursivo de los proyectos Fondecyt, y no hay duda de que los resultados serán de gran relevancia para comprender mejor tanto la forma en que se financia la investigación en Chile y los mecanismos retóricos asociados, como el funcionamiento del discurso científico en general. Estaremos por eso muy atentos cómo se desarrolla este trabajo. Desde aquí, nuestras felicitaciones a Javier!

PIE DE FOTO: Javier aparece en el centro, con su camisa blanca, flanqueado por los miembros de la comisión evaluadora (Nina Crespo y Daniela Ibarra) y sus profesores guía (Hernán Robledo y Pascal Matzler, a su izquierda, y Rogelio Nazar, a su derecha, que justo pasaba por ahí).


23 de diciembre, 2025
Hernán Robledo se adjudica Proyecto Fondecyt


Hernán Robledo, miembro de la vieja guardia del Grupo Tecling, acaba de adjudicarse el Proyecto Fondecyt Iniciación N°11260185, titulado “Conectores y operadores discursivos en español digital: análisis semiautomático de su variación formal y procesos de fijación en redes sociales”.

El proyecto estudiará el uso de conectores y operadores discursivos en interacciones escritas de plataformas como YouTube y Twitter/X, con el objetivo de sistematizar su variación formal y funcional, así como describir procesos de fijación lingüística en curso en el español contemporáneo. Mediante una metodología mixta que combina análisis lingüístico cualitativo y herramientas de procesamiento del lenguaje natural, la investigación permitirá identificar expresiones emergentes, modelar patrones discursivos y desarrollar un repertorio digital anotado de acceso abierto, con proyecciones en el estudio del discurso digital, la enseñanza del español y las tecnologías del lenguaje.

Desde aquí felicitamos a nuestro colega, que continúa con una línea de investigación en marcadores discursivos que a este grupo siempre ha interesado mucho.


December 12, 2025
A talk in Madrid about semantic tagging


This week, Irene Renau and Rogelio Nazar delivered a talk at an International Conference in Universidad Autónoma de Madrid. The name of the event was Informatividad en la lingüística teórica y aplicada: conocimiento léxico, sintáctico y pragmático (`Informativity in theoretical and applied linguistics: lexical, syntactic, and pragmatic knowledge'), and it has been organized by Prof. Olga Batiukova and her team. The topic of the talk was semantic tagging in English and Spanish (more details about this research will be available on Tecling’s website soon).

It has been a great experience, and an opportunity for fruitful scientific dialog with Olga and other distinguished researchers such as James Pustejovsky, Inés Fernández-Ordóñez, Larissa Timofeeva, José María García-Miguel and many others. And it is also nice to visit Madrid from time to time!

Many thanks to the organizers for the invitation.


October 30, 2025
Autogenerated terminological databases


Gelema is a small terminology database in the field of linguistics generated entirely with generative artificial intelligence, specifically gemma3 and llama3 LLMs, used locally and programmatically thanks to the ollama.com project. It is created using a Perl script that controls these models and makes them:

  1. select linguistic terms from a list of nouns and noun phrases extracted from a corpus
  2. find their equivalent in the other language
  3. generate definitions

To reduce the error rate, the script makes the same queries to the models twice in order to compare their results and thus determine the accuracy of the information. It is more like detective work: the testimony of different chatbots and different instances of them must be compared. When they hallucinate, they are more likely to do so in divergent ways, each with their own delusion. When they are right, however, their testimonies are more likely to converge.
This database was generated in less than 24 hours and with zero budget.
In the future, we will complete this database by including more information, more fields, and more entries.
If you want to know more, send an email to rogelio (dot) nazar (you know) gmail (dot) com
Give it a try!
http://www.tecling.com/gelema


August 19, 2025
We are moving back to Spain


After eleven and a half years and many adventures, Irene Renau and Rogelio Nazar are moving back to Barcelona, to begin a new stage in their life.
This web site and all associated applications will be offline while the change is taking place. Please be patient. Everything will be back online as soon as possible. We need to change servers and this must happen one software at a time. We will be updating on this development.
We would like to express our gratitude to our employers at Pontificia Universidad Católica de Valparaíso for letting us develop our academic careers, for all the support, and the great moments we had.


5 de agosto de 2025
Tuvo lugar el II Seminario de Invierno en Semántica Léxica y Lexicografía


Parece que el Instituto de Literatura y Ciencias del Lenguaje (ILCL) de la Pontificia Universidad Católica de Valparaíso (PUCV) se ha convertido en un foro internacional de la lingüística y, en particular, de la lexicología y la lingüística de corpus. Este martes 5 de agosto, en el Auditorio del ILCL, tuvimos unos invitados de lujo en nuestra nueva edición de los Seminarios de Invierno en Semántica Léxica y Lexicografía .
Presentó su trabajo José Ramón Carriazo, de la Universidad Nacional de Educación a Distancia (UNED) y Olga Batiukova, de la Universidad Autónoma de Madrid, dos profesores que en este momento coinciden en una estancia de investigación en el ILCL. Además, presentarán Javiera Ahumada y Constanza Suy, dos egresadas del Magíster en Lingüística Aplicada, y Sabela Fernández-Silva, Irene Renau y Rogelio Nazar, profesores de la PUCV.


25 de julio de 2025
Guillermo Rojo dictó una conferencia en la Pontificia Universidad Católica de Valparaíso


El destacado lingüista español Guillermo Rojo, profesor emérito de la Universidad de Santiago de Compostela, miembro de la Real Academia Española y una de las figuras más importantes de la lingüística española actual, dictó una conferencia para el Doctorado en Lingüística del Instituto de Literatura y Ciencias del Lenguaje de la Pontificia Universidad Católica de Valparaíso, con el título Corpus textuales, diccionarios de frecuencia dinámicos y otras explotaciones.

Aquí el enlace al video de la conferencia:
https://youtu.be/IMlKBlg32V4


Resumen: Los recursos informáticos, los corpus y la lingüística de corpus han modificado fuertemente el modo de trabajar en lingüística y han tenido también un impacto notable en algunos de los recursos y temas más tratados tradicionalmente. El primero de esos aspectos es el constituido por los llamados 'diccionarios de frecuencia', un tipo de obra sobre la que se han acumulado las críticas desde sus orígenes hasta nuestros días. Los recursos informáticos que tenemos ahora a nuestra disposición permiten solucionar la mayor parte de los problemas planteados y construir DF que sirvan realmente a los propósitos con los que son utilizados. Al tiempo, la posibilidad de obtener datos de corpus textuales formados por cientos de millones de palabras y seleccionar los resultados en función del origen de los textos y el tipo al que pertenecen permite arrojar una nueva luz sobre cuestiones como el tamaño del lemario necesario para desenvolverse en español o la distribución del léxico en los diferentes países del mundo hispánico.


23 de julio de 2025
Presentamos ponencias en el Congreso de la Asociación Internacional de Hispanistas


Tres investigadores del Grupo Tecling estuvieron presentes en el XXII Congreso de la Asociación Internacional de Hispanistas, realizado en la Universidad de los Andes, Santiago de Chile, donde compartieron avances de investigación. El
Dr. Hernán Robledo expuso “Variación formal y funcional de los marcadores del discurso en interacciones digitales: el caso de los comentarios de YouTube en español”. A partir de 1.048 comentarios en videos de noticias chilenos, identificó y clasificó 1.191 ocurrencias de conectores y operadores discursivos, proponiendo un sistema de paradigmas formal-funcionales. Sus hallazgos muestran la alta productividad de conectores interactivos y operadores modales y argumentativos, propios del discurso digital, que evidencian que la variación en estos entornos es dinámica y expresiva, superando la rigidez de la escritura formal.
El Dr. Rogelio Nazar presentó “Análisis de los patrones léxicos parafrásticos del discurso especializado en castellano”. Con un corpus de 3.600 artículos y cerca de 30 millones de palabras, identificó patrones parafrásticos frecuentes y desarrolló un prototipo para su detección automática. Los resultados confirman que la paráfrasis puede predecir el carácter especializado de una unidad léxica, lo que abre nuevas posibilidades para la extracción automática de terminología y el análisis del discurso científico.
Finalmente, la Dra. Irene Renau expuso “Las metáforas en los diccionarios: hacia una propuesta de representación en Verbario”, donde analiza la metáfora en diccionarios generales del español y propone una microestructura innovadora para Verbario, diccionario de verbos basado en patrones sintáctico-semánticos. En el marco del proyecto Fondecyt Regular 1231594, integra análisis semiautomatizados para mapear metáforas, dominios y redes verbales, introduciendo cambios estructurales en su organización y microestructura

Server Status

Local time: Sat Mar 14 18:34:44 2026
ParameterValueComments
Temperature37 C Bearable
Memory left90 % Enough
CPU usage0.0 % Ok
Storage left65 % Enough
Users right now1 It's just you

Tools & demos

We have implemented different types of applications and most of them can be tested online. Take a look.

+ Bifid: a parallel corpus aligner

+ Compare: a simple script to compare two lists of words

+ Cryptoman: a script to generate cryptograms

+ Dismark: a multilingual taxonomy of discourse markers

+ Dsele: a model dictionary for ELE learners

+ Estilector: computer assisted writing for Spanish

+ GeNom: a program to detect the gender of proper nouns

+ Jaguar: a tool for statistic corpus analysis

+ Kind: a lexical taxonomy induction algorithm

+ Kwico: a concordancer for big corpora

+ Lealem: a reading pacer for parallel German-Spanish texts

+ Leafran: a reading pacer for parallel French-Spanish texts

+ Linguini: a language detector

+ Neven: a program to detect eventive nouns

+ POL: named entity recognition and classification

+ Poppins: a supervised text classifier

+ Porcus: an interface for various taggers and parsers for Spanish

+ pullPOS: a project for the detection of plurals in Spanish

+ Punkt: punktuation of discourse markers in Spanish

+ Randall: a list randomizer

+ Readeutsch: a reading pacer for parallel German-English texts

+ Regex: a Perl script for regular expressions

+ Sapo: a program to detect similarities between documents

+ Sicam: a program to analyze Spanish poetry

+ Termout: a terminology extraction system

+ Text·a·gram: a program to analyze Spanish texts

+ Verbario: corpus pattern analysis in Spanish

Upcoming Events
[UPDATED: March 12, 2026]

March 25, 2026, from 15:30 to 16 h : Irene Renau (Universtitat Autònoma de Barcelona) and Hernán Robledo (Pontificia Universidad Católica de Valparaíso) will be in Viña del Mar, Chile, presenting a talk at the Emlex Colloquium: Lexicography, Didactics And Language Technologies of the European Master in Lexicography (EMLex), which will be held at the Aula Media, Facultad de Filosofía y Educación, Pontificia Universidad Católica de Valparaíso. The title of the presentation is “The Dismark project: Integrating corpus statistics, lexicography, and didactics of written communication”.

Latest ideas & research projects

We are developing new projects in computational linguistics and natural language processing:

+ Fondecyt Iniciación (2026-2029): "Conectores y operadores discursivos en español digital: análisis semiautomático de su variación formal y procesos de fijación en redes sociales". Lead researcher: Hernán Robledo. Ref.: 11260185.

+ Fondecyt Regular (2023-2027): "Mapa de las metáforas conceptuales en sustantivos y verbos del español: un estudio de los patrones metafóricos basado en corpus". Lead researcher: Irene Renau. Co-researcher: Rogelio Nazar. Ref.: 1231594.

+ See more.

Recent publications

+ Robledo, H.; Opazo, M. (2025). Variación formal y funcional de los conectores y operadores discursivos en interacciones digitales: el caso de los comentarios de YouTube en español. Lengua y Habla, 30, 61-87. PDF

+ Ahumada, J.; Nazar, R. (2025). Detección de terminologización en sustantivos. Procesamiento del Lenguaje Natural, 74: 277-289. PDF

+ Nazar, R.; Renau, I.; Robledo, H. (2024). Dismark and Text·a·Gram: Automatic identification and categorization of discourse markers in texts. In: Cecilia-Mihaela Popescu & Oana-Adriana Dut,ă (eds.), Discourse Markers in Romance Languages. Crosslinguistic Approaches in Romance and Beyond. Berlin: Peter Lang.

+ Laines, Y.; Nazar, R. (2024). Comparación entre textos naturales y textos sintéticos del género tesis en función de variables discursivas. RLA: Revista de lingüística teórica y aplicada. 62(2): 37-62. PDF

+ Nazar, R. (2024). Statistical modeling of discourse genres: the case of the opinion column in Spanish. SN Computer Science 5(959):1-11.

+ Renau, I.; Nazar, R.; Mora Melanchthon, D. (2024). Towards the Automatic Generation of a Pattern-Based Dictionary of Spanish Verbs. In: K. Despot, A. Ostroški & I. Brač (eds.) Lexicography and Semantics, Institut za Hrvatski Jezik, Zabreb, Croatia, p. 345-360. PDF

+ Alvarado, C.; Nazar, R. (2024). Detección de marcadores discursivos: el caso de los conectores causal-consecutivos y su polifuncionalidad. Logos: Revista de Lingüística, Filosofía y Literatura. 34(1): 293--308. PDF

Solutions for text processing

It is critical for organizations to have the ability to process information automatically, and very often that information is contained in documents to be read by humans rather than machines. We have different methods for text processing depending on the goal.

We can be helpful teaching people how to automatize their text processing routines. We can batch-process thousands of documents to extract information from them or to derive different types of statistics. We can also change these document, or generate databases or email correspondence based on information extracted from them. Anything that involves intelligent management of information can benefit from different degrees of automatization, and by doing that we can free time, effort and resources.

Tell us which are your needs and we will show you what we can do about it.