Rogelio Nazar

Researcher in Computational Linguistics

Director of the Tecling.com Group

Short Bio

I was born in Mendoza, Argentina, in 1975. My original academic background was communication studies, which I studied at Universidad Nacional de Cuyo. After some years of experience in the private sector, in 2003 I started working full-time in linguistics. I was affiliated with Universitat Pompeu Fabra in Barcelona, Spain, where I worked for ten years. After that, I worked for almost 12 years at the Institute for Literary and Linguistic Studies (Instituto de Literatura y Ciencias del Lenguaje) of the Pontificia Universidad Católica de Valparaíso. Now I am back in Barcelona to pursue my own projects.

Interests

My area of interest is quantitative linguistics, and through this discipline I study semantics and terminology. Broader terms that describe the type of work I do are computational linguistics, natural language processing, corpus linguistics and probably others. My main interest is the application of distributional analysis in semantics by means of statistics of term co-occurrence, which can serve many purposes in lexicography, monolingual and bilingual terminology extraction and taxonomy induction. To a lesser extent, I have also studied word sense disambiguation, authorship attribution and automatic text categorization, among other areas.

Education

Ph.D. Linguistics, Universitat Pompeu Fabra, 2010
M.A. Linguistics, Universitat Pompeu Fabra, 2005
B.S. Communication Sciences, Universidad Nacional de Cuyo, 2002

Research stays

at Universitat de Barcelona, Spain, with the GRIAL group (Departament de Llengües i Literatures Modernes i d’Estudis Anglesos), in January and February 2025.
at Universidade de Santiago de Compostela, in Galicia, Spain, with the Humboldt group (GI 1920): January and February 2024.
at Université de Lille 3, France, 2018, with funding from Project Ecos-Sud/Conicyt Ref. C16H02.
at NICTA (National Information and Communication Technologies Australia), 2015, with funding from Project MECESUP UCV/1305 (Chile).
at Institut für Übersetzen und Dolmetschen (IÜD), Universität Heidelberg, Germany, 2013, with a scholarship from Santander Universities.
at Institut für Maschinelle Sprachverarbeitung (IMS), Universität Stuttgart, Germany, 2006, with a postgraduate Erasmus Scholarship.

Training courses

Summer School: "Language and Speech Technologies", Universidad Rovira i Virgili, 2011.
Advanced Studies Diploma (DEA) in Applied Linguistics, Universidad Pompeu Fabra, 2005, with an AGAUR scholarship (Generalitat de Catalunya).
Postgraduate course in psycholinguistics, Universidad Nacional de Cuyo, 2003.
Exchange Program in Communication Sciences, Universidad de Buenos Aires, 2000.
Diploma in Humanities, Universidad Nacional de Cuyo, 1994.

Publications

2026

Nazar, R. (In press). La paráfrasis como elemento predictor de la condición de término: paradojas tecnológicas en las que lo viejo funciona. In: Dunia Hourani, Matteo De Beni & Carsten Sinner (eds). Contradicciones, incoherencias y paradojas en la lexicografía y terminografía hispánicas. Peter Lang.

Nazar, R. (In press). Hacia la generación automática de glosarios: estudio preliminar con terminología lingüística. In: Niktelol Palacios, María Pozzi & Gerardo Sierra (eds). Terminología e inclusión en la sociedad actual. El Colegio de México.

Nazar, R. (In press). La terminología en el ámbito profesional chileno: prácticas de traductores e intérpretes. In: Carlos Mario Pérez y otros (eds). La terminología en América Latina.

Nazar, R. (2026). Semantic Typing for Corpus Pattern Analysis. International Journal of Lexicography, Volume 39, 2026, ecag012.

Nazar, R. (2026). Semi-Automatic Creation of Terminological Databases. Terminologie & Ontologie : Théories et Applications. Presses universitaires Savoie Mont Blanc, 117-134 ( PDF).

Nazar, R.; Renau, I. (2026). Wikipedia used as a semantic tagger: some preliminary results in Spanish. Procesamiento del Lenguaje Natural, n. 76, p. 279-292 (PDF).

2025

Ahumada, J.; Nazar, R. (2025). Detección de terminologización en sustantivos. Procesamiento del Lenguaje Natural, 74: 277-289. PDF

2024

Nazar, R.; Renau, I.; Robledo, H. (2024). Dismark and Text·a·Gram: Automatic identification and categorization of discourse markers in texts. In: Cecilia-Mihaela Popescu & Oana-Adriana Dut,ă (eds.), Discourse Markers in Romance Languages. Crosslinguistic Approaches in Romance and Beyond. Berlin: Peter Lang.

Laines, Y.; Nazar, R. (2024). Comparación entre textos naturales y textos sintéticos del género tesis en función de variables discursivas. RLA: Revista de lingüística teórica y aplicada. 62(2): 37-62. PDF

Nazar, R. (2024). Statistical modeling of discourse genres: the case of the opinion column in Spanish. SN Computer Science 5(959):1-11.

Renau, I.; Nazar, R.; Mora Melanchthon, D. (2024). Towards the Automatic Generation of a Pattern-Based Dictionary of Spanish Verbs. In: K. Despot, A. Ostroški & I. Brač (eds.) Lexicography and Semantics, Institut za Hrvatski Jezik, Zabreb, Croatia, p. 345-360. PDF

Alvarado, C.; Nazar, R. (2024). Detección de marcadores discursivos: el caso de los conectores causal-consecutivos y su polifuncionalidad. Logos: Revista de Lingüística, Filosofía y Literatura. 34(1): 293--308. PDF

2023

Obreque, J.; Nazar, R. (2023). Detección de operadores modales: una primera exploración en castellano. Linguamatica. 15(2): 37--49. PDF

Nazar, R.; Acosta, N. (2023). A Lightweight Statistical Method for Terminology Extraction. Journal of Computer-Assisted Linguistic Research, 7:43-59. PDF

Nazar, R. (2023). Extensión, variación y evolución del léxico español. In Battaner, P., Torner, S, Renau, I. Lexicografía hispánica / The Routledge Handbook of Spanish Lexicography. Cap. 14, pp. 204-218.

López-Hidalgo, B.; Renau, I.; Nazar, R. (2023). Correlación entre la metáfora orientacional BUENO ES ARRIBA / MALO ES ABAJO y polaridad positiva/negativa en verbos del español: un estudio con estadística de corpus. Humanidades Digitales, Corpus y Tecnología del Lenguaje. University of Groningen Press, pp. 307-323. PDF

Nazar, R. & Acosta, N. (2023). Termout: a tool for the semi-automatic creation of term databases. In Haddad, Amal; Terryn, Ayla; Mitkov, Ruslan; Rapp, Reinhard; Zweigenbaum, Pierre and Sharoff, Serge (eds.) Proceedings of the Workshop on Computational Terminology in NLP and Translation Studies (ConTeNTS) Incorporating the 16th Workshop on Building and Using Comparable Corpora (BUCC), INCOMA, Shoumen, Bulgaria, pp. 9-18. PDF

Nazar, R. & Renau, I. (2023). Estilector: un sistema de evaluación automática de la escritura académica en castellano. Revista Perspectiva Educacional, 62(2): 37-59. PDF

Robledo, H. & Nazar, R. (2023). A proposal for the inductive categorisation of parenthetical discourse markers in Spanish using parallel corpora. International Journal of Corpus Linguistics, 28(4):500--527.

2022

Renau, I., Nazar, R. & Díaz, L. (2022). La Ortografía de la lengua española (2010) y su impacto en la prensa de cinco países hispanohablantes. Normas, 12: 91-109. PDF

Renau, I.; Nazar, R. (2022). Towards a multilingual dictionary of discourse markers: automatic extraction of units from parallel corpus. Klosa-Kückelhaus, A.; Engelberg, S.; Möhrs, C.; Storjohann, P. Dictionaries and Society (eds.). Proceedings of the XX EURALEX International Congress, Mannheim: IDS-Verlag, pp. 262-272. PDF

Nazar, R; Lindemann, D. (2022). Terminology extraction using co-occurrence patterns as predictors of semantic relevance. Proceedings of the TERM21 Workshop. Language Resources and Evaluation Conference (LREC 2022), pp. 26-29. PDF

2021

Castro, A., Nazar, R., Renau, I. (2021). New verbs and dictionaries: a method for the automatic detection of neology in Spanish verbs. International Journal of Lexicography, 34(3): 382-399.

Nazar, R. (2021). Introducción al Dossier de Lingüística Computacional. Revista Anales de Lingüística, 2(7): 53-57. PDF

Nazar, R. (2021). Kind: un proyecto de inducción automática de taxonomías léxicas. Revista Anales de Lingüística, 2(7): 175-201. PDF

Nazar, R. (2021). Inducción automática de una taxonomía multilingüe de marcadores discursivos: primeros resultados en castellano, inglés, francés, alemán y catalán. Procesamiento del Lenguaje Natural, (67): 127-138. PDF

Nazar, R. (2021). Automatic induction of a multilingual taxonomy of discourse markers. Iztok Kosem et al. (eds.) Electronic lexicography in the 21st century: post-editing lexicography. Lexical Computing CZ s.r.o., Brno, pp. 440-454. PDF

Nazar, R.; Renau, I., Acosta, N., Robledo, H., Soliman, H., Zamora, S. (2021). Corpus-Based Methods for Recognizing the Gender of Anthroponyms. Names: A Journal of Onomastics, 69(3): 16-27. PDF

2020

Nazar, R.; Balvet, A.; Ferraro, G.; Marín, R.; Renau, I. (2020). Pruning and repopulating a lexical taxonomy: experiments in Spanish, English and French. Journal of Intelligent Systems, 30(1): 376-394. PDF

Asenjo, S.; Nazar, R. (2020). Marcadores discursivos en niños de 7 años con trastorno específico del lenguaje: estudio descriptivo. RLA. Revista de lingüística teórica y aplicada, 58(1): 93-114. PDF

Nazar, R.; Obreque, J.; Renau, I. (2020). Tarántula –> araña –> animal : asignación de hiperónimos de segundo nivel basada en métodos de similitud distribucional. Procesamiento del Lenguaje Natural, (64): 29-36. PDF

Renau, I.; Nazar, R.; Lecaros, V. (2020). La evolución de las marcas ortográficas y tipográficas en los procesos de lexicalización de neologismos: un estudio en el vocabulario de la crisis económica en prensa española. Revista Española de Lingüística Aplicada, 33(1): 227-277. PDF

2019

Nazar, R.; Galdames, A. (2019). Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas. Revista Linguamatica, 11(2): 17-32. PDF

Nazar, R. (2019). El análisis cuantitativo de la coocurrencia léxica en la lexicografía especializada. Sanmartín Sáez, Julia y Quilis Merín, Mercedes (eds.). Retos y avances en lexicografía: los diccionarios del español en el eje de la variación lingüística. Anejo 10 de Normas. Valencia: Asociación Española de Estudios Lexicográficos. PDF

Renau, I.; Nazar, R.; Castro, A.; López, B.; Obreque, J. (2019). Verbo y contexto de uso: un análisis basado en corpus con métodos cualitativos y cuantitativos. Revista Signos, 52(101): 878-901. PDF

2018

Robledo, H.; Nazar, R. (2018). Una clasificación automatizada de marcadores discursivos. Procesamiento del Lenguaje Natural, (61): 109-116. PDF

Nazar, R. (2018). Invitación al estudio estadístico del lenguaje. ArXiv:1804.07349, [stat.AP]. PDF

2017

Nazar, R.; Soto, R.; Urrejola, K. (2017). Detección automática de nombres eventivos no deverbales en castellano: un enfoque cuantitativo basado en corpus. Revista Linguamatica, 9(2): 21-31. PDF

Nazar, R.; Arriagada, P. (2017). POL: un nuevo sistema para la detección y clasificación de nombres propios. Procesamiento del Lenguaje Natural, (58): 13-20. PDF

Nazar, R., Renau, I., Marín, R. (2017). Experiments in taxonomy induction in Spanish and French. Proceedings of Language, Ontology, Terminology and Knowledge Structures Workshop (LOTKS 2017), pp. 66-75. PDF

Nazar, R., Renau, I., Marín, R. (2017). Taxonomía automatizada de sustantivos del castellano y del francés: hacia el etiquetado semántico automático multilingüe. Sariego López, Ignacio, Juan Gutiérrez Cuadrado y Cecilio Garriga Escribano (eds.), El diccionario en la encrucijada: de la sintaxis y la cultura al desafío digital. Santander: AELEX, 731-745. PDF

Renau, I., Nazar, R. (2017). Verbos en contexto: una propuesta para la detección automática de patrones léxicos en corpus. Sariego López, Ignacio, Juan Gutiérrez Cuadrado y Cecilio Garriga Escribano (eds.), El diccionario en la encrucijada: de la sintaxis y la cultura al desafío digital. Santander: AELEX, pp. 879-897. PDF

2016

Nazar, R. (2016). Distributional analysis applied to terminology extraction: example in the domain of psychiatry in Spanish. Terminology: International Journal of Theoretical and Applied Issues in Specialized Communication, 22(2): 142-170.

Nazar, R., Renau, I. (2016). A Quantitative analysis of the semantics of verb-argument structures. In S. Torner and E. Bernal (eds.), Collocations and other lexical combinations in Spanish. Theoretical and Applied approaches. New York: Routledge, pp. 114-136.

Nazar, R.; Renau, I. (2016). Automatic extraction of lexico-semantic patterns from corpora. Proceedings of the XVII EURALEX International Congress: Lexicography and Linguistic Diversity. Tinatin Margalitadze and George Meladze (eds). Tbilisi, Gergia: Ivane Javakhishvili Tbilisi State University, pp. 823-830. PDF

Nazar, R.; Renau, I. (2016). A taxonomy of Spanish nouns, a statistical algorithm to generate it and its implementation in open source code. Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC'16). European Language Resources Association (ELRA), pp. 1485-1492. PDF

2015

Nazar, R.; Renau, I. (2015). Agrupación semántica de sustantivos basada en similitud distribucional: implicaciones lexicográficas. María Pilar Garcés Gómez (ed.): Lingüística y diccionarios. Anexos Revista de Lexicografía, 2: 272-295. Universidade da Coruña.

Nazar, R.; Renau, I. (2015). Ontology Population Using Corpus Statistics. Proceedings of the Joint Ontology Workshops 2015 co-located with the 24th International Joint Conference on Artificial Intelligence (IJCAI 2015). PDF

2014

Bouayad-Agha, N.; Burga, A.; Casamayor, G.; Codina, J.; Nazar, R.; Wanner, L. (2014). An Exercise in Reuse of Resources: Adapting General Discourse Coreference Resolution for Detecting Lexical Chains in Patent Documentation. Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14). European Language Resources Association (ELRA), pp. 3214-3221. PDF

Lindemann, D.; Manterola, I.; Nazar, R.; San Vicente, I.; Saralegi, X. (2014). Bilingual Dictionary Drafting: The Example of German-Basque, a Medium-Density Language Pair. XVI EURALEX Conference, Bolzano/Bozen, pp. 563-576. PDF

López Ferrero, C.; Nazar, R.; Renau, I.; Torner, S. (2014). Computer-assisted revision in Spanish academic texts. Procedia. Social and Behavioral Sciences, 141: 470-483. PDF

Nazar, R. (2014). Una metodología para depurar los resultados de los extractores de términos. Chelo Vargas Sierra (ed.) TIC, trabajo colaborativo e interacción en Terminología y Traducción. Granada: Comares, pp. 133-149.

2013

Ferraro, G.; Nazar, R.; Alonso Ramos, M.; Wanner, L. (2013). Towards Advanced Collocation Error Correction in Spanish Learner Corpora. Language Resources and Evaluation, 48: 45-64

Nazar, R. (2013). Word Sense Discrimination Using Statistic Analysis of Texts. Barcelona Research Art Creation, 1(1): 5-26. PDF

2012

Atserias, J.; Fuentes, M.; Nazar, R.; Renau, I. (2012). Spell Checking in Spanish: The Case of Diacritic Accents. Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), Istanbul, Turkey: European Language Resources Association (ELRA), pp. 737-742. PDF

Cabré, M.T.; Nazar. R. (2012). Towards a new approach to the study of neology. Neologica: Revue internationale de néologie, (6): 63-80.

Nazar, R. (2012). Bifid: un alineador de corpus paralelo a nivel de documento, oración y vocabulario. Linguamatica, 4(2):45-56. PDF

Nazar, R., Cabré, M.T. (2012). Supervised Learning Algorithms Applied to Terminology Extraction. Proceedings of TKE 2012 (Terminology and Knowledge Engineering), pp. 209-217. PDF

Nazar, R.; Vivaldi, J; Wanner, L. (2012). Automatic Taxonomy Extraction for Specialized Domains Using Distributional Semantics. Terminology: International Journal of Theoretical and Applied Issues in Specialized Communication, 18(2): 188-225.

Nazar, R.; Vivaldi, J; Wanner, L. (2012). Co-occurrence Graphs Applied to Taxonomy Extraction in Scientific and Technical Corpora. Procesamiento del Lenguaje Natural, (49): 67-74. PDF

Nazar, R. (2012). Algorithm qualifies for C1 courses in German exam without previous knowledge of the language: an example of how corpus linguistics can be a new paradigm in Artificial Intelligence. Proceedings of Corpus Linguistics 2011 Conference. PDF

Nazar, R.; Renau, I. (2012). Google Books N-gram Corpus used as a Grammar Checker. Proceedings of EACL 2012's Second Workshop on Computational Linguistics and Writing (CL&W 2012): Linguistic and Cognitive Aspects of Document Creation and Document Engineering, pp. 27-34. PDF

Nazar, R.; Renau, I. (2012). A Co-occurrence Taxonomy from a General Language Corpus. Proceedings of EURALEX 2012, pp. 367-375. PDF

Nazar, R.; Renau, I. (2012). Agrupación semántica de sustantivos basada en similitud distribucional. Implicaciones lexicográficas. V Congreso Internacional de Lexicografía Hispánica, pp. 281-295. PDF

Renau, I.; Nazar, R. (2012). Hypernymy relations from definiens-definiendum co-occurrence in multiple dictionary definitions. Procesamiento del Lenguaje Natural, (49): 83-90. PDF

2011

Cabré, M.T.; Nazar, R. (2011). Terminus: a Workstation for terminology and corpus management. Proceedings of TOTH 2011 Conference, pp. 63-74.

Ferraro, G; Nazar, R.; Wanner, L. (2011). Collocations: A Challenge in Computer-Assisted Language Learning. Proceedings of the 5th International Conference on Meaning-Text Theory, pp. 69-79. PDF

Nazar, R. (2011). A Statistical Approach to Term Extraction. International Journal of English Studies 11(2): 159-182. PDF

Nazar, R. (2011). Parallel corpus alignment at the document, sentence and vocabulary levels. Procesamiento del Lenguaje Natural, (47): 129-136. PDF

Nazar, R. (2011). Estudio diacrónico de la terminología especializada utilizando métodos cuantitativos: ejemplo de aplicación a un corpus de lingüística aplicada. Revista Signos, 44(75): 8-67. PDF

Nazar, R; Cabré, T. (2011). Un experimento de extracción de terminología utilizando algoritmos estadísticos supervisados. Debate Terminológico, (7): 36-55. PDF

Renau, I.; Nazar, R. (2011). Propuesta metodológica para la creación automática de patrones léxicos usando el Corpus Pattern Analysis. Proceedings of the 27th Conference of the Spanish Society for Natural Language Processing. University of Huelva, pp. 443-450. PDF

Renau, I; Nazar, R. (2011). Análisis cuantitativo del uso real de los verbos pronominales estrictos del castellano utilizando un corpus diacrónico (Google Books). Actas del III Congreso Internacional de Lingüística de Corpus (AELINCO), pp. 303-314. PDF

2010

Cabré, T; Montane, A.; Nazar, R.; Reus, R. (2010). Estació Terminus: a Web Application for Terminology and Corpus Management. Proceedings of TKE 2010 Conference (Terminology and Knowledge Engineering).

Nazar, R. (2010). A Quantitative Approach to Concept Analysis. PhD Thesis. IULA, Universitat Pompeu Fabra. PDF

Nazar, R. (2010). Evolución de la terminología lingüística en las Actas de Congresos de AESLA entre 1983 y 2006. Proceedings of: XXVIII Congreso de AESLA (Asociación española de Lingüística Aplicada). University of Vigo, April 15- 17, 2010.

Nazar, R. (2010). Invitació a l'estudi estadístic del llenguatge. La terminologia i la documentació: relacions i sinergies: actes de la VII Jornada SCATERM: Terminologia i documentació, Barcelona: Societat Catalana de Terminologia, pp. 47-73. PDF

Nazar, R.; Azarian, J. (2010). The Living Lexicon: Methodology to Set Up Synchronic Dictionaries. Proceedings of Euralex Congress (European Association for Lexicography), pp. 527-538. PDF

Nazar, R. ; Janssen, M. (2010). Combining Resources: Taxonomy Extraction from Multiple Dictionaries. Proceedings of the 8th edition of the Language Resources and Evaluation Conference (LREC 2010), pp. 1055-1061. PDF

2008

Nazar, R. (2008). Bilingual Terminology Acquisition from Unrelated Corpora. Proceeding of 13th Euralex Conference (European Association for Lexicography), pp. 1023-1029. PDF

Nazar, R. (2008). Diferencias cuantitativas entre referencia y sentido. Proceedings of XXVI Congreso de la Asociación española de Lingüística Aplicada (AESLA), pp. 1421-1432.

Nazar, R.; Vidal, V. (2008). Aproximación cuantitativa a la neología. Proceedings of CINEO 2008 (I Congreso Internacional de Neología en las lenguas románicas). PDF

Nazar, R.; Vivaldi, J.; Cabré, MT. (2008). A Suite to Compile and Analyze an LSP Corpus. Proceedings of the 6th edition of the Language Resources and Evaluation Conference (LREC 2008), pp. 1164-1169. PDF

Nazar, R.; Wanner, L & Vivaldi, J. (2008). Two Step Flow in Bilingual Lexicon Extraction from Unrelated Corpora. Proceedings of the European Association for Machine Translation Conference (EAMT 2008), pp. 140-149. PDF

2007

Nazar, R.; Vivaldi, J.; Wanner, L. (2007). Towards Quantitative Concept Analysis. Procesamiento del Lenguaje Natural, (39): 139-146. PDF

2006

Nazar, R.; Sánchez Pol, M. (2006). An Extremely Simple Authorship Attribution System. Proceedings of the Second European IAFL Conference on Forensic Linguistics / Language and the Law, pp. 1000-1007. PDF

Talks (without proceedings)

2024

Renau, I.; Nazar, R. (2024). Desambiguación semántica y extracción de patrones verbales para la base de datos léxica Verbario. Seminario en la Facultad de Filología de la Universidad de Santiago de Compostela.

2023

Obreque, J.; Nazar, R. (2023). Un método mixto con énfasis en lo cuantitativo para la detección de operadores modales. VI Workshop en Procesamiento Automatizado de Textos y Corpus (WOPATEC 2023), en Concepción, Chile.

Nazar, R. (2023). Termout: un sistema para el análisis de corpus especializado con eje en la terminología. III Jornadas de Lingüística y Gramática Española, en la Facultad de Filosofía, Historia, Letras y Estudios Orientales, Universidad del Salvador, Buenos Aires, Argentina.

Nazar, R. (2023). Propuesta metodológica para el análisis terminológico empírico. Congreso Internacional de Lingüística Hispánica (CILH 2023), en la Universität Leipzig, Alemania.

Nazar, R.; Acosta, N. (2023). Termout: a tool for the semi-automatic creation of term databases. Workshop on Computational Terminology in NLP and Translation Studies (ConTeNTs), Varna, Bulgaria, en el Congreso Recent Advances in Natural Language Processing (RANLP).

Renau, I.; Nazar, R.; Acosta, N. (2023). Procesamiento de corpus para lexicografía y terminología. Curso en la Facultad de Filosofía y Letras de la Universidad Nacional de Cuyo, Mendoza, Argentina.

Rogelio, R.; Acosta, N. (2023). Termout.org: Automatización de tareas en la producción de diccionarios terminológicos.. Jornadas de Estudios Lingüísticos (JELing 2023), Facultad de Filosofía y Letras de la Universidad Nacional de Cuyo, Mendoza, Argentina.

Nazar, R. (2023). Termout: a software to streamline the creation of terminology dictionaries. 9th International Conference on Meaning and Knowledge Representation (MKR2023), en la Pontificia Universidad Católica de Chile, Santiago, Chile.

Nazar, R. (2023). Termout: a new software for the semi-automatic creation of specialized dictionaries. Congreso TOTH 2023, University Savoie Mont-Blanc, Francia.

Nazar, R.; Renau, I.; Acosta, N. (2023). Estilector.com: una propuesta de retroalimentación de la escritura académica en castellano. III Jornadas de Corrección de Textos en Español, organizadas por la Universidad del Salvador, Buenos Aires, Argentina.

Nazar, R.; Renau, I.; Acosta, N.; Robledo, H (2023). Análisis estadístico de patrones de puntuación de marcadores discursivos. Congreso de la Sociedad Chilena de Lingüística (SOCHIL 2023), en la Universidad Católica Silva Henríquez, Santiago, Chile.

Nazar, R.; Renau, I.; Acosta, N. (2023). Estilector: una herramienta de retroalimentación de la escritura en castellano. Congreso de la Sociedad Argentina de Estudios Lingüísticos (SAEL 2023), en la Facultad de Lenguas, Universidad Nacional del Comahue, General Roca, Argentina.

2022

Nazar, R.; Lindemann, D. (2022). Terminology extraction using co-occurrence patterns as predictors of semantic relevance. Workshop on Terminology in the 21st century: many faces, many places (Term 21), LREC 2022, Marseille, Francia.

Renau, I.; Nazar, R. (2022). Towards a multilingual dictionary of discourse markers: automatic extraction of units from parallel corpus. Congreso EURALEX 2022, en Mannheim, Alemania.

Renau, I.; Nazar, R.; Robledo, H..(2022). Automatic extraction of discourse markers from parallel corpus. Discourse Markers in Romance Languages Conference (DISROM 7), Craiova, Rumania.

Renau, I.; Nazar, R.; Acosta, N. (2022). Seminario de Lexicografía Basada en Corpus. Seminario dictado en la Facultad de Filosofía y Letras de la Universidad Nacional de Cuyo, Mendoza, Argentina.

2021

Nazar, R. (2021). TEXT·A·GRAM, una herramienta de apoyo a la enseñanza de Gramática del Texto. XIV Congreso Internacional de La Asociación Latinoamericana de Estudios deL Discurso ALED (Virtual).

Nazar, R. (2021). Un nuevo sistema para extracción y gestión de terminología. XVII Simposio de la Red Iberoamericana de Terminología (RITerm 2021), Ciudad de México, México.

Renau, I.; Nazar, R. (2021). Tecling.com: Herramientas experimentales. II Jornadas de Lingüística y Gramática Española: Inclusión, claridad, precisión, visibilización y otros temas en debate para la lingüística actual, Universidad del Salvador, Buenos Aires, Argentina.

Nazar, R. (2021). Inducción automática de una taxonomía multilingüe de marcadores discursivos: primeros resultados en castellano, inglés, francés, alemán y catalán. Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN 2021). Virtual.

Castro, A.; Nazar, R. (2021). New verbs and dictionaries: a method for the automatic detection of verbal neology. Congreso EURALEX 2021, Alexandroupolis, Grecia.

Nazar, R. (2021). Automatic induction of a multilingual taxonomy of discourse markers. Congreso eLex 2021: post-editing lexicography (Virtual).

2020

Nazar, R.; Renau, I.; Ferraro, G.; Marín, R.; Balvet, A. (2020). Una metodología no supervisada para la identificación de hiperonimia: experimentos en español, inglés y francés. 3er Congreso Internacional de Lingüística Computacional y de Corpus, Medellín, Colombia.

Obreque, J.; Nazar, R. (2020). Asignación de hiperónimos para sustantivos polisémicos en una taxonomía de inducción automática: propuesta metodológica a partir de las similitudes de coocurrencia verbal en hipónimos de segundo grado. 3er Congreso Internacional de Lingüística Computacional y de Corpus, Medellín, Colombia.

Acosta, N.; Nazar, R. (2020). Estilector, una propuesta para la enseñanza de la escritura de textos en español. 3er Congreso Internacional de Lingüística Computacional y de Corpus, Medellín, Colombia.

2018

Nazar, R. (2018). Taller de procesamiento de textos con Perl: una mini-introducción. Taller dictado en la Pontificia Universidad Católica de Valparaíso, 3 de mayo de 2018. PDF

2015

Nazar, R. (2015). An ultra-condensed introduction to Discourse Analysis: two-hour tutorial. NICTA (National Information and Communication Technologies Australia), October 23, 2015. PDF

Nazar, R. (2015). Taxonomy Induction with Quantitative Methods. NICTA Seminar, the content of this seminar was very much the same as in this paper.

Nazar, R. (2015). La terminología como disciplina científica. XXI Congreso Internacional de la Sociedad Chilena de Lingüística (SOCHIL 2015), Universidad Católica De Temuco, 25-27 de noviembre de 2015.

Nazar, R; Renau, I; Fernández-Silva, S.; González, S. (2015). Estilector: una herramienta para la revisión de problemas textuales en estudiantes universitarios. XXI Congreso Internacional de la Sociedad Chilena de Lingüística (SOCHIL 2015), Universidad Católica De Temuco, 25-27 de noviembre de 2015.

Renau, I.; Nazar, R. (2015). Anotación semántica de verbos del castellano basada en estadística de corpus. XXI Congreso Internacional de la Sociedad Chilena de Lingüística (SOCHIL 2015), Universidad Católica De Temuco, 25-27 de noviembre de 2015.

Renau, I.; Nazar, R. (2015). Un estudio semántico del léxico mediante el análisis cuantitativo del discurso. XI Congreso Internacional ALED 2015, Buenos Aires, 3-6 noviembre 2015.

Renau, I.; Nazar, R. (2015). Verbario: An Online Syntactico-Semantic Database of Spanish Verbs. Electronic Lexicography in the 21st Century (eLex 2015). Herstmonceux Castle in Sussex, UK, August 11-13, 2015.

2014

Nazar, R. (2014). Un sistema de extracción de terminología basado en semántica distribucional. XIV Simposio Iberoamericano de terminología RITerm 2014. Terminología, innovación e impacto social: a 25 años de la fundación de RITerm, 1-4 de diciembre de 2014, Facultad de Letras, Pontificia Universidad Católica de Chile, Santiago de Chile.

Nazar, R. & Renau, I. (2014). Análisis semántico de argumentos verbales mediante algoritmos estadísticos. Workshop de Procesamiento Automatizado de Textos y Corpus, WOPATEC-2014, 13 - 14 de Noviembre, Viña del Mar, Chile.

Fernández, S.; González, C.; Nazar, R.; Renau, I. (2014). Aplicación de estadística de corpus a la revisión de problemas textuales en estudiantes universitarios. VIII Encuentro Nacional de Estudios del Discurso: Aplicaciones educativas y clínicas. Asociación Latinoamericana de Estudios del Discurso (ALED), Universidad de Valparaíso, Chile.

2013

Nazar, R. (2013). Extraños-misteriosos-insondables-inescrutables son los caminos del Señor: extracción de relaciones paradigmáticas mediante análisis estadístico de textos. Seminar. Universitat Pompeu Fabra, April 18, 2013. Campus de la Comunicació. Roc Boronat 138, 08018, Barcelona.

2012

Cabré, M. T.; Montané, M.A.; Nazar, R. (2012). Corpus-based Terminology Processing. TKE 2012 Tutorial. Madrid, June 22.

Cabré, M. T.; Montané, M.A.; Nazar, R. (2012). Computer-assisted Terminology Processing. LREC 2012 Tutorial. Istambul, May 21. PDF

Nazar, R. (2012). Co-occurrence Graphs applied to Word Sense Induction and Disambiguation. Colloque international: La cooccurrence: du fait statistique au fait textuel - Besançon, February 8-10.

2011

Cabré, T.; Nazar, R. (2011). Vers une nouvelle stratégie de détection de néologismes. 4th Joint Seminar Organised by the CVC and Termisti. Institut supérieur de traducteurs et interprètes. Haute École de Bruxelles, April 29, 2011.

Cabré, T.; Nazar, R. (2011). El trabajo terminológico automatizado: Nuevos principios y herramientas. CILC 2011 WORKSHOP. Universitat Politècnica de València, April 6, 2011.

Nazar, R. (2011). Neología semántica: un enfoque desde la lingüística cuantitativa. Seminar. Universitat Pompeu Fabra, November 30, 2011. Campus de la Comunicació. Roc Boronat 138, 08018, Barcelona. PDF

Nazar, R. (2011). Un experimento de alineación del vocabulario de las distintas lenguas del Corpus Técnico del IULA. IV Jornada de Recerca de l'IULA, July 1, 2011.

Nazar, R. (2011). Extracción de terminología bilingüe a partir de corpus paralelos y corpus monolingües. XXIX Congreso Internacional de AESLA, Universidad de Salamanca.

Nazar. R. (2011). Industrias de la lengua, ingeniería lingüística, lingüística computacional, procesamiento del lenguaje natural, lingüística de corpus: muchos términos, ¿una misma disciplina?. Round Table at Universitat Pompeu Fabra, 11 March 2011. Participants: Alejandro Cernuda, Rogelio Nazar, Maarten Janssen and Jorge Vivaldi. Chair: Jenny Azarian.

Wanner, L.; Ferraro, G.; Nazar, R. (2011). User need-driven compilation of collocation dictionaries from corpora. Proceedings of Electronic lexicography in the 21st century: new applications for new users (eLEX2011). Blej, Slovenia, November 10-12, 2011.

2010

Azarian, J.; Nazar, R. (2010). Estudio del ciclo de vida de las palabras: consecuencias para el desarrollo de diccionarios sincrónicos. III Jornada de Recerca de l'IULA, April 8, 2010.

Casesnoves, R; Nazar, R. (2010). Explotación de corpus y análisis de datos. Análisis cuantitativo. I Escuela Internacional de Verano de Lingüística de Corpus, September 1-4, 2010.

Nazar, R. (2010). Extracción automática de terminología con algoritmos estadísticos supervisados. Seminar, Universidad de Murcia, November 30, 2010.

Nazar, R. (2010). Estudio diacrónico de la terminología especializada. III Jornada de Recerca de l'IULA, April 8, 2010.

2009

Nazar, R. (2009). Un extractor de términos puramente estadístico. II Jornada de Recerca de l'IULA, January 29, 2009.

2008

Nazar, R. (2008). Primera aproximación a un extractor terminológico independiente de la lengua y del dominio temático. Grupo Iulaterm, IULA, Universidad Pompeu Fabra, April 22, 2008.

Nazar, R. (2008). Aplicaciones de lingüística cuantitativa. Grupo Infolex, IULA, Universidad Pompeu Fabra, March 7, 2008.

Nazar, R. (2008). Hacia una analítica cuantitativa de los conceptos. comunicación presentada en la I Jornada de Recerca de l'IULA en el marco de la Semana de la Ciencia, November, 2007.

Vivaldi, J. & Nazar, R. (2008). Muestreo y representatividad: el script Redemú. Iulaterm, IULA, Universidad Pompeu Fabra, November 6, 2008.

2007

Nazar, R. (2007). Explotación estadística de corpus: análisis conceptual y clasificación de documentos. Seminario dictado en el Institut Universitari de Lingüística Aplicada, February, 2007.

2006

Nazar, R. (2006). Seminario de Introducción al Software Jaguar. IULA, Universidad Pompeu Fabra, September 26, 2006.

2005

Nazar, R. (2005). Extracción automática de mapas conceptuales. Institut Universitari de Lingüística Aplicada, June, 2005.

2004

Nazar, R. (2004). Presentación del Software BwanaNet Multilingüe. IX Simposio Iberoamericano de Terminología (RITERM 2004), November 29, 2004.

Participation in government or university funded projects

Title: Mapa de las metáforas conceptuales en sustantivos y verbos del español: un estudio de los patrones metafóricos basado en corpus.
Funding: Proyecto Fondecyt Regular. 2023-2027. (ANID - Gobierno de Chile).
Role: Co-researcher. (Lead researcher: Irene Renau)
Title: Inducción automática de taxonomías de marcadores discursivos a partir de corpus multilingües.
Funding: Proyecto Fondecyt Regular. 2019-2021 Nº 1191481. Ministerio de Educación del Gobierno de Chile.
Role: lead researcher.
Title: COMPETERM: El desarrollo de la competencia terminológica durante la inserción disciplinar: profundidad de conocimiento terminológico y calidad terminológica de la escritura en estudiantes principiantes, avanzados y expertos de biología y traducción/interpretación.
Funding: Proyecto Fondecyt Regular. 2017-2020 Nº 1171346 . Ministerio de Educación del Gobierno de Chile.
Role: co-researcher.
Title: Detección automática del género de los nombres propios: aplicaciones para mercadotecnia directa.
Funding: Concurso Prototipos Tecnológicos: Dirección de Innovación y Emprendimiento, Vicerrectoría de Investigación y Estudios Avanzados; Pontificia Universidad Católica De Valparaíso. Project duration: 2017-2018. Ref.: 035.691-32.
Role: lead researcher.
Title: Un prototipo de herramienta en código abierto para la extracción de información textual.
Funding: Concurso Prototipos Tecnológicos: Dirección de Innovación y Emprendimiento, Vicerrectoría de Investigación y Estudios Avanzados; Pontificia Universidad Católica De Valparaíso. Project duration: 2016-2017. Ref.: 035.691-51.
Role: lead researcher.
Title: Inducción automática de taxonomías del español y el francés mediante técnicas cuantitativas y estadística de corpus.
Funding: Programa de Cooperación Científica Ecos - Conicyt (Concurso De Proyectos De Intercambio Convocatoria 2016). Project duration: 2017-2019. Ref. C16H02.
Role: collaborator.
Title: Inducción automática de taxonomías de sustantivos generales y especializados a partir de corpus textuales desde el enfoque de la lingüística cuantitativa.
Funding: Conicyt (Fondecyt Iniciación 2014). Project duration: 2014-2017. Ref.: 11140686.
Role: lead researcher.
Title: Desarrollo de un algoritmo estadístico de extracción terminológica basado en coocurrencia léxica.
Funding: Pontificia Universidad Católica de Valparaíso (Proyecto DI Iniciación).
Role: lead researcher.
Title: Diseño e implementación de software educativo en web para el autoaprendizaje y mejora de la redacción académica formal en estudiantes de primer año de universidad (Proyecto de Innovación docente).
Funding: Vicerrectoría Académica de la Pontificia Universidad Católica de Valparaíso.
Role: collaborator.
Title: VARTERM. La variación denominativa en la representación y transmisión del conocimiento especializado a través cuatro disciplinas de las ciencias naturales y humanas.
Funding: Government of Chile - FONDECYT (11121597).
Role: collaborator.
Title: TOPAS: Tool platform for intelligent Patent Analysis and Summarization.
Funding: European Project (FP7-SME-2011 286639).
Role: collaborator.
Title: Revisión automática y cooperativa de textos académicos.
Funding: Universitat Pompeu Fabra(20 PlaCQUID 2012-2013 1/A).
Role: collaborator.
Title: Harenes: Herramienta de ayuda a la redacción en español: fundamentos lingüísticos para el procesamiento de colocaciones.
Funding: Spanish Government (FFI2011-30219-C02-01).
Role: collaborator.
Title: ExtracCIT: Extracción terminológica de las revistas de la Hemeroteca Científica Catalana.
Funding: Institut d'Estudis Catalans.
Role: collaborator.
Title: APLE2: Neologismos generales y neologismos especializados: análisis y contraste desde el punto de vista de su producción, recepción y circulación social.
Funding: Spanish Government (FFI2012-37260).
Role: collaborator.
Title: APLE: Procesos de actualización del léxico español a partir de la prensa editada en Cataluña.
Funding: Spanish Government (FFI2009-12188-C05-01/FILO).
Role: collaborator.
Title: TEXTERM3: Fundamentos, estrategias y herramientas para el procesamiento y extracción automáticos de información especializada..
Funding: Spanish Government (HUM2006-09458).
Role: collaborator.
Title: TEXTERM2: Fundamentos, estrategias y herramientas para el procesamiento y extracción automáticos de información especializada.
Funding: Spanish Government (BFF2003-02111).
Role: collaborator.

Teaching

Currently, I am teaching the following courses:

In the PhD Program in Linguistics:

Research Methodology in Linguistics 1
Computational Linguistics

In the Master Degree in Applied Linguistics:

Computational Linguistics

Undergraduate courses:

Text Grammar
Terminology 2
Computational Linguistics

Past teaching activities include seminars in different universities on various topics for PhD students and the general public, a course on quantitative methods in linguistics at the International Summer School of Corpus Linguistics of Universitat Pompeu Fabra, a Workshop on Terminology Management in Translation Memories in Pompeu Fabra's IDEC and two courses on Terminology and corpus processing for translators at the Institut für Übersetzen und Dolmetschen of Heidelberg University.

Contact

rogelio dot nazar at gmail dot com