Picture of Rogelio Nazar

Rogelio Nazar

Researcher in Computational Linguistics
Chair of the Linguistics Department
( Not any more! 😃 I fulfilled my three-year mandate)

Instituto de Literatura y Ciencias del Lenguaje

Pontificia Universidad Católica de Valparaíso



Short Bio

I was born in Mendoza, Argentina, in 1975. My original academic background was communication studies, which I studied at Universidad Nacional de Cuyo. After some years of experience in the private sector, in 2003 I started working full-time in linguistics. I was affiliated with Universitat Pompeu Fabra in Barcelona, Spain, where I worked for ten years. Currently I work for the Institute for Literary and Linguistic Studies (Instituto de Literatura y Ciencias del Lenguaje) of the Pontificia Universidad Católica de Valparaíso.


Interests

My area of interest is quantitative linguistics, and through this discipline I study semantics and terminology. Broader terms that describe the type of work I do are computational linguistics, natural language processing, corpus linguistics and probably others. My main interest is the application of distributional analysis in semantics by means of statistics of term co-occurrence, which can serve many purposes in lexicography, monolingual and bilingual terminology extraction and taxonomy induction. To a lesser extent, I have also studied word sense disambiguation, authorship attribution and automatic text categorization, among other areas.


Education

Training, courses, research stays:


Publications

2020

Nazar, R.; Obreque, J.; Renau, I. (2020). "Tarántula –> araña –> animal : asignación de hiperónimos de segundo nivel basada en métodos de similitud distribucional". Procesamiento del Lenguaje Natural, núm 64, pp. 29-36. PDF

Renau, I.; Nazar, R.; Lecaros, V. (2020). (en prensa) "La evolución de las marcas ortográficas y tipográficas en los procesos de lexicalización de neologismos: un estudio en el vocabulario de la crisis económica en prensa española". Revista Española de Lingüística Aplicada, Spanish Journal of Applied Linguistics.

2019

Nazar, R.; Galdames, A. (2019). "Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas". Revista Linguamatica, vol. 11, núm. 2, pp. 17-32. PDF

Nazar, R. (2019). "El análisis cuantitativo de la coocurrencia léxica en la lexicografía especializada". En Sanmartín Sáez, Julia y Quilis Merín, Mercedes (eds.). Retos y avances en lexicografía: los diccionarios del español en el eje de la variación lingüística. Anejo 10 de Normas., Anejo 10 de Normas. Valencia: Asociación Española de Estudios Lexicográficos.

Renau, I.; Nazar, R.; Castro, A.; López, B.; Obreque, J. (2019). "Verbo y contexto de uso: un análisis basado en corpus con métodos cualitativos y cuantitativos". Revista Signos, vol. 52, núm. 101, pp. 878-901. PDF

2018

Robledo, H.; Nazar, R. (2018). "Una clasificación automatizada de marcadores discursivos". Procesamiento del Lenguaje Natural, n. 61, pp 109-116. PDF

Nazar, R. (2018). Invitación al estudio estadístico del lenguaje. ArXiv:1804.07349, [stat.AP]. PDF

2017

Nazar, R.; Soto, R.; Urrejola, K. (2017). Detección automática de nombres eventivos no deverbales en castellano: un enfoque cuantitativo basado en corpus. Revista Linguamatica, vol. 9, núm. 2, pp. 21-31. PDF

Nazar, R.; Arriagada, P. (2017). POL: un nuevo sistema para la detección y clasificación de nombres propios. Procesamiento del Lenguaje Natural, n. 58, pp. 13-20. PDF

Nazar, R., Renau, I., Marín, R. (2017). Experiments in taxonomy induction in Spanish and French. Proceedings of Language, Ontology, Terminology and Knowledge Structures Workshop (LOTKS 2017), pp. 66-75. PDF

Nazar, R., Renau, I., Marín, R. (2017). Taxonomía automatizada de sustantivos del castellano y del francés: hacia el etiquetado semántico automático multilingüe. In: Sariego López, Ignacio, Juan Gutiérrez Cuadrado y Cecilio Garriga Escribano (eds.), El diccionario en la encrucijada: de la sintaxis y la cultura al desafío digital. Santander: AELEX, 731-745. PDF

Renau, I., Nazar, R. (2017). Verbos en contexto: una propuesta para la detección automática de patrones léxicos en corpus. In: Sariego López, Ignacio, Juan Gutiérrez Cuadrado y Cecilio Garriga Escribano (eds.), El diccionario en la encrucijada: de la sintaxis y la cultura al desafío digital. Santander: AELEX, 879-897. PDF

2016

Nazar, R. (2016). Distributional analysis applied to terminology extraction: example in the domain of psychiatry in Spanish. Terminology: International Journal of Theoretical and Applied Issues in Specialized Communication, 22(2): 142-170.

Nazar, R., Renau, I. (2016). “A Quantitative analysis of the semantics of verb-argument structures”. In S. Torner and E. Bernal (eds.), Collocations and other lexical combinations in Spanish. Theoretical and Applied approaches. New York: Routledge, pp. 114-136.

Nazar, R.; Renau, I. (2016). Automatic extraction of lexico-semantic patterns from corpora. Proceedings of the XVII EURALEX International Congress: Lexicography and Linguistic Diversity. Tinatin Margalitadze and George Meladze (eds). Tbilisi, Gergia: Ivane Javakhishvili Tbilisi State University, pp. 823-830. PDF

Nazar, R.; Renau, I. (2016). A taxonomy of Spanish nouns, a statistical algorithm to generate it and its implementation in open source code. Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC'16). European Language Resources Association (ELRA), May 2016, pp. 1485-1492. PDF

2015

Nazar, R.; Renau, I. (2015). Agrupación semántica de sustantivos basada en similitud distribucional: implicaciones lexicográficas. In María Pilar Garcés Gómez (ed.): "Lingüística y diccionarios" (Anexos Revista de Lexicografía, vol. 2: 272-295). Universidade da Coruña.

Nazar, R.; Renau, I. (2015). Ontology Population Using Corpus Statistics. Proceedings of the Joint Ontology Workshops 2015 co-located with the 24th International Joint Conference on Artificial Intelligence (IJCAI 2015). Buenos Aires, Argentina, July 25-27, 2015. PDF

2014

Bouayad-Agha, N.; Burga, A.; Casamayor, G.; Codina, J.; Nazar, R.; Wanner, L. (2014). "An Exercise in Reuse of Resources: Adapting General Discourse Coreference Resolution for Detecting Lexical Chains in Patent Documentation". Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14). European Language Resources Association (ELRA), 3214-3221, May 2014. PDF

Lindemann, D.; Manterola, I.; Nazar, R.; San Vicente, I.; Saralegi, X. (2014). "Bilingual Dictionary Drafting: The Example of German-Basque, a Medium-Density Language Pair". XVI EURALEX Conference, Bolzano/Bozen, 563-576, July 2014. PDF

López Ferrero, C.; Nazar, R.; Renau, I.; Torner, S. (2014). "Computer-assisted revision in Spanish academic texts". Procedia. Social and Behavioral Sciences, 141: 470-483. PDF

Nazar, R. (2014). Una metodología para depurar los resultados de los extractores de términos. In Chelo Vargas Sierra (ed.) "TIC, trabajo colaborativo e interacción en Terminología y Traducción", Granada, Ed. Comares.

2013

Ferraro, G.; Nazar, R.; Alonso Ramos, M.; Wanner, L. (2013). Towards Advanced Collocation Error Correction in Spanish Learner Corpora. Language Resources and Evaluation, vol. 48.

Nazar, R. (2013). Word Sense Discrimination Using Statistic Analysis of Texts. Barcelona Research Art Creation, vol. 1, no. 1. PDF

2012

Atserias, J.; Fuentes, M.; Nazar, R.; Renau, I. (2012). Spell Checking in Spanish: The Case of Diacritic Accents. Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC'12), Istanbul, Turkey: European Language Resources Association (ELRA). PDF

Cabré, M.T.; Nazar. R. (2012). Towards a new approach to the study of neology. Neologica. Revue internationale de néologie, no. 6.

Nazar, R. (2012). Bifid: un alineador de corpus paralelo a nivel de documento, oración y vocabulario. Linguamatica, vol. 4, no. 2. PDF

Nazar, R., Cabré, M.T. (2012). Supervised Learning Algorithms Applied to Terminology Extraction. Proceedings of TKE 2012 (Terminology and Knowledge Engineering) Conference, Madrid, 20-21 June. PDF

Nazar, R.; Vivaldi, J; Wanner, L. (2012). Automatic Taxonomy Extraction for Specialized Domains Using Distributional Semantics. Terminology: International Journal of Theoretical and Applied Issues in Specialized Communication, vol. 18, no. 2.

Nazar, R.; Vivaldi, J; Wanner, L. (2012). Co-occurrence Graphs Applied to Taxonomy Extraction in Scientific and Technical Corpora. Procesamiento del Lenguaje Natural, n. 49. PDF

Nazar, R. (2012). Algorithm qualifies for C1 courses in German exam without previous knowledge of the language: an example of how corpus linguistics can be a new paradigm in Artificial Intelligence. Proceedings of Corpus Linguistics 2011 Conference, University of Birmingham. PDF

Nazar, R.; Renau, I. (2012). Google Books N-gram Corpus used as a Grammar Checker. EACL 2012: Second Workshop on Computational Linguistics and Writing (CL\&W 2012): Linguistic and Cognitive Aspects of Document Creation and Document Engineering. Proceedings of the Workshop: April 23, 2012, Avignon, France. PDF

Nazar, R.; Renau, I. (2012). A Co-occurrence Taxonomy from a General Language Corpus. Proceedings of EURALEX 2012, Oslo, 7-11 August. PDF

Nazar, R.; Renau, I. (2012). Agrupación semántica de sustantivos basada en similitud distribucional. Implicaciones lexicográficas. V Congreso Internacional de Lexicografía Hispánica, Madrid, 25-27 June. PDF

Renau, I.; Nazar, R. (2012). Hypernymy relations from definiens-definiendum co-occurrence in multiple dictionary definitions. Procesamiento del Lenguaje Natural, n. 49. PDF

2011

Cabré, M.T.; Nazar, R. (2011). Terminus: a Workstation for terminology and corpus management. Proceedings of TOTH 2011 Conference, May 26-27th, Annecy, France.

Ferraro, G; Nazar, R.; Wanner, L. (2011). Collocations: A Challenge in Computer-Assisted Language Learning. Proceedings of the 5th International Conference on Meaning-Text Theory, Barcelona, September, 8-9 2011. PDF

Nazar, R. (2011). A Statistical Approach to Term Extraction. In: International Journal of English Studies 11(2). Murcia: Ediciones de la Universidad de Murcia, pp. 159-182. PDF

Nazar, R. (2011). Parallel corpus alignment at the document, sentence and vocabulary levels. Procesamiento del Lenguaje Natural, n. 47, pp. 129-136. PDF

Nazar, R. (2011). Estudio diacrónico de la terminología especializada utilizando métodos cuantitativos: ejemplo de aplicación a un corpus de lingüística aplicada. Revista Signos, vol. 44, no. 75, Valparaíso, Chile. PDF

Nazar, R; Cabré, T. (2011). Un experimento de extracción de terminología utilizando algoritmos estadísticos supervisados. Debate Terminológico. no. 07, pp. 36-55. PDF

Renau, I.; Nazar, R. (2011). Propuesta metodológica para la creación automática de patrones léxicos usando el Corpus Pattern Analysis. Proceedings of the 27th Conference of the Spanish Society for Natural Language Processing, September 5-7, 2011. University of Huelva.

Renau, I; Nazar, R. (2011). Análisis cuantitativo del uso real de los verbos pronominales estrictos del castellano utilizando un corpus diacrónico (Google Books). Actas del III Congreso Internacional de Lingüística de Corpus, AELINCO, Valencia 2011, pp. 303-314. PDF

2010

Cabré, T; Montane, A.; Nazar, R.; Reus, R. (2010). Estació Terminus: a Web Application for Terminology and Corpus Management. Proceedings of TKE 2010 Conference (Terminology and Knowledge Engineering), Dublin, August 12-13, 2010.

Nazar, R. (2010). A Quantitative Approach to Concept Analysis. PhD Thesis. IULA, Universitat Pompeu Fabra. PDF

Nazar, R. (2010). Evolución de la terminología lingüística en las Actas de Congresos de AESLA entre 1983 y 2006. Proceedings of: XXVIII Congreso de AESLA (Asociación española de Lingüística Aplicada). University of Vigo, April 15- 17, 2010.

Nazar, R. (2010). Invitació a l'estudi estadístic del llenguatge. In: La terminologia i la documentació: relacions i sinergies: actes de la VII Jornada SCATERM: Terminologia i documentació, Barcelona: Societat Catalana de Terminologia.. PDF

Nazar, R.; Azarian, J. (2010). The Living Lexicon: Methodology to Set Up Synchronic Dictionaries. Proceedings of Euralex Congress (European Association for Lexicography), Leeuwarden, July 6-10, 2010. PDF

Nazar, R. ; Janssen, M. (2010). Combining Resources: Taxonomy Extraction from Multiple Dictionaries. Proceedings of LREC 2010 (The 8th edition of the Language Resources and Evaluation Conference) Malta, May 19-21, 2010. PDF

2008

Nazar, R. (2008). Bilingual Terminology Acquisition from Unrelated Corpora. Proceeding of 13th Euralex Conference (European Association for Lexicography), Pompeu Fabra University, July 15-19, 2008. PDF

Nazar, R. (2008). Diferencias cuantitativas entre referencia y sentido. Proceedings of XXVI Congreso de AESLA (Asociación española de Lingüística Aplicada) University of Almería, April 3-5, 2008.

Nazar, R.; Vidal, V. (2008). Aproximación cuantitativa a la neología. Proceedings of CINEO 2008, (I Congreso Internacional de Neología en las lenguas románicas), Barcelona, May 07-10, 2008. PDF

Nazar, R.; Vivaldi, J.; Cabré, MT. (2008). A Suite to Compile and Analyze an LSP Corpus. Proceedings of LREC 2008 (The 6th edition of the Language Resources and Evaluation Conference) Marrakech (Morocco), May 28-30, 2008. PDF

Nazar, R.; Wanner, L & Vivaldi, J. (2008). Two Step Flow in Bilingual Lexicon Extraction from Unrelated Corpora. Proceedings of the EAMT 2008 Conference (European Association for Machine Translation), September 22-23, 2008, Hamburg, Germany. PDF

2007

Nazar, R.; Vivaldi, J.; Wanner, L. (2007). Towards Quantitative Concept Analysis. Procesamiento del Lenguaje Natural, n. 39,, September, 2007.. PDF

2006

Nazar, R.; Sánchez Pol, M. (2006). An Extremely Simple Authorship Attribution System. Proceedings of the Second European IAFL Conference on Forensic Linguistics / Language and the Law, Barcelona, 2006. PDF


Talks (without proceedings)

2015

Nazar, R. (2015). An ultra-condensed introduction to Discourse Analysis: two-hour tutorial. NICTA (National Information and Communication Technologies Australia), October 23, 2015. PDF

Nazar, R. (2015). Taxonomy Induction with Quantitative Methods. NICTA Seminar, the content of this seminar was very much the same as in this paper.

Nazar, R. (2015). La terminología como disciplina científica. XXI Congreso Internacional de la Sociedad Chilena de Lingüística (SOCHIL 2015), Universidad Católica De Temuco, 25-27 de noviembre de 2015.

Nazar, R; Renau, I; Fernández-Silva, S.; González, S. (2015). Estilector: una herramienta para la revisión de problemas textuales en estudiantes universitarios. XXI Congreso Internacional de la Sociedad Chilena de Lingüística (SOCHIL 2015), Universidad Católica De Temuco, 25-27 de noviembre de 2015.

Renau, I.; Nazar, R. (2015). Anotación semántica de verbos del castellano basada en estadística de corpus. XXI Congreso Internacional de la Sociedad Chilena de Lingüística (SOCHIL 2015), Universidad Católica De Temuco, 25-27 de noviembre de 2015.

Renau, I.; Nazar, R. (2015). Un estudio semántico del léxico mediante el análisis cuantitativo del discurso. XI Congreso Internacional ALED 2015, Buenos Aires, 3-6 noviembre 2015.

Renau, I.; Nazar, R. (2015). Verbario: An Online Syntactico-Semantic Database of Spanish Verbs. Electronic Lexicography in the 21st Century (eLex 2015). Herstmonceux Castle in Sussex, UK, August 11-13, 2015.

2014

Nazar, R. (2014). Un sistema de extracción de terminología basado en semántica distribucional. XIV Simposio Iberoamericano de terminología RITerm 2014. Terminología, innovación e impacto social: a 25 años de la fundación de RITerm, 1-4 de diciembre de 2014, Facultad de Letras, Pontificia Universidad Católica de Chile, Santiago de Chile.

Nazar, R. & Renau, I. (2014). Análisis semántico de argumentos verbales mediante algoritmos estadísticos. Workshop de Procesamiento Automatizado de Textos y Corpus, WOPATEC-2014, 13 - 14 de Noviembre, Viña del Mar, Chile.

Fernández, S.; González, C.; Nazar, R.; Renau, I. (2014). Aplicación de estadística de corpus a la revisión de problemas textuales en estudiantes universitarios. VIII Encuentro Nacional de Estudios del Discurso: Aplicaciones educativas y clínicas. Asociación Latinoamericana de Estudios del Discurso (ALED), Universidad de Valparaíso, Chile.

2013

Nazar, R. (2013). Extraños-misteriosos-insondables-inescrutables son los caminos del Señor: extracción de relaciones paradigmáticas mediante análisis estadístico de textos. Seminar. Universitat Pompeu Fabra, April 18, 2013. Campus de la Comunicació. Roc Boronat 138, 08018, Barcelona.

2012

Cabré, M. T.; Montané, M.A.; Nazar, R. (2012). Corpus-based Terminology Processing. TKE 2012 Tutorial. Madrid, June 22.

Cabré, M. T.; Montané, M.A.; Nazar, R. (2012). Computer-assisted Terminology Processing. LREC 2012 Tutorial. Istambul, May 21. PDF

Nazar, R. (2012). Co-occurrence Graphs applied to Word Sense Induction and Disambiguation. Colloque international: La cooccurrence: du fait statistique au fait textuel - Besançon, February 8-10.

2011

Cabré, T.; Nazar, R. (2011). Vers une nouvelle stratégie de détection de néologismes. 4th Joint Seminar Organised by the CVC and Termisti. Institut supérieur de traducteurs et interprètes. Haute École de Bruxelles, April 29, 2011.

Cabré, T.; Nazar, R. (2011). El trabajo terminológico automatizado: Nuevos principios y herramientas. CILC 2011 WORKSHOP. Universitat Politècnica de València, April 6, 2011.

Nazar, R. (2011). Neología semántica: un enfoque desde la lingüística cuantitativa. Seminar. Universitat Pompeu Fabra, November 30, 2011. Campus de la Comunicació. Roc Boronat 138, 08018, Barcelona. PDF

Nazar, R. (2011). Un experimento de alineación del vocabulario de las distintas lenguas del Corpus Técnico del IULA. IV Jornada de Recerca de l'IULA, July 1, 2011.

Nazar, R. (2011). Extracción de terminología bilingüe a partir de corpus paralelos y corpus monolingües. XXIX Congreso Internacional de AESLA, Universidad de Salamanca.

Nazar. R. (2011). Industrias de la lengua, ingeniería lingüística, lingüística computacional, procesamiento del lenguaje natural, lingüística de corpus: muchos términos, ¿una misma disciplina?. Round Table at Universitat Pompeu Fabra, 11 March 2011. Participants: Alejandro Cernuda, Rogelio Nazar, Maarten Janssen and Jorge Vivaldi. Chair: Jenny Azarian.

Wanner, L.; Ferraro, G.; Nazar, R. (2011). User need-driven compilation of collocation dictionaries from corpora. Proceedings of Electronic lexicography in the 21st century: new applications for new users (eLEX2011). Blej, Slovenia, November 10-12, 2011.

2010

Azarian, J.; Nazar, R. (2010). Estudio del ciclo de vida de las palabras: consecuencias para el desarrollo de diccionarios sincrónicos. III Jornada de Recerca de l'IULA, April 8, 2010.

Casesnoves, R; Nazar, R. (2010). Explotación de corpus y análisis de datos. Análisis cuantitativo. I Escuela Internacional de Verano de Lingüística de Corpus, September 1-4, 2010.

Nazar, R. (2010). Extracción automática de terminología con algoritmos estadísticos supervisados. Seminar, Universidad de Murcia, November 30, 2010.

Nazar, R. (2010). Estudio diacrónico de la terminología especializada. III Jornada de Recerca de l'IULA, April 8, 2010.

2009

Nazar, R. (2009). Un extractor de términos puramente estadístico. II Jornada de Recerca de l'IULA, January 29, 2009.

2008

Nazar, R. (2008). Primera aproximación a un extractor terminológico independiente de la lengua y del dominio temático. Grupo Iulaterm, IULA, Universidad Pompeu Fabra, April 22, 2008.

Nazar, R. (2008). Aplicaciones de lingüística cuantitativa. Grupo Infolex, IULA, Universidad Pompeu Fabra, March 7, 2008.

Nazar, R. (2008). Hacia una analítica cuantitativa de los conceptos. comunicación presentada en la I Jornada de Recerca de l'IULA en el marco de la Semana de la Ciencia, November, 2007.

Vivaldi, J. & Nazar, R. (2008). Muestreo y representatividad: el script Redemú. Iulaterm, IULA, Universidad Pompeu Fabra, November 6, 2008.

2007

Nazar, R. (2007). Explotación estadística de corpus: análisis conceptual y clasificación de documentos. Seminario dictado en el Institut Universitari de Lingüística Aplicada, February, 2007.

2006

Nazar, R. (2006). Seminario de Introducción al Software Jaguar. IULA, Universidad Pompeu Fabra, September 26, 2006.

2005

Nazar, R. (2005). Extracción automática de mapas conceptuales. Institut Universitari de Lingüística Aplicada, June, 2005.

2004

Nazar, R. (2004). Presentación del Software BwanaNet Multilingüe. IX Simposio Iberoamericano de Terminología (RITERM 2004), November 29, 2004.


Participation in government or university funded projects


Teaching

Currently (2018), I am teaching the following courses:

Past teaching activities include seminars in different universities on various topics for PhD students and the general public, a course on quantitative methods in linguistics at the International Summer School of Corpus Linguistics of Universitat Pompeu Fabra, a Workshop on Terminology Management in Translation Memories in Pompeu Fabra's IDEC and two courses on Terminology and corpus processing for translators at the Institut für Übersetzen und Dolmetschen of Heidelberg University.


Contact

Pontificia Universidad Católica de Valparaíso
Instituto de Literatura y Ciencias del Lenguaje
Av. El Bosque 1290, Viña del Mar, Chile
rogelio.nazar@pucv.com
+56 32 2274424