Dismark

This is the official website of Project Fondecyt 1191481

AUTOMATIC INDUCTION OF TAXONOMIES OF DISCOURSE MARKERS FROM MULTILINGUAL CORPORA



Current version:

24 February 2021


This web site in under construction, but it already offers the following contents:
  1. An automatic classifier of discourse markers
  2. A multilingual taxonomy resulting from the project
  3. Documentation (only partially developed)


1. Automatic classifier of discourse markers

Paste a list of expressions here:

Language:

(It is faster if the language is selected manually)

This demo of the algorithm receives an input list of one or more expression (one per line) and then carries on with the following tasks:
  1. It will classify the units by language (among those languages already listed)
  2. It will decide, in each case, if it is a discourse marker or not
  3. If it is, it will assign a category to it.

At the moment, it will not process more than 750 expressions at once because the algorithm is not yet optimized for massive data processing. We will deal with that later. It is just not a priority right now.

~~~~~


2. Taxonomy of discourse markers in English, Spanish, French and German

Disclaimer: These data (both the categories and the individual units populating them) have been automatically generated with a statistical algorithm and no human being has yet revised the results. They will, undoubtedly, contain errors. If you are curious or want to help, you are kindly invited to send email to rogelio (dot) nazar (at) pucv (dot) cl



Category: Discourse marker: Connector (addition)


3 clusters
 


Cluster 1
IDEnglishSpanishFrenchGerman
8
in a manner similar
in a similar manner
in the same manner
in the same way
likewise
similarly

así mismo
de forma similar
de igual forma
de igual manera
de igual modo
de la misma forma
de la misma manera
de manera similar
de modo similar
del mismo modo
forma similar
igualmente
manera similar
por añadidura

de la même façon
de la même manière
de même
de même manière
même façon
même manière

auf dieselbe weise
desgleichen
dieselbe weise
ebenso
gleiche weise
gleichen weise
in ähnlicher weise
ähnlicher weise
 


Cluster 2
IDEnglishSpanishFrenchGerman
45
at the same time
both
in parallel
in parallel to
in parallel with
in turn
simultaneously
the same
to offset

a la vez
a su vez
al mismo tiempo
de forma paralela
de forma simultánea
en paralelo
forma paralela
paralelamente
pero al mismo tiempo
simultáneamente

au même moment
dans le même temps
en même temps
en parallèle
en parallèle avec
même temps
parallèlement
parallèlement à
simultanément
à la fois

gleich
gleichzeitig
parallel
parallel dazu
parallel zu
zugleich
zur gleichen zeit
 Other possible categories for cluster 2:

Others: Temporal expressions (without deixis)

 


Cluster 3
IDEnglishSpanishFrenchGerman
82
to make matters worse

para empeorar las cosas

pour aggraver

erschwerend kommt hinzu
zu allem übel
zu allem überfluss



Category: Discourse marker: Connector (consequence)


5 clusters
 


Cluster 4
IDEnglishSpanishFrenchGerman
41
in doing so
in so doing
in this way
that way
this way

de esta forma
de esta manera
de este modo

ce faisant
cette façon
cette manière
de cette façon
de cette manière

auf diese weise
diese weise
hier entlang
hier lang
 Other possible categories for cluster 4:

Discourse marker: Connector (consecutive)

 


Cluster 5
IDEnglishSpanishFrenchGerman
59
accordingly
and as a result
and so
and therefore
as a consequence
as a consequence of
as a result
as a result of
as it turned out
as regards
as well
as well as
by extension
consequently
for these reasons
for those reasons
from this perspective
hence
in consequence
in doing so
in so doing
in such a way
on that account
so
so that
so that the
such that
then
thereby
therefore
thus
why
with regard to

así
así pues
como consecuencia
como era de esperar
como resultado
como resultado de ello
con ello
consecuentemente
consiguientemente
de esa forma
de esa manera
de ese modo
de manera que
de modo que
desde esta perspectiva
en consecuencia
por consiguiente
por ello
por ende
por eso
por estas razones
por extensión
por lo que
por lo tanto
por tanto
pues
y así
y entonces
y por consiguiente
y por lo tanto
y por tanto

abroge
ainsi
ainsi donc
alors
c`est pourquoi
ce faisant
de ce fait
de sorte que
donc
dès lors
en conséquence
et ainsi
et par conséquent
par conséquence
par conséquent
par extension
par là
par voie de conséquence
pour ces raisons
pourquoi

abkommen aufgenommen wurde
als folge
als konsequenz
dadurch
daher
daher entsprechend
daher wird erwartet
damit
daraus folgt
darum
dementsprechend
deshalb
dies führt dazu
entsprechend angepasst
entsprechend geändert
entsprechend zu ändern
folglich
so spricht
somit
was dazu führt
was dazu führte
wie sich herausstellte
 Other possible categories for cluster 5:

Discourse marker: Connector (consecutive)
Others: Modality (epistemic)

 


Cluster 6
IDEnglishSpanishFrenchGerman
61
for that purpose
for this purpose
to that end
to this end

a este fin
a tal efecto
a tal fin
con ese fin
con este fin
con tal fin
para ello

a cette fin
pour ce faire
à cet effet
à cette fin

diesem zweck
für diesen zweck
zu diesem zweck
zweck
 Other possible categories for cluster 6:

Discourse marker: Connector (consecutive)

 


Cluster 7
IDEnglishSpanishFrenchGerman
70
for that reason
for this reason
that is why

por esa razón
por ese motivo
por esta razón
por este motivo

c’est pour cette raison
pour cette raison

aus diesem grund
 Other possible categories for cluster 7:

Discourse marker: Connector (consecutive)

 


Cluster 8
IDEnglishSpanishFrenchGerman
73
as a whole
at least
because
but in the end
for the same reason
given that
in most cases
in proportion as
in the past
in the process
on the basis of
on the grounds that
since
the reason
the reason for that
the reason for this
the reason is
then
therefore
to the extent that

a consecuencia de ello
dado
debido
desde
en el pasado
en el proceso
en su conjunto
entonces
porque
puesto
puesto que
técnicamente
ya que

car
cela
depuis
depuis que
du moins
mais au final
mais à la fin
parce que
plupart des cas
pour la même raison
puisque
à cause

aber am ende
aber letztendlich
angesichts der tatsache
darum
darum daß
das liegt daran
denn
der grund
der grund dafür ist
doch am ende
in dem maße
meist vorübergehend
meisten fällen
mit der begründung
seit
seit dem
seitdem
weil
 Other possible categories for cluster 8:

Discourse marker: Connector (consecutive)
Others: Deixis (temporal)




Category: Discourse marker: Connector (contrast)


2 clusters
 


Cluster 9
IDEnglishSpanishFrenchGerman
50
although
but still
despite the fact that
even if
even so
even though
in spite of the fact
though
while

aun cuando
aun en
aunque
incluso aunque
pero aun así
si bien

bien que
mais encore
mais toujours
même ainsi
même si

aber immer noch
aber nicht
aber trotzdem
auch wenn
auftreten müssen
dachte
obwohl
selbst wenn
sogar
trotz der tatsache
 Other possible categories for cluster 9:

Discourse marker: Connector (contrastive)

 


Cluster 10
IDEnglishSpanishFrenchGerman
77
all the same
and yet
but
despite all
despite these
despite this
however
in spite of all
nevertheless
nonetheless
that being said
that said
yet

a pesar de ello
a pesar de eso
a pesar de esto
a pesar de todo
ahora bien
aparte de eso
aun así
aún así
con todo
de cualquier forma
de cualquier modo
de todas formas
de todas maneras
de todos modos
dicho esto
no obstante
pero
pero aún así
pese a ello
pese a todo
sin embargo
y sin embargo

cependant
et pourtant
malgré cela
malgré tout
néanmoins
pourtant
toutefois

allerdings
dennoch
jedoch
trotz dieser
trotz dieses
trotzdem
 Other possible categories for cluster 10:

Discourse marker: Connector (contrastive)




Category: Discourse marker: Exemplification


4 clusters
 


Cluster 11
IDEnglishSpanishFrenchGerman
56
in such a case
in such case
in such cases
in that case
in these cases
in these cases the
in this case
in those cases
in which case

en cuyo caso
en ese caso
en esos casos
en este caso
en estos casos
en tal caso
en tales casos

dans ce cas
dans ces cas
dans un tel cas
en ce cas
en pareil cas
sans vous en apercevoir
tels cas
vous courez le risque

diesen fällen
einem solchen fall
für italienisch
für niederländisch
in diesem fall
in diesen fällen
in solchen fall
in solchen fällen
solchen fällen
 


Cluster 12
IDEnglishSpanishFrenchGerman
58
among other things
among others
amongst other things
amongst others
in particular
including
inter alia

entre otras
entre otras cosas
entre otros
entre otros factores

entre autres
entre autres choses
notamment

unter anderem
unter anderem durch
 Other possible categories for cluster 12:

Others: Unclassifiable

 


Cluster 13
IDEnglishSpanishFrenchGerman
72
above all
and in particular
as much as possible
as well as
in particular
in some areas
including
inter alia
specifically

concretamente
en algunas zonas
en algunos ámbitos
en concreto
en especial
en particular
específicamente
y en particular

autant que possible
considérant ce qui suit
dans certaines régions
dans certaines zones
dans certains domaines
en particulier
et en particulier
la suède
notamment
plus largement
plus précisément
spécifiquement
vu

auf artikel
gestützt
gestützt auf
in einigen bereichen
in einigen gebieten
in einigen gegenden
in manchen bereichen
in manchen gegenden
insbesondere
insbesondere auf artikel
sowie
speziell
spezifisch
vor allem
 


Cluster 14
IDEnglishSpanishFrenchGerman
78
as an example
as examples
as for example
for example
for instance

como ejemplo
como por ejemplo
por ejemplo

comme exemple
comme par exemple
comme un exemple
ou encore
par exemple

als beispiel
als ein beispiel
beispielsweise
wie zum beispiel
zum beispiel



Category: Discourse marker: Information structuring (commentary)


5 clusters
 


Cluster 15
IDEnglishSpanishFrenchGerman
5
against this background
background
in that context
in the background
in the present case
in this context
in this regard
in this scenario
in this situation
on this occasion
under these conditions
under those conditions

antecedentes
en dicho contexto
en el fondo
en esas condiciones
en ese contexto
en esta hipótesis
en esta ocasión
en esta situación
en este contexto
en este escenario
trasfondo

dans ce cadre
dans ce contexte
dans ce scénario
dans le cas présent
fond
sur un fond
à cet égard

diesem zusammenhang
hintergrund
hintergrundfarbe
hintergrundinformationen
im hintergrund
in diesem kontext
in diesem szenario
in diesem zusammenhang
vor diesem hintergrund
 Other possible categories for cluster 15:

Discourse marker: Information structuring (comment)
Others: Unclassifiable

 


Cluster 16
IDEnglishSpanishFrenchGerman
17
arguably
certainly
doubtless
in all likelihood
in all probability
indeed
is no doubt that
it can be no doubt
it is possible
no doubt
no doubt about
no doubt that
no doubts
presumably
probably
there is no doubt
this shows that
to be sure
undoubtedly
without a doubt
without doubt

ciertamente
con toda probabilidad
desde luego
indudablemente
muy probablemente
ninguna duda
no cabe duda
no hay duda
posiblemente
probablemente
seguramente
sin duda
sin duda alguna
sin lugar a dudas

aucun doute
certainement
doute
il est possible
indubitablement
ne fait aucun doute
probablement
probablement pas
sans aucun
sans aucun doute
sans doute
vraisemblablement

besteht kein zweifel
dies zeigt
es ist wahrscheinlich
gewiss
kein zweifel
keinen zweifel
ohne zweifel
sicherlich
um sicher zu sein
unzweifelhaft
vermutlich
wahrscheinlich
zweifellos
 Other possible categories for cluster 16:

Discourse marker: Information structuring (comment)
Others: Modality (epistemic)

 


Cluster 17
IDEnglishSpanishFrenchGerman
21
at that point
at this moment
at this point
at this point in time
at this stage
at this stage of
at this time
in this phase
in this point are
out in this point
this stage of the
to in this point

en esta etapa
en esta fase
en este momento
en este punto

cette fois
à ce stade

an diesem punkt
an dieser stelle
diesem stadium
dieser stelle
dieser zeit des jahres
in diesem stadium
in dieser phase
zum jetzigen zeitpunkt
 Other possible categories for cluster 17:

Discourse marker: Information structuring (comment)
Others: Deixis (temporal)
Others: Temporal expressions (without deixis)

 


Cluster 18
IDEnglishSpanishFrenchGerman
51
above all
and more importantly
even more important is
importantly
more important
more importantly
most important
most importantly

aún más importante
es más importante
lo más importante
más importante
más importante aún

mais plus important
plus important
plus important encore

aber noch wichtiger
am wichtigsten
ganz wichtig
noch wichtiger
noch wichtiger ist
und vor allem
viel wichtiger
wichtiger noch
 Other possible categories for cluster 18:

Discourse marker: Information structuring (comment)
Others: Modality (valorative)

 


Cluster 19
IDEnglishSpanishFrenchGerman
57
at best
failing that
failing this
if impracticable
in that regard
in that sense
in that spirit
in the absence thereof
in the worst case
in this area
in this connection
in this context
in this direction
in this regard
in this respect
in this sense
in this spirit
on that point
on this point
that it is important
to that effect
with this in mind
worst case scenario

a ese respecto
a este respecto
al respecto
en el mejor de los casos
en el peor de los casos
en ese sentido
en este sentido
en su defecto
este respecto
teniendo esto en cuenta

a cet égard
cet égard
dans ce domaine
dans ce sens
dans cet esprit
dans cette optique
en ce sens
sur ce point
à ce propos
à ce sujet
à cet égard

dass diejenigen
dass es wichtig ist
diesbezüglichen
diesem sinne
dieser hinsicht
in diesem sinne
in diesem zusammenhang
in dieser hinsicht
so gesehen
wie wichtig es ist
 Other possible categories for cluster 19:

Discourse marker: Information structuring (comment)
Others: Modality (valorative)
Others: Unclassifiable




Category: Discourse marker: Information structuring (digression)


1 clusters
 


Cluster 20
IDEnglishSpanishFrenchGerman
79
apropos
by the way
incidentally
it should be noted
it should be noted that
to the fact that

a propósito
cabe señalar
conviene señalar
debe señalarse
dicho sea de paso
por cierto
pues bien

accessoirement
au demeurant
au fait
en parlant de ça
il convient de noter
incidemment
soit dit en passant

aber beachtet
anzumerken
apropos
im übrigen
nebenbei bemerkt
zufälligerweise
übrigens
 Other possible categories for cluster 20:

Discourse marker: Information structuring (comment)




Category: Discourse marker: Information structuring (organization)


6 clusters
 


Cluster 21
IDEnglishSpanishFrenchGerman
4
additionally
also
and also
and more
besides
besides that
but
but also
but rather
even
even if
far beyond
far more
furthermore
in addition
in addition to
including
increasing
increasingly
moreover
much more
not just
on the other hand
personnel is
whether or not

a continuación
además
adicionalmente
asimismo
cada vez más
después de esto
es más
inclusive
incluso
pero también
por otra parte
sino también
también
y además
y también

aussi
de plus
de surcroît
du reste
en dehors de lui
en outre
en plus
mais
mais aussi
mais également
non seulement
outre
par ailleurs
plus en
plus en plus
plus encore
qui plus est
seulement

aber auch
abgesehen davon
außerdem
darüber hinaus
hinaus
hinzu kommt
immer mehr
in zunehmendem
innerhalb
mehr noch
nicht nur
sondern
sondern auch
zudem
zunehmend
zunehmendem maße
zusätzlich
überdies
 Other possible categories for cluster 21:

Discourse marker: Connector (addition)

 


Cluster 22
IDEnglishSpanishFrenchGerman
19
after all
as a last resort
at last
at the end
finally
for concluding
for one thing
in conclusion
in the end
lastly
on one hand
on one side
ultimately

al fin
al fin y al cabo
al final
en conclusión
en definitiva
en última
en última instancia
en último término
finalmente
para concluir
para terminar
por fin
por último

au final
d'un côté
d’un côté
en conclusion
en dernier lieu
en définitive
en fin de compte
enfin
finalement
pour finir

abschließend
am ende
anderen seite
auf einer seite
einen seite
einerseits
endlich
letzten endes
letztendlich
letztlich
prägung
schließlich
und schließlich
zum einen
 Other possible categories for cluster 22:

Discourse marker: Information structuring (organize)

 


Cluster 23
IDEnglishSpanishFrenchGerman
34
another side
but on the other
by another
by contrast
by other
by other means
contrary to
conversely
for his part
for its part
for their part
furthermore
in a particular case
in contrast
in one case
moreover
of the one part
of the other part
on one hand
on one side
on the contrary
on the one hand
on the other hand
on the other side
on their side
unlike

a la inversa
en cambio
en contraste
por el contrario
por el otro
por el otro lado
por otra
por otra parte
por otro
por otro lado
por su parte
por un lado
por una parte

autre part
contrairement
d'autre part
d'un autre côté
d'un côté
d'une part
dans un cas
de leur côté
de son côté
dont peut
d’autre part
d’un autre côté
en revanche
et inversement
inversement
par contraste
par contre
pour sa part
quant à elle
un autre côté
à l'inverse
à l’inverse

anderen seite
andererseits
auf der anderen
dagegen
gegensatz dazu
im gegensatz
im gegensatz dazu
umgekehrt
umgekehrt kann
 Other possible categories for cluster 23:

Discourse marker: Information structuring (organize)
Others: Modality (epistemic)

 


Cluster 24
IDEnglishSpanishFrenchGerman
62
and second
and secondly
first
first of all
firstly
in the first place
in the second place
on the one hand
second
second of all
secondly
third
thirdly

ante todo
en cuarto lugar
en primer
en primer lugar
en quinto lugar
en segundo lugar
en tercer lugar
y segundo

deuxièmement
d’abord
d’autre part
d’une part
en deuxième lieu
en premier lieu
en second lieu
en troisième lieu
premier lieu
premièrement
second lieu
secundo
tout d'abord
tout d’abord
troisièmement

drittens
erstens
und zweitens
zweitens
 Other possible categories for cluster 24:

Discourse marker: Information structuring (organize)

 


Cluster 25
IDEnglishSpanishFrenchGerman
75
in certain cases
in other cases
in some cases
in specific cases

en algunos casos
en ciertos casos
en determinados casos
en otros casos

certains cas
dans certains cas

bestimmten fällen
einigen fällen
in bestimmten fällen
in einigen fällen
in manchen fällen
manchen fällen
 Other possible categories for cluster 25:

Discourse marker: Connector (addition)
Others: Unclassifiable

 


Cluster 26
IDEnglishSpanishFrenchGerman
87
for starters
to begin with
to start
to start with

para comenzar
para empezar

pour commencer
 Other possible categories for cluster 26:

Discourse marker: Information structuring (organize)




Category: Discourse marker: Reformulation (dismissal)


3 clusters
 


Cluster 27
IDEnglishSpanishFrenchGerman
30
admittedly
anyway
as it were
at any rate
at best
at first
at first sight
at least in part
at most
by any chance
by far
by no means
if anything
if at all
if ever
in a sense
in a way
in all cases
in any case
in any event
in many cases
in most cases
in no case
in some degree
in some ways
in the majority of cases
it is true
most of the time
prima facie
so to say
so to speak
the majority of cases
to a certain extent
to a great extent
to a large extent
to a lesser extent
to some extent

a lo sumo
a primera vista
al menos en parte
como mucho
con mucho
de alguna manera
de algún modo
en cierta medida
en cierto modo
en cierto sentido
en cualquier caso
en gran medida
en la mayoría de los casos
en menor medida
en muchos casos
en muchos sentidos
en parte
en todo caso
en todos los casos
es cierto
es verdad
hasta cierto punto
por así decirlo
por decirlo así
si acaso

c'est vrai que
d'une certaine manière
dans beaucoup de cas
dans bien des cas
dans de nombreux cas
dans la majorité des cas
dans la plupart des cas
dans nombreux cas
dans tous les cas
dans un sens
dans une certaine mesure
de toute façon
en aucun cas
en quelque sorte
en tout
en tout cas
en tout état
en tout état de cause
en un sens
la plupart du temps
par certains aspects
pour ainsi dire
quoi qu'il en soit
tout état de cause
à certains égards

allen fällen
auf eine art
auf eine weise
auf jeden fall
aus jedem fall
bis zu einem gewissen grad
einem gewissen sinn
einer weise
gewissem sinne
gewissen sinne
gewisser weise
in vielen fällen
jedem fall
jeden fall
jedenfalls
mancher hinsicht
mancherlei hinsicht
so zu sagen
sozusagen
wenn etwas passiert
wenn überhaupt
zugegebenermaßen
 Other possible categories for cluster 27:

Others: Modality (veridictory)
Others: Unclassifiable

 


Cluster 28
IDEnglishSpanishFrenchGerman
66
as a rule
exceptional
extraordinary
in general
more often than not
most often
normally
typically
unusual
usually

generalmente
habitualmente
normalmente
por lo general
suelen

en général
généralement
habituellement
le plus souvent
normalement
typiquement

die normalerweise
die typischerweise
für gewöhnlich
gewöhnlich
in der regel
normalerweise
typischerweise
üblicherweise
 Other possible categories for cluster 28:

Others: Modality (alethic)
Others: Temporal expressions (without deixis)

 


Cluster 29
IDEnglishSpanishFrenchGerman
68
all in all
as a general rule
as a rule
by and large
general rule
generally
generally speaking
in general
in general terms
in principle
more generally
on balance
to a lesser extent

como norma general
de forma más general
de manera más general
en general
en menor grado
en menor medida
en términos generales
en términos más generales
generalmente
habitualmente
normalmente
por lo general
por regla general

dans une moindre mesure
de façon générale
de façon plus générale
de manière générale
de manière plus générale
en général
en principe
en règle générale
généralement
généralement admis
manière générale
plus généralement
sont généralement

allgemein
allgemeinen
allgemeiner ausgedrückt
allgemeiner betrachtet
ganz allgemein
generell
im allgemeinen
im großen und ganzen
in geringerem ausmaß
in geringerem maße
in geringerem umfang
regel
 Other possible categories for cluster 29:

Others: Modality (deontic)
Others: Temporal expressions (without deixis)




Category: Discourse marker: Reformulation (explanation)


2 clusters
 


Cluster 30
IDEnglishSpanishFrenchGerman
65
for the rest
if not
if so
in other words
it means
more precisely
namely
otherwise
put another way
so in other words
that is
that is to say
that means
this is
this means
this means that
which is
who is
would otherwise

a saber
con mayor precisión
con más precisión
de lo contrario
de otra forma
de otra manera
de otro modo
ello significa
en caso contrario
en contrario
en otras palabras
en otros términos
es decir
esto es
esto significa
esto significa que
lo contrario
o sea
otra cosa
por lo demás

autrement
autrement dit
c'est-à-dire
ceci signifie que
cela signifie
cela signifie que
dans le cas contraire
en d'autres mots
en d'autres termes
en d’autres termes
ou plus précisément
qui est
sans cela
sauf indication contraire
si tel est le cas
signifie que
sinon
à savoir

anderen worten
andernfalls
anders ausgedrückt
anders gesagt
anderweitig
ansonsten
das bedeutet
das heißt
das ist
dies bedeutet
genauer gesagt
heißt
in anderen worten
mit anderen worten
nämlich
präziser
 Other possible categories for cluster 30:

Discourse marker: Information structuring (digress)

 


Cluster 31
IDEnglishSpanishFrenchGerman
74
if applicable
if appropriate
where applicable
where appropriate

en su caso
si procede

cas échéant
medicaments non
ou des dechets provenant

beschränkungen für eine
beseitigung von nicht
davon stammenden
oder beschränkungen für eine
oder davon stammenden abfallmaterialien
sowie bedingungen
sowie bedingungen oder beschränkungen



Category: Discourse marker: Reformulation (rectification)


1 clusters
 


Cluster 32
IDEnglishSpanishFrenchGerman
48
an end in itself
but rather
in its place
instead
instead of
on the contrary
or rather
per se
rather
rather than

al contrario
antes bien
en lugar
en lugar de ello
en lugar de eso
en su lugar
en vez
en vez de eso
mejor dicho
más bien
sino más bien

au contraire
au lieu
au lieu de cela
en soi
mais plutôt
plutôt
plutôt que
à la place

anstatt
die in der lage sind
eher
genauer gesagt
im gegenteil
sondern darum
statt dessen
stattdessen



Category: Discourse marker: Reformulation (summarization)


3 clusters
 


Cluster 33
IDEnglishSpanishFrenchGerman
16
as a last resort
in a few words
in a word
in brief
in short
in sum
in summary
in the end
on balance
sum up
to sum up
to summarise
ultimately
upon the whole

de forma resumida
en definitiva
en fin
en forma sumaria o
en pocas
en pocas palabras
en resolución
en resumen
en resumidas cuentas
en una palabra
en última
en última instancia
en último término
forma sumaria o agregada

en bref
en définitive
en fin de compte
en résumé
en somme
en été
finalement
forme résumée
forme résumée ou agrégée
ou agrégée

kurz gefasst
kurz gesagt
kurzum
letzten endes
letztendlich
letztlich
zusammenfassend
 


Cluster 34
IDEnglishSpanishFrenchGerman
25
after all
at last
at some point
at some time
at the end
brief
but after all
eventually
in a few words
in a word
in brief
in short
in sum
in summary
in summer
in the end
in the summer
on balance
sooner or later
sum up
to sum up
to summarise
ultimately
upon the whole

a fin de cuentas
a la larga
al final
así pues
de forma resumida
después de todo
en algún momento
en definitiva
en fin
en pocas palabras
en resolución
en resumen
en resumidas cuentas
en suma
en una palabra
en última instancia
en último término
eventualmente
tarde o temprano

après tout
au bout du compte
au final
bref
en bref
en définitive
en fin de compte
en résumé
en somme
en été
enfin
finalement
forme résumée
forme résumée ou agrégée
ou agrégée

am ende
erweitert
irgendwann
kurz gefasst
kurz gesagt
kurzum
letzten endes
letztendlich
letztlich
schließlich
 Other possible categories for cluster 34:

Others: Modality (alethic)
Others: Temporal expressions (without deixis)

 


Cluster 35
IDEnglishSpanishFrenchGerman
55
after all
and finally
and lastly
last but not least

no por ello menos importante
pero no menos importante
y finalmente
y por último

de
et enfin
et finalement
finalement
last but not least
mais non des moindres

drittens und letztens
guter letzt
last but not least
nicht zuletzt
schließlich
und schließlich



Category: Discourse marker: Reinforcement


3 clusters
 


Cluster 36
IDEnglishSpanishFrenchGerman
27
actually
and indeed
as a matter of fact
but then
by definition
de facto
effective
effectively
for that matter
if yes
in effect
in fact
in practice
in reality
in truth
indeed
not further
on the contrary
precisely
quite simply
quite the contrary
really
the correct
the right thing
to tell the truth
truly
what does this
which means

a decir verdad
así que
con eficacia
curiosamente
de forma efectiva
de hecho
de verdad
definitivamente
efectivamente
en efecto
en la práctica
en realidad
en verdad
francamente
manera efectiva
pero en realidad
pero entonces
por definición
precisamente
realmente
simplemente

bien au contraire
certes
concrètement
c’est précisément
dans la pratique
dans les faits
de fait
effectivement
efficacement
efficacement les
en effet
en faisant cela
en fait
en pratique
en réalité
en termes effectifs
en vérité
fait
justement
là encore
mais en réalité
manière efficace
par définition
plus efficacement
précisément
réellement
si oui
tout simplement
très simplement
vraiment

definitionsgemäß
die zeigen
effektiv
eigentlich
es geht darum
ganz im gegenteil
gerade weil
herauszufinden
in der tat
in wirklichkeit
per definition
per definitionem
richtig
schon dabei sind
so genau und eng
tatsächlich
um sicher zu gehen
um zu überprüfen
und zwar
wahrhaft
wahrlich
was bedeutet
wenn sie versuchen
wirklich
wirksam
wirksam zu
zu nutzen
zur wirksamen
 Other possible categories for cluster 36:

Others: Modality (veridictory)
Others: Unclassifiable

 


Cluster 37
IDEnglishSpanishFrenchGerman
37
above all
at a time of
at a time when
but above all
environment
especially
first and foremost
first of all
for the most part
foremost
important
in a time
in an era
in certain countries
in large part
in particular
in some countries
in the first place
in the latter case
including
inter alia
more specifically
most of all
notably
particularly

ante todo
antes que nada
en especial
en primer lugar
en segundo lugar
en su mayor parte
especialmente
más concretamente
más en concreto
más específicamente
más que nada
particularmente
por encima de todo
sobre todo

avant tout
dans ce dernier cas
dans certains pays
dessus tout
en grande partie
en particulier
en premier lieu
environnement
et surtout
les entreprises
mais surtout
notamment
par dessus tout
particulièrement
plus concrètement
plus particulièrement
plus précisément
plus spécifiquement
pour la plupart
surtout
tout d’abord

also zunächst
also zunächst einmal
am allermeisten
besonders
die notwendigkeit
erster linie
genauer gesagt
in einer zeit
in erster linie
insbesondere
insbesondere dann
und vor allem
vor allem
wenn es darum geht
wenn man bedenkt
wichtig
wichtig ist
wirtschaftlichen
zu entwickeln
zuallererst
zunächst
 Other possible categories for cluster 37:

Others: Modality (valorative)

 


Cluster 38
IDEnglishSpanishFrenchGerman
64
above all
basically
essentially
foremost
in essence
in substance
primarily

básicamente
en esencia
esencialmente
fundamentalmente
principalmente

en gros
en substance
essentiellement
fondamentalement
principalement

enthält weniger
enthält weniger als
erster linie
grunde
hauptsächlich
im grunde
im grunde genommen
im prinzip
im wesentlichen
in erster linie
primär
vor allem



Category: Others: Conversational


1 clusters
 


Cluster 39
IDEnglishSpanishFrenchGerman
83
as you can see
as you know
believe me
come on
excuse me
forgive me
please
thank you

agradezco
bien
como usted sabe
creedme
créame
gracias
muchas gracias
perdonadme
perdóname
perdóneme
por favor
¡oh
¿por qué?

comme vous le savez
comme vous le voyez
comme vous pouvez le constater
comme vous pouvez voir
comme vous savez
excusez
je vous remercie
me pardonnera
merci
merci beaucoup

danke
danke ihnen
entschuldigen
entschuldigung
glaube mir
hier sehen können
komm schon
mir verzeihen
normalerweise anweisen
vergib mir
verzeih mir
vielen dank
wenn sie wissen
wie man sieht
wie sie sehen
 Other possible categories for cluster 39:

Discourse marker: Conversational
Others: Deixis (personal)
Others: Unclassifiable




Category: Others: Deixis (personal)


1 clusters
 


Cluster 40
IDEnglishSpanishFrenchGerman
80
as i said
for my part
i believe
i hope
i mean to say
i presume
i suppose
i think
in my opinion
in my view
let us say
like i said

a mi juicio
como digo
como he dicho
como ya he dicho
creo
creo que
desde mi punto de vista
digamos
digo
en mi opinión
espero
por mi parte
quiero decir
según creo
supongo
tal como dije
yo creo

comme je le disais
je crois
j’espère
selon mon point de vue
à mon avis
à mon sens

aus meiner sicht
bereits sagte
ich denke
ich freue mich
ich glaube
ich hoffe
meiner ansicht nach
meiner meinung nach
schon sagte
wie gesagt
 Other possible categories for cluster 40:

Discourse marker: Reformulation (explanation)
Others: Modality (epistemic)




Category: Others: Deixis (temporal)


8 clusters
 


Cluster 41
IDEnglishSpanishFrenchGerman
23
in so far as
insofar as
now
so far
thus far
to date
to the extent that
to this day
until now
until recently
until the date
until the moment
unto this day
up to now
up to the date
up to the moment

a la fecha
ahora
hace poco
hasta ahora
hasta el momento
hasta hace poco
hasta la fecha

désormais
encore aujourd`hui
encore récemment
jusqu'ici
jusqu'à maintenant
jusqu'à présent
jusqu`à ce jour
jusqu`à présent
jusque récemment
jusqu’à présent
jusqu’à récemment
maintenant
mesure où
à ce jour
à maintenant
à présent

bis auf diesen tag
bis jetzt
bis vor kurzem
bisher
bislang
 


Cluster 42
IDEnglishSpanishFrenchGerman
38
and now
at least for now
at that moment
at the moment
at this moment
at this point in time
for now
for the moment
for the time being
now
right now

ahora mismo
de momento
en este momento
en estos momentos
por ahora
por el momento
y ahora

au moment où
en ce moment
en ce moment même
maintenant
moins pour l’instant
pour l'instant
pour le moment

bislang gibt
fürs erste
genau jetzt
gerade jetzt
im augenblicke
im moment
in diesem augenblick
in diesem moment
jetzt gerade
nur wenige hinweise
und jetzt
vorerst
vorläufig
 


Cluster 43
IDEnglishSpanishFrenchGerman
49
at present
but today
currently
even now
even today
nowadays
these days
today

actualidad
actualmente
en la actualidad
en nuestros días
esos días
estos días
hoy día
hoy en día
pero hoy

a cette époque
actuellement
aujourd'hui
ces jours
de nos jours
heure actuelle
mais aujourd’hui
même aujourd’hui
même maintenant
nos jours
à ce moment
à l'heure actuelle
à présent

aber heute
aktuell
derzeit
diesen tagen
dieser tage
gegenwärtig
heutzutage
momentan
selbst heute
selbst jetzt
sogar heute
sogar jetzt
zurzeit
 


Cluster 44
IDEnglishSpanishFrenchGerman
85
a few years ago
a year ago
during the last few years
during the last years
five years ago
for some years
four years ago
in recent years
in the last years
one year ago
over the past few years
ten years ago
the last few years
the past few years
three years ago
two years ago
years ago

años atrás
cinco años antes
durante los últimos años
en estos últimos años
en los últimos años
en últimos años
hace algunos años
hace cinco años
hace cuatro años
hace dos años
hace pocos años
hace tres años
hace un año
hace unos años

au cours des dernières années
ces dernières années
depuis quelques années
il y a cinq ans
il y a deux ans
il y a dix ans
il y a quatre ans
il y a trois ans

als vor einem jahr
als vor fünf jahren
als vor vier jahren
in den letzten jahren
in den vergangenen jahren
vor drei jahren
vor ein paar
vor ein paar jahren
vor einem jahr
vor einigen jahren
vor etwa drei jahren
vor etwa einem jahr
vor jahren
vor ungefähr einem jahr
vor vielen jahren
vor zehn jahren
vor zwei jahren
 


Cluster 45
IDEnglishSpanishFrenchGerman
92
more recently
most recently

más recientemente
recientemente

dernièrement
plus récemment
tout dernièrement

jüngerer vergangenheit
jüngerer zeit
zuletzt
 


Cluster 46
IDEnglishSpanishFrenchGerman
93
from now on
in a short time
in the coming years
in the future
in the years ahead

de ahora en adelante
en adelante
en el futuro
en los próximos años
en poco tiempo

dans le futur
dorénavant
à partir de maintenant

ab jetzt
von jetzt an
von nun an
 Other possible categories for cluster 46:

Others: Temporal expressions (without deixis)

 


Cluster 47
IDEnglishSpanishFrenchGerman
98
in the past

dans le passé
traditionnellement
 


Cluster 48
IDEnglishSpanishFrenchGerman
100
in recent months
over the last few decades

en las últimas décadas
en los últimos meses



Category: Others: Modality (epistemic)


4 clusters
 


Cluster 49
IDEnglishSpanishFrenchGerman
1
clearly
evidently
it goes without saying
it is clear
it is difficult to
it is obvious
more dominant
naturally
obviously
of course
taken for granted

claramente
claro está
como es lógico
con claridad
de forma natural
de manera natural
evidentemente
lógicamente
naturalmente
obviamente
por supuesto
y por supuesto

bien entendu
bien sûr
bien évidemment
clairement
de toute évidence
manifestement
naturellement
tout naturellement
évidemment

auf natürliche
auf natürliche weise
augenscheinlich
eindeutig
es ist klar
es ist offensichtlich
es ist schwierig
es versteht sich von selbst
ganz klar
klar
naturgemäß
natürlich
natürlich vorkommende
offenbar
offensichtlich
selbstverständlich
wie natürlich
zu unterscheiden
 Other possible categories for cluster 49:

Discourse marker: Connector (addition)
Others: Modality (veridictory)

 


Cluster 50
IDEnglishSpanishFrenchGerman
54
at least in theory
in theory
theoretically
to all appearance

al menos en teoría
al parecer
en teoría
según parece
supuestamente
teóricamente

en théorie
moins en théorie
peut théoriquement
théoriquement

in der theorie
theoretisch
 


Cluster 51
IDEnglishSpanishFrenchGerman
67
can be
maybe
might
perhaps

quizá
quizás
tal vez

peut
peut être
peut-être
être que

vielleicht
 


Cluster 52
IDEnglishSpanishFrenchGerman
81
as they say
for some
from this perspective
from this point of view
in their opinion
in their view

a su juicio
aparentemente
como dicen
como suele decirse
desde este punto de vista
desde su punto de vista
en su opinión
para algunos
para ellos
presumiblemente
según dicen
según ellas
según se dice

aus ihrer sicht
ihrer ansicht nach
wie man sagt
wie man so sagt
 Other possible categories for cluster 52:

Discourse marker: Information structuring (comment)




Category: Others: Modality (valorative)


2 clusters
 


Cluster 53
IDEnglishSpanishFrenchGerman
60
fortunately
luckily
thank god
thank goodness
thank heaven
thankfully

afortunadamente
por fortuna
por suerte

fort heureusement
heureusement
mais heureusement
par bonheur
par chance

dankenswerterweise
glücklicherweise
gott sei dank
zum glück
 


Cluster 54
IDEnglishSpanishFrenchGerman
63
alas
regrettably
sadly
unfortunately

con tristeza
desafortunadamente
desgraciadamente
lamentablemente
por desgracia
tristemente

hélas
mais malheureusement
malheureusement
malheureusement pas
tristement

bedauerlicherweise
leider
leider ist
traurigerweise
unglücklicherweise



Category: Others: Spatial expressions (without deixis)


1 clusters
 


Cluster 55
IDEnglishSpanishFrenchGerman
76
all over the world
around the world
as far as possible
at global level
at world level
from around the world
global
globally
if possible
in the world
on a global scale
on a worldwide basis
the whole world
throughout the world
to the extent possible
when possible
where possible
worldwide

a escala mundial
a nivel mundial
cuando sea posible
en lo posible
en todo el mundo
globalmente
nivel mundial
worldwide

au monde entier
dans la mesure du possible
dans le monde
dans le monde entier
doit être apprécié globalement
du monde entier
globalement
monde entier
partout dans le monde
si possible
worldwide

aus aller welt
global
nach möglichkeit von
sofern möglich
soweit möglich
weltweit
weltweiten
überall auf der welt
 Other possible categories for cluster 55:

Discourse marker: Reformulation (dismissal)
Others: Modality (alethic)




Category: Others: Temporal expressions (without deixis)


12 clusters
 


Cluster 56
IDEnglishSpanishFrenchGerman
40
from the beginning
from the beginning of
from the outset
from the start
from the very beginning
right from the start

desde el principio
desde un principio

au commencement
depuis le début
dès le début
dès le départ
emblée
à partir du début

von anfang an
von beginn an
 


Cluster 57
IDEnglishSpanishFrenchGerman
44
all this time
at that time
in the interim
in the meantime
in the meanwhile
in those days
meanwhile

entre tanto
entretanto
mientras tanto

ce temps
en attendant
entre temps
entre-temps
pendant ce temps

derweil
in der zwischenzeit
unterdessen
währenddessen
zwischenzeit
 


Cluster 58
IDEnglishSpanishFrenchGerman
46
always
as always
as ever
as usual
but now
but which
but who
by that time
each time
every time
more often than not
not always
still
still worse
when possible
whenever possible
where possible
wherever possible

aún
como de costumbre
como siempre
cuando sea posible
de cualquier manera
idealmente
más aún
para entonces
peor aún
pero ahora
siempre
siempre que sea posible
todavía

a présent
chaque fois que cela est possible
chaque fois que possible
comme d’habitude
comme toujours
encore
mais qui
pas toujours
plus souvent
toujours
toujours été

immer
immer noch
jedesmal
noch
noch immer
viel öfter
wann immer möglich
wie gewohnt
wie gewöhnlich
wie immer
wie üblich
 Other possible categories for cluster 58:

Discourse marker: Reformulation (dismissal)
Others: Deixis (temporal)
Others: Modality (epistemic)

 


Cluster 59
IDEnglishSpanishFrenchGerman
52
at moments
at times
from time to time
in that situation
in this situation
occasionally
often
once in a while
sometimes
this time around
very often

a menudo
a veces
algunas veces
cada cierto tiempo
con frecuencia
de cuando en cuando
de forma ocasional
de vez en cuando
en ocasiones
ocasionalmente
por momentos
vez en cuando

cette fois-ci
dans cette situation
de temps en temps
de temps à autre
neige parfois
occasionnellement
par moments
parfois
quelquefois
temps en temps
temps à autre
très souvent

gelegentlich
gelegentlich schwindel oder
manchmal
teils heftiger
von zeit zu zeit
zeitweise
 


Cluster 60
IDEnglishSpanishFrenchGerman
53
at the beginning
at the beginning of
fresh start
in principle
initially
new beginning
originally

al comienzo
al principio
en principio
en un primer momento
en un principio
inicialmente
originalmente

au début
au départ
dans un premier temps
initialement
originellement

anfangs
anfänglich
die ursprünglich
ursprünglich
wurde ursprünglich
zunächst
 


Cluster 61
IDEnglishSpanishFrenchGerman
69
at that moment
at that period
at that point
at that time
at the time
at this moment
at this point
back then
just then

en aquel entonces
en aquel momento
en aquella época
en ese momento
en ese punto
en su momento

ce stade
dans ce temps
en ce temps
à ce moment-là
à cette époque

an diesem punkt
damals
zu diesem zeitpunkt
zu dieser zeit
 


Cluster 62
IDEnglishSpanishFrenchGerman
89
a year later
one year later
ten years later
two years later

diez años después
dos años después
dos años más tarde
un año después

deux ans après
deux ans plus tard
dix ans après
dix ans plus tard
une année plus

ein jahr später
zehn jahre später
zwei jahre später
 


Cluster 63
IDEnglishSpanishFrenchGerman
90
once upon a time

il était une fois

einmal eine zeit
 


Cluster 64
IDEnglishSpanishFrenchGerman
91
for decades
for many years
for years
over many years

desde hace muchos años
durante años
durante décadas
durante muchos años
por décadas
por muchos años

de nombreuses années
depuis de longues années
depuis des décennies
des décennies
pendant des décennies

für jahrzehnte
für viele jahre
jahrzehntelang
seit jahrzehnten
seit vielen jahren
über jahrzehnte
 


Cluster 65
IDEnglishSpanishFrenchGerman
94
have since
since that time
since then

desde entonces
desde ese momento

depuis lors
 


Cluster 66
IDEnglishSpanishFrenchGerman
95
during the same period
during this period
during this time
in the same period
over the same period

durante el mismo período
durante este período
durante este tiempo
en el mismo período
 


Cluster 67
IDEnglishSpanishFrenchGerman
99
once again

encore une fois
une fois de plus
une fois encore



Category: Others: Unclassifiable


4 clusters
 


Cluster 68
IDEnglishSpanishFrenchGerman
39
as appropriate
as far as possible
as it is
as may be necessary
as such
if applicable
if necessary
if needed
if possible
to the consumer a
to the extent possible
when necessary
where applicable
where appropriate
where necessary
where possible
where relevant
whereas
while
while the

como tal
como tales
considerando
cuando proceda
cuando sea necesario
de ser necesario
en caso necesario
en la medida de lo posible
en lo posible
en su caso
llegado el caso
mientras
según corresponda
según proceda
si es necesario
si es posible
si es preciso
si fuera necesario
si fuese necesario

alors que
au besoin
cas échéant
ce qui suit
comme il est
considérant ce qui suit
en tant que tel
en tant que telle
le cas échéant
lorsque nécessaire
pour y remédier
selon qu`il est
si besoin
si besoin est
si nécessaire
tandis que
éventuellement

als solche
bedarf entsprechend
bei bedarf
bereichen wie
die es ermöglichen
erforderlichenfalls
es ist notwendig
falls erforderlich
falls notwendig
falls nötig
gegebenenfalls
gegebenenfalls auch
je nach bedarf
nötigenfalls gleichzeitiger
soweit anwendbar
soweit möglich
weitere warnhinweise
wenn möglich
wenn notwendig
wenn nötig
 Other possible categories for cluster 68:

Discourse marker: Reformulation (dismissal)
Others: Modality (alethic)

 


Cluster 69
IDEnglishSpanishFrenchGerman
71
in such circumstances
in these circumstances
in those circumstances
under such circumstances
under these circumstances
under these conditions

en esas circunstancias
en estas circunstancias
en tales circunstancias

dans ces circonstances
dans ces conditions
dans telles circonstances
telles circonstances

diesen umständen
solchen umständen
unter derartigen umständen
unter diesen umständen
unter solchen umständen
 


Cluster 70
IDEnglishSpanishFrenchGerman
96
so forth
so on
so on and so

et ainsi de suite
 


Cluster 71
IDEnglishSpanishFrenchGerman
97
or at least

tout au moins


3. Documentation

(Only partially developed)



This section contains the following items:
  1. + A synopsis of the project
  2. + People involved
  3. + Publications and theses derived from the project


3.1 Synopsis of the project

Project Fondecyt Regular 1191481, with title 'Automatic induction of taxonomies of discourse markers from multilingual corpora', is funded by Anid.cl and directed by Rogelio Nazar. It consists of a lexicographic research project aimed at cataloging discourse markers (DMs) by means of statistical analysis of large parallel corpora. It is based on a newly developed algorithm for the automatic induction of a multilingual taxonomy of DMs, which is then used to recursively identify and classify more units. The project started in April 2019 and is scheduled to finish in April 2022, but some preliminary results are already available, including a classifier of DMs and a first version of a multilingual taxonomy of discourse markers in English, Spanish, French and German.

Discourse markers (DMs) have been in the spotlight of linguistic theory in recent years, with an increasing number of publications devoted on the subject (e.g. Casado Velarde, 1993; Fraser, 1999; Martín Zorraquino & Portolés, 1999; Pons Bordería, 2001; Fischer, 2006; Borreguero & López, 2010). Early interest on the subject began to appear in the context of discourse analysis (Halliday & Hasan, 1976; van Dijk, 1978; Halliday, 1985), where DMs were defined as particles that facilitate the interpretation of coherence relations in texts. In other words, they are instructions on how to connect propositions and organize argumentation. They are, therefore, procedural rather than conceptual or lexical. They can pertain to different categories, such as conjunctions, adverbs, prepositional phrases, idioms, and so on. The way to classify DMs is according to their functions. Some of the most common are counter-argumentation, with expressions such as however or nevertheless, cause-consequence, such as consequently or therefore, and so on. A well-known taxonomy is the one by Martín Zorraquino & Portolés (1999), but there are others. Fewer are the attempts to compile extended lists of DMs. Some dictionaries have appeared (e.g. Santos Río, 2003; Briz, 2008). The main difference between our present research and these attempts is that ours is an empirical method, i.e., a bottom-up rather than a top-down approach. This is important for practical reasons, as the automation saves a lot of effort, buy also, and most importantly, for scientific reasons, as the quantitative method favors objectivity.

The method applied in this project is purely statistical, i.e. without any type of external resource apart from a corpus, not even POS-taggers. It is a minimalistic approach based on parallel corpora, in this case Tiedemann's (2012) Opus Corpus, based on co-occurrence association measures and an entropy model. DMs are identified according to their distribution in the corpus, and their characteristic pattern is that they are independent of the content of the text. In operational terms, this means that their occurrence cannot be used to predict the occurrence of other lexical units. They are then classified according to a novel clustering algorithm. The similarity measure used for the clustering is their shared equivalence in the parallel corpus (i.e., nevertheless and however are considered similar because they share the same equivalences in a second language). Then, the result of the clustering of the different languages is aligned to obtain a multilingual taxonomy. Once a basic taxonomy is built this way, it is then used to classify new DMs in a recursive manner. The algorithm will first classify a DM candidate by language, will then decide if it is effectively a DM and, if this is the case, it will assign a category to it.

References
Borreguero, M., López, A. (2010). Marcadores del discurso: de la descripción a la definición. Vol 45. Iberoamericana.
Briz, A., Pons, S. & Portolés, J. (Coords.) (2008). Diccionario de partículas discursivas del español. [online] http://www.dpde.es
Casado Velarde, M. (1993). Introducción a la gramática del texto del español. Madrid: Arco libros.
Fischer, K. (Ed.). (2006). Approaches to discourse particles. Amsterdam: Elsevier.
Fraser, B. (1999). What are discourse markers? Journal of Pragmatics, 31: 931-952.
Gili Gaya, S. (1943). Curso superior de sintaxis española. Mexico: Minerva.
Halliday, M.A. & Hasan, R. (1976). Cohesion in English. London: Longman.
Halliday, M.A.K. (1985). An introduction to functional grammar. London: Arnold.
Martín Zorraquino, M. A., & Portolés, J. (1999). Los marcadores del discurso. In I. Bosque & V. Demonte (Eds.), Gramática
Descriptiva de la Lengua Española (pp. 4051-4214). Madrid: Espasa.
Montolío, E. (2001). Conectores de la lengua escrita. Contraargumentativos, consecutivos, aditivos y organizadores de la información. Barcelona: Ariel.
Pons Bordería, S. (2001). Connectives/Discourse markers. An Overview. Quaderns de Filologia. Estudis Literaris. 6:219-243.
Santos Río, L. (2003). Diccionario de partículas. Salamanca: Luso-española de ediciones.
Tiedemann, J. (2012). Parallel data, tools and interfaces in OPUS. European Language Resources Association (ELRA).

3.2 People involved


Lead researcher :
Rogelio Nazar

Co-researchers :
Irene Renau
David Lindemann

Research assistants:
Nicolás Acosta
Andrea Alcaíno
Patricio Arriagada
Scarlette Gatica
Ricardo Martínez
Natalie Mies
Maureen Noble
Valentina Ravest
Diego Sánchez
Jana Strohbach

Students who have finished or are working on their thesis with scholarships from this project:

PhD Thesis:

Hernán Robledo Nakagawa (ongoing). Una propuesta para la categorización inductivade marcadores discursivos parentéticos en castellano.

Undergraduate theses:

Camila Alvarado Barbosa (2020). Detección de marcadores discursivos: el caso de los conectores causal-consecutivos y su polifuncionalidad.

Sara Asenjo Sotelo (2019). Estudio descriptivo del uso de marcadores discursivos en niños de 7 años con trastorno específico del lenguaje.

José Bahamonde Cano (2019). La terminología médica en la traducción audiovisual: análisis de la terminología médica en subtítulos profesionales y fansub de textos audiovisuales no especializados.

Paolo Caballería Rodríguez (2019). Modelo algorítmico para el reconocimiento automático de referentes y la resolución de anáfora pronominal en textos en español.

Yerko Leiva (2019). Análisis de modalizadores en el discurso de revistas psiquiátricas chilenas y españolas.

Belén Guerrero Carreño (2020). Análisis contrastivo del uso de préstamos simples en las variantes chilena y peninsular del castellano.

3.3 Publications derived from the project


Nazar, R.; Balvet, A.; Ferraro, G.; Marín, R.; Renau, I. (2020). 'Pruning and repopulating a lexical taxonomy: experiments in Spanish, English and French'. Journal of Intelligent Systems, vol. 30 num. 1, pp. 376-394.


Nazar, R.; Renau, I., Acosta, N., Robledo, H., Soliman, H., Zamora, S. (2020). 'Corpus-Based Methods for Recognizing the Gender of Anthroponyms'. Names: A Journal of Onomastics
.


Asenjo, S.; Nazar, R. (2020). 'Marcadores discursivos en niños de 7 años con trastorno específico del lenguaje: estudio descriptivo'. RLA. Revista de lingüística teórica y aplicada, vol. 58 núm 1, pp. 93-114.


Nazar, R.; Galdames, A. (2019). 'Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas'. Revista Linguamatica, vol. 11, núm. 2, pp. 17-32.


Nazar, R. (2019). 'El análisis cuantitativo de la coocurrencia léxica en la lexicografía especializada'. In Sanmartín Sáez, Julia y Quilis Merín, Mercedes (eds.). Retos y avances en lexicografía: los diccionarios del español en el eje de la variación lingüística. Anejo 10 de Normas., Anejo 10 de Normas. Valencia: Asociación Española de Estudios Lexicográficos.


Robledo, H.; Nazar, R. (2018). 'Una clasificación automatizada de marcadores discursivos'. Procesamiento del Lenguaje Natural, n. 61, pp 109-116.


Home