Dismark

This is the official website of Project Fondecyt 1191481

AUTOMATIC INDUCTION OF TAXONOMIES OF DISCOURSE MARKERS FROM MULTILINGUAL CORPORA



Current version:

20 September, 2021


This web site in under construction, but it already offers the following contents:
  1. An automatic classifier of discourse markers
  2. A multilingual taxonomy resulting from the project
  3. Documentation (only partially developed)


1. Automatic classifier of discourse markers

Paste a list of expressions here:

Language:

(It is faster if the language is selected manually)

This demo of the algorithm receives an input list of one or more expression (one per line) and then carries on with the following tasks:
  1. It will classify the units by language (among those languages already listed)
  2. It will decide, in each case, if it is a discourse marker or not
  3. If it is, it will assign a category to it.

At the moment, it will not process more than 750 expressions at once because the algorithm is not yet optimized for massive data processing. We will deal with that later. It is just not a priority right now.

~~~~~


2. Taxonomy of discourse markers in English, Spanish, French and German

Disclaimer: These data (both the categories and the individual units populating them) have been automatically generated with a statistical algorithm and no human being has yet revised the results. They will, undoubtedly, contain errors. If you are curious or want to help, you are kindly invited to send email to rogelio (dot) nazar (at) pucv (dot) cl



Category: Discourse marker: Connector (addition)


3 clusters
 


Cluster 1
IDEnglishSpanishFrenchGermanCatalan
8
in a manner similar
in a similar manner
in the same manner
in the same way
likewise
similarly

así mismo
de forma similar
de igual forma
de igual manera
de igual modo
de la misma forma
de la misma manera
de manera similar
de modo similar
del mismo modo
forma similar
igualmente
por añadidura

de la même façon
de la même manière
de même
de même manière
même façon
même manière

auf die selbe Art und Weise
auf die selbe Weise
auf dieselbe Art
desgleichen
dieselbe Weise
ebenso
gleich
gleiche Weise
gleichermassen
in ähnlicher Weise
ähnlicher Weise

per la mateixa raó
 


Cluster 2
IDEnglishSpanishFrenchGermanCatalan
45
at the same time
both
in parallel
in parallel to
in parallel with
in turn
simultaneously
the same
to offset

a la vez
a su vez
al mismo tiempo
de forma paralela
de forma simultánea
en paralelo
forma paralela
paralelamente
pero al mismo tiempo
simultáneamente
y al mismo tiempo

au même moment
dans le même temps
en même temps
en parallèle
en parallèle avec
même temps
parallèlement
parallèlement à
simultanément
à la fois

auf einmal
gleich
gleichwohl
gleichzeitig
in derselben Zeit
parallel
parallel dazu
parallel zu
während
zeitgleich
zugleich
zur gleichen Zeit
zur selben Zeit
zusammen

a la vegada
al mateix temps
al seu torn
i al mateix temps
però al mateix temps
 Other possible categories for cluster 2:

Others: Temporal expressions (without deixis)

 


Cluster 3
IDEnglishSpanishFrenchGermanCatalan
82
to make matters worse

para empeorar las cosas

pour aggraver

erschwerend kommt hinzu
schlimmer noch
um es noch schlimmer zu machen
zu allem
zu allem Übel
zu allem Überfluss



Category: Discourse marker: Connector (consequence)


5 clusters
 


Cluster 4
IDEnglishSpanishFrenchGermanCatalan
41
in doing so
in so doing
in this way
that way
this way

de esta forma
de esta manera
de este modo

ce faisant
cette façon
cette manière
de cette façon
de cette manière

auf diese Art
auf diese Art und Weise
auf diese Weise
dadurch
damit
diese Weise

d'aquesta manera
i d'aquesta manera
 Other possible categories for cluster 4:

Discourse marker: Connector (consecutive)

 


Cluster 5
IDEnglishSpanishFrenchGermanCatalan
59
accordingly
and as a result
and so
and therefore
as a consequence
as a consequence of
as a result
as a result of
as it turned out
as regards
as well
as well as
by extension
consequently
for these reasons
for those reasons
from this perspective
hence
in consequence
in doing so
in so doing
in such a way
on that account
so
so that
so that the
such that
then
thereby
therefore
thus
why
with regard to

así
así pues
como consecuencia
como era de esperar
como resultado
como resultado de ello
con ello
consecuentemente
consiguientemente
de esa forma
de esa manera
de ese modo
de manera que
de modo que
desde esta perspectiva
en consecuencia
hasta entonces
por consiguiente
por ello
por ende
por eso
por estas razones
por esto
por extensión
por lo cual
por lo que
por lo tanto
por tanto
pues
y así
y entonces
y luego
y por consiguiente
y por ello
y por eso
y por lo tanto
y por tanto

abroge
ainsi
ainsi donc
alors
c`est pourquoi
ce faisant
de ce fait
de sorte que
donc
dès lors
en conséquence
et ainsi
et par conséquent
par conséquence
par conséquent
par extension
par là
par voie de conséquence
pour ces raisons
pourquoi

als Folge
als Konsequenz
aus diesem Grund
dadurch
daher
daher entsprechend
daher wird erwartet
damit
daraus folgt
darum
dementsprechend
deshalb
deswegen
dies führt dazu
entsprechend angepasst
entsprechend geändert
entsprechend zu ändern
folgedessen
folglich
mithin
nachdemzufolge
so spricht
somit
was dazu führt
was dazu führte
weshalb
wie sich herausstellte

aleshores
amb això
com a conseqüència
conseqüentment
de manera que
de tal manera que
des d'aleshores
en conseqüència
fins llavors
i així successivament
i llavors
i per això
i per tant
llavors
per aquestes raons
per consegüent
per la qual cosa
per tant
si és així
és per això
és per això que
 Other possible categories for cluster 5:

Discourse marker: Connector (consecutive)
Others: Modality (epistemic)
Others: Temporal expressions (without deixis)

 


Cluster 6
IDEnglishSpanishFrenchGermanCatalan
61
for that purpose
for this purpose
to that end
to this end

a este fin
a tal efecto
a tal fin
con ese fin
con este fin
con tal fin
para ello

a cette fin
pour ce faire
à cet effet
à cette fin

für diesen Zweck
hierfür
hierzu
zu diesem Zweck

amb aquesta finalitat
per a això
 Other possible categories for cluster 6:

Discourse marker: Connector (consecutive)

 


Cluster 7
IDEnglishSpanishFrenchGermanCatalan
70
for that reason
for this reason
that is why

por esa razón
por ese motivo
por esta razón
por este motivo

c’est pour cette raison
pour cette raison

Darum
aus diesem Grund
deshalb
 Other possible categories for cluster 7:

Discourse marker: Connector (consecutive)

 


Cluster 8
IDEnglishSpanishFrenchGermanCatalan
73
as a whole
at least
because
but in the end
for the same reason
given that
in most cases
in proportion as
in the past
in the process
on the basis of
on the grounds that
since
the reason
the reason for that
the reason for this
the reason is
then
therefore
to the extent that

a consecuencia de ello
en el pasado
en el proceso
en su conjunto
entonces
porque
puesto
puesto que
técnicamente
ya que

car
cela
depuis
depuis que
du moins
mais au final
mais à la fin
parce que
plupart des cas
pour la même raison
puisque
à cause

aber am Ende
aber letztendlich
angesichts der Tatsache
darum
das liegt daran
denn
der Grund dafür ist
der Grund ist
doch am Ende
in dem Maße
mit der Begründung
weil

des del començament
en aquells temps
en un moment donat
 Other possible categories for cluster 8:

Discourse marker: Connector (consecutive)
Others: Deixis (temporal)




Category: Discourse marker: Connector (contrast)


2 clusters
 


Cluster 9
IDEnglishSpanishFrenchGermanCatalan
50
although
but still
despite the fact that
even if
even so
even though
in spite of the fact
though
while

a día de hoy
aun cuando
aun en
aunque
aún hoy
aún más
incluso aunque
pero aun así
si bien

bien que
mais encore
mais toujours
même ainsi
même si

aber immer noch
aber nicht
aber trotzdem
auch wenn
obwohl
selbst wenn
sogar
trotz der Tatsache

a dia d'avui
avui en dia
encara
encara avui
encara més
encara que
i encara més
tot i que
 Other possible categories for cluster 9:

Discourse marker: Connector (addition)

 


Cluster 10
IDEnglishSpanishFrenchGermanCatalan
77
all the same
and yet
but
despite all
despite these
despite this
however
in spite of all
nevertheless
nonetheless
that being said
that said
yet

a pesar de ello
a pesar de eso
a pesar de esto
a pesar de todo
ahora bien
aparte de eso
aun así
aún así
con todo
de cualquier forma
de cualquier modo
de todas formas
de todas maneras
de todos modos
dicho esto
no obstante
pero
pero aún así
pese a ello
pese a todo
sin embargo
y sin embargo

cependant
et pourtant
malgré cela
malgré tout
néanmoins
pourtant
toutefois

allerdings
dennoch
jedoch
trotz diesem
trotz diesen
trotz dieser
trotz dieses
trotzdem
trotzdessen

amb tot
amb tot això
de qualsevol manera
de tota manera
de totes formes
de totes maneres
dit això
i no obstant això
malgrat això
malgrat tot
no obstant
però tot i així
sens dubte
sense cap dubte
sense cap mena de dubte
tanmateix
tot i així
tot i això
 Other possible categories for cluster 10:

Discourse marker: Connector (contrastive)




Category: Discourse marker: Exemplification


4 clusters
 


Cluster 11
IDEnglishSpanishFrenchGermanCatalan
56
in such a case
in such case
in such cases
in that case
in these cases
in these cases the
in this case
in those cases
in which case

en cuyo caso
en ese caso
en esos casos
en este caso
en estos casos
en tal caso
en tales casos
y en este caso

dans ce cas
dans ces cas
dans un tel cas
en ce cas
en pareil cas
sans vous en apercevoir
tels cas
vous courez le risque

bei diesem Fall
für diesen Fall
hierbei
im vorliegenden Fall
in diesem Fall
in diesen Fällen
in dieser Angelegenheit
in dieser Sache
in einem solchen Fall
in solchen Fällen

a llarg termini
i en aquest cas
 


Cluster 12
IDEnglishSpanishFrenchGermanCatalan
58
among other things
among others
amongst other things
amongst others
in particular
including
inter alia

entre otras
entre otras cosas
entre otros
entre otros factores

entre autres
entre autres choses
notamment

darunter
einschließlich
neben anderen
und andere
und anderen
und so weiter
unter anderem
unter anderem durch
unter anderen
unter vielen
usw.
zwischen anderen

entre d'altres
 Other possible categories for cluster 12:

Others: Unclassifiable

 


Cluster 13
IDEnglishSpanishFrenchGermanCatalan
72
above all
and in particular
as much as possible
as well as
in particular
in some areas
including
inter alia
specifically

concretamente
en algunas zonas
en algunos ámbitos
en concreto
en especial
en particular
específicamente
y en particular

autant que possible
considérant ce qui suit
dans certaines régions
dans certaines zones
dans certains domaines
en particulier
et en particulier
la suède
notamment
plus largement
plus précisément
spécifiquement
vu

auf einigen Gebieten
in bestimmten Bereichen
in einigen Bereichen
in einigen Gebieten
in manchen Bereichen
insbesondere
sowie
speziell
spezifisch
vor allem

en concret
en especial
i en particular
 


Cluster 14
IDEnglishSpanishFrenchGermanCatalan
78
as an example
as examples
as for example
for example
for instance

como ejemplo
como por ejemplo
por ejemplo

comme exemple
comme par exemple
comme un exemple
ou encore
par exemple

als Beispiel
als ein Beispiel
beispielsweise
wie zum Beispiel
zum Beispiel

com per exemple
per exemple



Category: Discourse marker: Information structuring (commentary)


5 clusters
 


Cluster 15
IDEnglishSpanishFrenchGermanCatalan
5
against this background
background
in that context
in the background
in the present case
in this context
in this regard
in this scenario
in this situation
on this occasion
under these conditions
under those conditions

en dicho contexto
en el fondo
en esas condiciones
en ese contexto
en esta hipótesis
en esta ocasión
en esta situación
en este contexto
en este escenario

dans ce cadre
dans ce contexte
dans ce scénario
dans le cas présent
fond
sur un fond
à cet égard

an dieser Stelle
in dem Zusammenhang
in diesem Bereich
in diesem Kontext
in diesem Rahmen
in diesem Szenario
in diesem Umfeld
in diesem Zusammenhang
vor diesem Hintergrund

aquest cop
aquesta vegada
en aquest context
 Other possible categories for cluster 15:

Discourse marker: Information structuring (comment)
Others: Unclassifiable

 


Cluster 16
IDEnglishSpanishFrenchGermanCatalan
17
arguably
certainly
doubtless
in all likelihood
in all probability
indeed
is no doubt that
it can be no doubt
it is possible
no doubt
no doubt about
no doubt that
no doubts
presumably
probably
there is no doubt
this shows that
to be sure
undoubtedly
without a doubt
without doubt

ciertamente
con toda probabilidad
desde luego
indudablemente
muy probablemente
no cabe duda
no hay duda
posiblemente
probablemente
seguramente
sin duda
sin duda alguna
sin lugar a dudas
sin ninguna duda

aucun doute
certainement
doute
il est possible
indubitablement
ne fait aucun doute
probablement
probablement pas
sans aucun
sans aucun doute
sans doute
vraisemblablement

Wohl
definitiv
dies zeigt
eindeutig
es besteht kein Zweifel
es ist wahrscheinlich
gewiss
kein Zweifel
keinen Zweifel
mit Sicherheit
natürlich
ohne Zweifel
selbstverständlich
sicherlich
unzweifelhaft
vermutlich
wahrscheinlich
zweifellos
zweifelsohne

de ben segur
indubtablement
sens dubte
sense cap dubte
sense cap mena de dubte
 Other possible categories for cluster 16:

Discourse marker: Information structuring (comment)
Others: Modality (epistemic)

 


Cluster 17
IDEnglishSpanishFrenchGermanCatalan
21
at that point
at this moment
at this point
at this point in time
at this stage
at this stage of
at this time
in this phase
in this point are
out in this point
this stage of the
to in this point

en esta etapa
en esta fase
en este momento
en este punto

cette fois
à ce stade

an diesem Punkt
an dieser Stelle
in diesem Stadium
in dieser Phase
zum jetzigen Zeitpunkt

en aquest punt
 Other possible categories for cluster 17:

Discourse marker: Information structuring (comment)
Others: Deixis (temporal)
Others: Temporal expressions (without deixis)

 


Cluster 18
IDEnglishSpanishFrenchGermanCatalan
51
above all
and more importantly
even more important is
more important
more importantly
most important
most importantly

aún más importante
es más importante
lo más importante
más importante aún
y lo más importante

mais plus important
plus important
plus important encore

aber noch wichtiger
am wichtigsten
ganz wichtig
noch wichtiger
noch wichtiger ist
und vor allem
viel wichtiger
wichtiger noch

el més important
i el més important
 Other possible categories for cluster 18:

Discourse marker: Connector (addition)
Others: Modality (valorative)

 


Cluster 19
IDEnglishSpanishFrenchGermanCatalan
57
at best
failing that
failing this
if impracticable
in that regard
in that sense
in that spirit
in the absence thereof
in the worst case
in this area
in this connection
in this context
in this direction
in this regard
in this respect
in this sense
in this spirit
on that point
on this point
that it is important
to that effect
with this in mind
worst case scenario

a ese respecto
a este respecto
al respecto
en el mejor de los casos
en el peor de los casos
en ese sentido
en este sentido
en su defecto
este respecto
teniendo esto en cuenta

a cet égard
cet égard
dans ce domaine
dans ce sens
dans cet esprit
dans cette optique
en ce sens
sur ce point
à ce propos
à ce sujet
à cet égard

dass es wichtig ist
diesbezüglich
im besten Fall
im schlechtesten Fall
im schlimmsten Fall
in diesem Sinne
in diesem Zusammenhang
in dieser Hinsicht
so gesehen
wie wichtig es ist

el respecte
en el pitjor dels casos
 Other possible categories for cluster 19:

Discourse marker: Information structuring (comment)
Others: Modality (valorative)
Others: Unclassifiable




Category: Discourse marker: Information structuring (digression)


1 clusters
 


Cluster 20
IDEnglishSpanishFrenchGermanCatalan
79
apropos
by the way
incidentally
it should be noted
it should be noted that
to the fact that

a propósito
cabe señalar
conviene señalar
debe señalarse
dicho sea de paso
por cierto
pues bien

accessoirement
au demeurant
au fait
en parlant de ça
il convient de noter
incidemment
soit dit en passant

Mitbezüglich
apropos
es ist anzumerken
es ist darauf hinzuweisen
im Zusammenhang
im Übrigen
nebenbei bemerkt
zufälligerweise
übrigens

cal assenyalar
per cert
 Other possible categories for cluster 20:

Discourse marker: Information structuring (comment)




Category: Discourse marker: Information structuring (organization)


6 clusters
 


Cluster 21
IDEnglishSpanishFrenchGermanCatalan
4
additionally
also
and also
and more
besides
besides that
but
but also
but rather
even
even if
far beyond
far more
furthermore
in addition
in addition to
including
increasing
increasingly
moreover
much more
not just
on the other hand
personnel is
whether or not

a continuación
además
adicionalmente
asimismo
cada vez más
después de esto
e incluso
es más
inclusive
incluso
pero también
por otra parte
seguidamente
sino también
también
y además
y también

aussi
de plus
de surcroît
du reste
en dehors de lui
en outre
en plus
mais
mais aussi
mais également
non seulement
outre
par ailleurs
plus en
plus en plus
plus encore
qui plus est
seulement

aber auch
abgesehen davon
außerdem
darüber hinaus
hinaus
hinzu kommt
immer mehr
in zunehmendem Maße
innerhalb
mehr noch
nicht nur
sondern
sondern auch
zudem
zunehmend
zusätzlich
überdies

a continuació
cada vegada més
fins i tot
i a més
i fins i tot
i no només això
i també
no només això
o fins i tot
també
tot seguit
és més
 Other possible categories for cluster 21:

Discourse marker: Connector (addition)

 


Cluster 22
IDEnglishSpanishFrenchGermanCatalan
19
after all
as a last resort
at last
at the end
finally
for concluding
for one thing
in conclusion
in the end
lastly
on one hand
on one side
ultimately

al fin
al fin y al cabo
al final
en conclusión
en definitiva
en última instancia
en último término
finalmente
para concluir
para terminar
por fin
por último

au final
d'un côté
d’un côté
en conclusion
en dernier lieu
en définitive
en fin de compte
enfin
finalement
pour finir

abschließend
alles in allem
am Ende
folglich
kurz und gut
letzten Endes
letztendlich
letztlich
schließlich
schlussendlich
somit
und schließlich
zum Abschluss
zum Schluss

en conclusió
en resum
finalment
i per acabar
i per últim
per acabar
per concloure
per últim
 Other possible categories for cluster 22:

Discourse marker: Information structuring (organize)

 


Cluster 23
IDEnglishSpanishFrenchGermanCatalan
34
another side
but on the other
by another
by contrast
by other
by other means
contrary to
conversely
for his part
for its part
for their part
furthermore
in a particular case
in contrast
in one case
moreover
of the one part
of the other part
on one hand
on one side
on the contrary
on the one hand
on the other hand
on the other side
on their side
unlike

a la inversa
en cambio
en contraste
por el contrario
por el otro
por el otro lado
por otra
por otra parte
por otro
por otro lado
por su parte
por un lado
por una parte
y por el otro
y por otro lado

autre part
contrairement
d'autre part
d'un autre côté
d'un côté
d'une part
dans un cas
de leur côté
de son côté
dont peut
d’autre part
d’un autre côté
en revanche
et inversement
inversement
par contraste
par contre
pour sa part
quant à elle
un autre côté
à l'inverse
à l’inverse

Hingegen
Jedoch
abschließend
am ende
andererseits
auf der anderen Seite
auf der einen Seite
auf einer Seite
dagegen
demgegenüber
einerseits
endlich
im Gegensatz dazu
im Gegenteil
letzten Endes
letztendlich
letztlich
schließlich
statt dessen
stattdessen
umgekehrt
und schließlich
vielmehr
zum anderen
zum einen

d'altra banda
d'una altra banda
d’altra banda
en canvi
i d'altra banda
per altra banda
per la seva banda
per un altre costat
per una banda
per una part
 Other possible categories for cluster 23:

Discourse marker: Information structuring (organize)
Others: Modality (epistemic)

 


Cluster 24
IDEnglishSpanishFrenchGermanCatalan
62
and second
and secondly
first
first of all
firstly
in the first place
in the second place
on the one hand
second
second of all
secondly
third
thirdly

ante todo
en cuarto lugar
en primer
en primer lugar
en quinto lugar
en segundo lugar
en tercer lugar
primero
y en segundo lugar
y segundo

deuxièmement
d’abord
d’autre part
d’une part
en deuxième lieu
en premier lieu
en second lieu
en troisième lieu
premier lieu
premièrement
second lieu
secundo
tout d'abord
tout d’abord
troisièmement

drittens
erstens
und zweitens
zweitens

cinquè
el primer
el segon
en primer lloc
en segon lloc
en tercer lloc
i en segon lloc
i en tercer lloc
primer de tot
 Other possible categories for cluster 24:

Discourse marker: Information structuring (organize)

 


Cluster 25
IDEnglishSpanishFrenchGermanCatalan
75
in certain cases
in other cases
in some cases
in specific cases

en algunos casos
en ciertos casos
en determinados casos
en otros casos

certains cas
dans certains cas

in Einzelfällen
in bestimmten Fällen
in einigen Fällen
in einzelnen Fällen
in gewissen Fällen
in manchen Fällen
mitunter
teilweise
unter Umständen
unter bestimmten Umständen

en alguns casos
 Other possible categories for cluster 25:

Discourse marker: Connector (addition)
Others: Unclassifiable

 


Cluster 26
IDEnglishSpanishFrenchGermanCatalan
87
for starters
to begin with
to start
to start with

para comenzar
para empezar

pour commencer

am Anfang
damit beginnen
eingangs
für den Anfang
für den Beginn
fürs Erste
gleich zu Beginn
zu Anfang
zu beginnen
zum Start
zunächst einmal

per començar
 Other possible categories for cluster 26:

Discourse marker: Information structuring (organize)




Category: Discourse marker: Reformulation (dismissal)


3 clusters
 


Cluster 27
IDEnglishSpanishFrenchGermanCatalan
30
admittedly
anyway
as it were
at any rate
at best
at first
at first sight
at least in part
at most
by any chance
by far
by no means
if anything
if at all
if ever
in a sense
in a way
in all cases
in any case
in any event
in many cases
in most cases
in no case
in some degree
in some ways
in the majority of cases
it is true
most of the time
prima facie
so to say
so to speak
the majority of cases
to a certain extent
to a great extent
to a large extent
to a lesser extent
to some extent

a lo sumo
a primera vista
al menos en parte
como mucho
con mucho
de alguna forma
de alguna manera
de algún modo
en cierta manera
en cierta medida
en cierto modo
en cierto sentido
en cualquier caso
en gran medida
en la mayoría de los casos
en menor medida
en muchos casos
en muchos sentidos
en parte
en todo caso
en todos los casos
es cierto
es verdad
hasta cierto punto
por así decirlo
por decirlo así
si acaso

c'est vrai que
d'une certaine manière
dans beaucoup de cas
dans bien des cas
dans de nombreux cas
dans la majorité des cas
dans la plupart des cas
dans nombreux cas
dans tous les cas
dans un sens
dans une certaine mesure
de toute façon
en aucun cas
en quelque sorte
en tout
en tout cas
en tout état
en tout état de cause
en un sens
la plupart du temps
par certains aspects
pour ainsi dire
quoi qu'il en soit
tout état de cause
à certains égards

allen Fällen
allenfalls
allerhöchstens
auf eine Art
auf eine Weise
auf jeden Fall
bestenfalls
bis zu einem gewissen Grad
einem gewissen Sinn
einer Weise
gewissem Sinne
gewisser Weise
höchstens
im gewissen Sinne
in jedem Fall
in mancher Hinsicht
in mancherlei Hinsicht
in vielen Fällen
jedenfalls
so zu sagen
sozusagen
wenn etwas passiert
wenn überhaupt
zugegebenermaßen

com a màxim
d'alguna manera
en certa manera
en certa mesura
en gran mesura
en gran part
en la majoria de casos
en la majoria dels casos
en moltes ocasions
en molts casos
en qualsevol cas
en tot cas
en tots els casos
fins a cert punt
per alguna raó
per diverses raons
per primer cop
si es vol
sigui com sigui
és cert
és veritat
 Other possible categories for cluster 27:

Others: Modality (veridictory)
Others: Unclassifiable

 


Cluster 28
IDEnglishSpanishFrenchGermanCatalan
66
as a rule
exceptional
extraordinary
in general
more often than not
most often
normally
typically
unusual
usually

generalmente
habitualmente
normalmente
por lo general

en général
généralement
habituellement
le plus souvent
normalement
typiquement

für gewöhnlich
gewöhnlich
in der Regel
normalerweise
typischerweise
üblicherweise
 Other possible categories for cluster 28:

Others: Modality (alethic)
Others: Temporal expressions (without deixis)

 


Cluster 29
IDEnglishSpanishFrenchGermanCatalan
68
all in all
as a general rule
as a rule
by and large
general rule
generally
generally speaking
in general
in general terms
in principle
more generally
on balance
to a lesser extent

como norma general
de forma más general
de manera más general
en general
en menor grado
en menor medida
en términos generales
en términos más generales
generalmente
habitualmente
normalmente
por lo general
por regla general

dans une moindre mesure
de façon générale
de façon plus générale
de manière générale
de manière plus générale
en général
en principe
en règle générale
généralement
généralement admis
plus généralement
sont généralement

allgemein
allgemeiner ausgedrückt
allgemeiner betrachtet
ganz allgemein
generell
im Allgemeinen
im Großen und Ganzen
in der Regel
in geringerem Ausmaß
in geringerem Maße
in geringerem Umfang

en termes generals
i en general
per regla general
 Other possible categories for cluster 29:

Others: Modality (deontic)
Others: Temporal expressions (without deixis)




Category: Discourse marker: Reformulation (explanation)


2 clusters
 


Cluster 30
IDEnglishSpanishFrenchGermanCatalan
65
for the rest
if not
if so
in other words
it means
more precisely
namely
otherwise
put another way
so in other words
that is
that is to say
that means
this is
this means
this means that
which is
who is
would otherwise

con mayor precisión
con más precisión
de lo contrario
de otra forma
de otra manera
de otro modo
ello significa
en caso contrario
en contrario
en otras palabras
en otros términos
es decir
esto es
esto significa
esto significa que
lo contrario
o sea
otra cosa
por lo demás

autrement
autrement dit
c'est-à-dire
ceci signifie que
cela signifie
cela signifie que
dans le cas contraire
en d'autres mots
en d'autres termes
en d’autres termes
ou plus précisément
qui est
sans cela
sauf indication contraire
si tel est le cas
signifie que
sinon
à savoir

andernfalls
anders ausgedrückt
anders gesagt
anderweitig
ansonsten
das bedeutet
das heißt
das ist
dies bedeutet
genauer gesagt
heißt
in anderen Worten
mit anderen Worten
nämlich
präziser

això significa que
això vol dir que
dit d'una altra manera
en altres paraules
en cas contrari
és a dir
 Other possible categories for cluster 30:

Discourse marker: Information structuring (digress)

 


Cluster 31
IDEnglishSpanishFrenchGermanCatalan
74
if applicable
if appropriate
where applicable
where appropriate

en su caso
si procede
y en su caso

cas échéant
medicaments non
ou des dechets provenant

Erforderlichenfalls
Eventuell
Nötigenfalls
bei Bedarf
falls vorhanden
gegebenenfalls
gegebenenffalls
sofern anwendbar
sofern vorhanden
sofern zutreffend
soweit zutreffend
wenn ja
wenn überhaupt
zutreffend in ihrem Fall

en el seu cas
si cal
si escau
si és necessari



Category: Discourse marker: Reformulation (rectification)


1 clusters
 


Cluster 32
IDEnglishSpanishFrenchGermanCatalan
48
an end in itself
but rather
in its place
instead
instead of
on the contrary
or rather
per se
rather
rather than

a cambio
al contrario
antes bien
en lugar
en lugar de ello
en lugar de eso
en su lugar
en vez
en vez de eso
mejor dicho
más bien
sino más bien
todo lo contrario

au contraire
au lieu
au lieu de cela
en soi
mais plutôt
plutôt
plutôt que
à la place

Statt
anstatt
eher
genauer gesagt
im Gegenteil
sondern darum
statt dessen
stattdessen

a canvi
al contrari
ans al contrari
ben al contrari
contràriament
en comptes d'això
en lloc d'això
més aviat
més ben dit
o el que és el mateix
o millor dit
pel contrari
tot el contrari
 Other possible categories for cluster 32:

Discourse marker: Connector (contrastive)




Category: Discourse marker: Reformulation (summarization)


3 clusters
 


Cluster 33
IDEnglishSpanishFrenchGermanCatalan
16
as a last resort
in a few words
in a word
in brief
in short
in sum
in summary
in the end
on balance
sum up
to sum up
to summarise
ultimately
upon the whole

de forma resumida
en definitiva
en fin
en forma sumaria o
en pocas palabras
en resolución
en resumen
en resumidas cuentas
en una palabra
en última instancia
en último término
forma sumaria o agregada

en bref
en définitive
en fin de compte
en résumé
en somme
en été
finalement
forme résumée
forme résumée ou agrégée
ou agrégée

kurz gefasst
kurz gesagt
kurzum
letzten Endes
letztendlich
letztlich
zusammenfassend
 


Cluster 34
IDEnglishSpanishFrenchGermanCatalan
25
after all
at last
at some point
at some time
at the end
brief
but after all
eventually
in a few words
in a word
in brief
in short
in sum
in summary
in summer
in the end
in the summer
on balance
sooner or later
sum up
to sum up
to summarise
ultimately
upon the whole

a fin de cuentas
a la larga
al final
así pues
de forma resumida
después de todo
en algún momento
en definitiva
en fin
en pocas palabras
en resolución
en resumen
en resumidas cuentas
en suma
en una palabra
en última instancia
en último término
eventualmente
tarde o temprano

après tout
au bout du compte
au final
bref
en bref
en définitive
en fin de compte
en résumé
en somme
en été
enfin
finalement
forme résumée
forme résumée ou agrégée
ou agrégée

Jedenfalls
am Ende
erweitert
kurz gefasst
kurz gesagt
kurzum
letzten Endes
letztendlich
letztlich
schließlich

a la llarga
al cap i a la fi
al capdavall
després de tot
en algun moment
en fi
en poques paraules
en una paraula
en última instància
eventualment
fins ara
fins avui
fins fa poc
tard o d'hora
 Other possible categories for cluster 34:

Others: Modality (alethic)
Others: Temporal expressions (without deixis)

 


Cluster 35
IDEnglishSpanishFrenchGermanCatalan
55
after all
and finally
and lastly
last but not least

no por ello menos importante
pero no menos importante
y finalmente
y por último

de
et enfin
et finalement
finalement
last but not least
mais non des moindres

drittens und letztens
last but not least
nicht zuletzt
schließlich
und schließlich
zu guter Letzt

en conclusió
en resum
finalment
i per acabar
i per últim
per acabar
per concloure
per últim



Category: Discourse marker: Reinforcement


3 clusters
 


Cluster 36
IDEnglishSpanishFrenchGermanCatalan
27
actually
and indeed
as a matter of fact
but then
by definition
de facto
effective
effectively
for that matter
if yes
in effect
in fact
in practice
in reality
in truth
indeed
not further
on the contrary
precisely
quite simply
quite the contrary
really
the correct
the right thing
to tell the truth
truly
what does this
which means

a decir verdad
así que
con eficacia
curiosamente
de forma efectiva
de hecho
de verdad
definitivamente
efectivamente
en efecto
en la práctica
en realidad
en serio
en verdad
francamente
pero en realidad
pero entonces
por definición
precisamente
realmente
simplemente
y de hecho

bien au contraire
certes
concrètement
c’est précisément
dans la pratique
dans les faits
de fait
effectivement
efficacement
efficacement les
en effet
en faisant cela
en fait
en pratique
en réalité
en termes effectifs
en vérité
fait
justement
là encore
mais en réalité
par définition
plus efficacement
précisément
réellement
si oui
tout simplement
très simplement
vraiment

de facto
definitionsgemäß
effektiv
eigentlich
eigentlich
es geht darum
ganz im Gegenteil
genau genommen
gerade weil
in Wahrheit
in Wirklichkeit
in der Tat
per definitionem
richtig
sogar
tatsächlich
um sicher zu gehen
um zu überprüfen
und zwar
wahrhaft
wahrlich
was bedeutet
wirklich
wirksam

curiosament
de debò
de fet
de veritat
en efecte
en realitat
en veritat
i de fet
la veritat
més ben dit
o millor dit
 Other possible categories for cluster 36:

Others: Modality (veridictory)
Others: Unclassifiable

 


Cluster 37
IDEnglishSpanishFrenchGermanCatalan
37
above all
at a time of
at a time when
but above all
environment
especially
first and foremost
first of all
for the most part
foremost
in a time
in an era
in certain countries
in large part
in particular
in some countries
in the first place
in the latter case
including
inter alia
more specifically
most of all
notably
particularly

ante todo
antes que nada
en especial
en primer lugar
en segundo lugar
en su mayor parte
especialmente
más concretamente
más en concreto
más específicamente
más que nada
particularmente
por encima de todo
sobre todo

avant tout
dans ce dernier cas
dans certains pays
dessus tout
en grande partie
en particulier
en premier lieu
environnement
et surtout
les entreprises
mais surtout
notamment
par dessus tout
particulièrement
plus concrètement
plus particulièrement
plus précisément
plus spécifiquement
pour la plupart
surtout
tout d’abord

also zunächst
also zunächst einmal
am allermeisten
besonders
die Notwendigkeit
genauer gesagt
hauptsächlich
in erster Linie
insbesondere
insbesondere dann
nicht zuletzt
und vor allem
vor allem
wenn es darum geht
wenn man bedenkt
wichtig
wichtig ist
zuallererst
zunächst

concretament
i sobretot
més concretament
per sobre de tot
 Other possible categories for cluster 37:

Others: Modality (valorative)

 


Cluster 38
IDEnglishSpanishFrenchGermanCatalan
64
above all
basically
essentially
foremost
in essence
in substance
primarily

básicamente
en esencia
esencialmente
fundamentalmente
principalmente

en gros
en substance
essentiellement
fondamentalement
principalement

eigentlich
grundlegend
grundsätzlich
hauptsächlich
im Grunde
im Grunde genommen
im Prinzip
im Wesentlichen
in erster Linie
praktisch
primär
prinzipiell
quasi
so ziemlich
vor allem

bàsicament
fonamentalment



Category: Others: Conversational


1 clusters
 


Cluster 39
IDEnglishSpanishFrenchGermanCatalan
83
as you can see
as you know
believe me
come on
excuse me
forgive me
please
thank you

bien
como usted sabe
creedme
créame
gracias
muchas gracias
perdonadme
perdóname
perdóneme
por favor
¡oh
¿por qué?

comme vous le savez
comme vous le voyez
comme vous pouvez le constater
comme vous pouvez voir
comme vous savez
excusez
je vous remercie
me pardonnera
merci
merci beaucoup

Entschuldigung
danke
danke Ihnen
entschuldigen Sie
glaube mir
hier können Sie sehen
komm schon
vergib mir
verzeih mir
verzeihen Sie mir
vielen Dank
wenn Sie wissen
wie Sie sehen
wie man sieht

em sap greu
gràcies a déu
moltes gràcies
perdona
 Other possible categories for cluster 39:

Discourse marker: Conversational
Others: Unclassifiable




Category: Others: Deixis (personal)


1 clusters
 


Cluster 40
IDEnglishSpanishFrenchGermanCatalan
80
as i said
for my part
i believe
i hope
i mean to say
i presume
i suppose
i think
in my opinion
in my view
let us say
like i said

a mi juicio
como digo
como he dicho
como ya he dicho
creo
creo que
desde mi punto de vista
digamos
digo
en mi opinión
espero
me parece
pienso
por mi parte
quiero decir
según creo
supongo
tal como dije
yo creo

comme je le disais
je crois
j’espère
selon mon point de vue
à mon avis
à mon sens

aus meiner Sicht
ich denke
ich freue mich
ich glaube
ich hoffe
meiner Ansicht nach
meiner Meinung nach
wie gesagt
wie ich bereits sagte
wie ich schon sagte

al meu entendre
com dèiem
com ja he dit
crec que
diguem
dit d'una altra manera
em sembla
en altres paraules
no ho crec
vull dir
és a dir
 Other possible categories for cluster 40:

Discourse marker: Reformulation (explanation)
Others: Modality (epistemic)




Category: Others: Deixis (temporal)


8 clusters
 


Cluster 41
IDEnglishSpanishFrenchGermanCatalan
23
in so far as
insofar as
now
so far
thus far
to date
to the extent that
to this day
until now
until recently
until the date
until the moment
unto this day
up to now
up to the date
up to the moment

a la fecha
ahora
hace poco
hasta ahora
hasta el momento
hasta hace poco
hasta la fecha
llegados a este punto

désormais
encore aujourd`hui
encore récemment
jusqu'ici
jusqu'à maintenant
jusqu'à présent
jusqu`à ce jour
jusqu`à présent
jusque récemment
jusqu’à présent
jusqu’à récemment
maintenant
mesure où
à ce jour
à maintenant
à présent

bis auf diesen Tag
bis dahin
bis dato
bis heute
bis jetzt
bis vor kurzem
bisher
bislang
schon
soweit

a hores d'ara
ara bé
ara mateix
ara més que mai
arribats a aquest punt
en aquell moment
en aquest moment
 


Cluster 42
IDEnglishSpanishFrenchGermanCatalan
38
and now
at least for now
at that moment
at the moment
at this moment
at this point in time
for now
for the moment
for the time being
now
right now

ahora mismo
de momento
en este momento
en estos momentos
hoy por hoy
por ahora
por el momento
y ahora

au moment où
en ce moment
en ce moment même
maintenant
moins pour l’instant
pour l'instant
pour le moment

bislang
fürs Erste
genau jetzt
gerade jetzt
im Augenblick
im Moment
in diesem Augenblick
in diesem Moment
jetzt gerade
und jetzt
vorerst
vorläufig

ara com ara
ara per ara
 


Cluster 43
IDEnglishSpanishFrenchGermanCatalan
49
at present
but today
currently
even now
even today
nowadays
these days
today

actualmente
en la actualidad
en nuestros días
esos días
estos días
hoy día
hoy en día
pero hoy

a cette époque
actuellement
aujourd'hui
ces jours
de nos jours
heure actuelle
mais aujourd’hui
même aujourd’hui
même maintenant
nos jours
à ce moment
à l'heure actuelle
à présent

aber heute
aktuell
derzeit
dieser Tage
gegenwärtig
heutzutage
in diesen Tagen
momentan
selbst heute
selbst jetzt
sogar heute
sogar jetzt
zurzeit

en l'actualitat
 


Cluster 44
IDEnglishSpanishFrenchGermanCatalan
85
a few years ago
a year ago
during the last few years
during the last years
five years ago
for some years
four years ago
in recent years
in the last years
one year ago
over the past few years
ten years ago
the last few years
the past few years
three years ago
two years ago
years ago

años atrás
cinco años antes
durante los últimos años
en estos últimos años
en los últimos años
en últimos años
hace algunos años
hace cinco años
hace cuatro años
hace dos años
hace pocos años
hace tres años
hace un año
hace unos años

au cours des dernières années
ces dernières années
depuis quelques années
il y a cinq ans
il y a deux ans
il y a dix ans
il y a quatre ans
il y a trois ans

in den letzten Jahren
in den vergangenen Jahren
vor Jahren
vor drei Jahren
vor ein paar
vor ein paar Jahren
vor einem Jahr
vor einigen Jahren
vor etwa drei Jahren
vor etwa einem Jahr
vor fünf Jahren
vor ungefähr einem Jahr
vor vielen Jahren
vor vier jahren
vor zehn Jahren
vor zwei Jahren

en els darrers anys
en els últims anys
fa un any
fa uns anys
 


Cluster 45
IDEnglishSpanishFrenchGermanCatalan
92
more recently
most recently

más recientemente
recientemente

dernièrement
plus récemment
tout dernièrement

erst vor kurzem
in jüngster Zeit
in letzter Zeit
jüngst
kürzlich
neu
neuerdings
neulich
seit kurzem
unlängst
vor kurzem
zuletzt

darrerament
últimament
 


Cluster 46
IDEnglishSpanishFrenchGermanCatalan
93
from now on
in a short time
in the coming years
in the future
in the years ahead

de ahora en adelante
en adelante
en el futuro
en los próximos años
en poco tiempo

dans le futur
dorénavant
à partir de maintenant

ab jetzt
von jetzt an
von nun an

endavant
més endavant
 Other possible categories for cluster 46:

Others: Temporal expressions (without deixis)

 


Cluster 47
IDEnglishSpanishFrenchGermanCatalan
98
in the past

dans le passé
traditionnellement

früher
in der Vergangenheit
 


Cluster 48
IDEnglishSpanishFrenchGermanCatalan
100
in recent months
over the last few decades

en las últimas décadas
en los últimos meses

in den letzten Jahrzehnten
in den letzten Monaten



Category: Others: Modality (epistemic)


4 clusters
 


Cluster 49
IDEnglishSpanishFrenchGermanCatalan
1
clearly
evidently
it goes without saying
it is clear
it is difficult to
it is obvious
more dominant
naturally
obviously
of course
taken for granted

claramente
claro
claro está
como es lógico
con claridad
de forma natural
de manera natural
evidentemente
lógicamente
naturalmente
obviamente
pero claro
por supuesto
y por supuesto

bien entendu
bien sûr
bien évidemment
clairement
de toute évidence
manifestement
naturellement
tout naturellement
évidemment

Scheinbar
anscheinend
augenscheinlich
eindeutig
einleuchtend
ersichtlich
es ist klar
es ist offensichtlich
es ist schwierig
es versteht sich von selbst
ganz klar
gewiss
klar
naturgemäß
natürlich
offenbar
offenkundig
offensichtlich
selbstredend
selbstverständlich
sicherlich
sichtbar
unverkennbar
wie natürlich
zweifellos
zweifelsohne

clarament
com es pot veure
es clar
i per descomptat
per descomptat
per suposat
és clar
òbviament
 Other possible categories for cluster 49:

Discourse marker: Connector (addition)
Others: Modality (veridictory)

 


Cluster 50
IDEnglishSpanishFrenchGermanCatalan
54
at least in theory
in theory
theoretically
to all appearance

al menos en teoría
al parecer
en teoría
según parece
supuestamente
teóricamente

en théorie
moins en théorie
peut théoriquement
théoriquement

in der Theorie
theoretisch

suposadament
 


Cluster 51
IDEnglishSpanishFrenchGermanCatalan
67
can be
maybe
might
perhaps

quizá
quizás
tal vez

peut
peut être
peut-être
être que

Möglicherweise
vielleicht
wahrscheinlich
 


Cluster 52
IDEnglishSpanishFrenchGermanCatalan
81
as they say
for some
from this perspective
from this point of view
in their opinion
in their view

a su juicio
aparentemente
como dicen
como suele decirse
desde este punto de vista
desde su punto de vista
en su opinión
lentamente
para algunos
para ellos
poco a poco
presumiblemente
según dicen
según ellas
según se dice

aus ihrer Sicht
deren Meinungnach
dieser Auffassung
ihrer Ansicht nach
ihrer Auffassung nach
ihrer Meinung nach
nach ihrer Auffassung
nach ihrer Meinung
wie man sagt
wie man so sagt

aparentment
de mica en mica
poc a poc
 Other possible categories for cluster 52:

Discourse marker: Information structuring (comment)
Others: Expressions of manner




Category: Others: Modality (valorative)


2 clusters
 


Cluster 53
IDEnglishSpanishFrenchGermanCatalan
60
fortunately
luckily
thank god
thank goodness
thank heaven
thankfully

afortunadamente
por fortuna
por suerte

fort heureusement
heureusement
mais heureusement
par bonheur
par chance

Gott sei Dank
erfreulicherweise
glücklicherweise
zum Glück

afortunadament
per sort
 


Cluster 54
IDEnglishSpanishFrenchGermanCatalan
63
alas
regrettably
sadly
unfortunately

con tristeza
desafortunadamente
desgraciadamente
lamentablemente
por desgracia
por todo esto
tristemente

hélas
mais malheureusement
malheureusement
malheureusement pas
tristement

bedauerlicherweise
leider
traurigerweise
unglücklicherweise

desafortunadament
lamentablement
malauradament
per desgràcia
per tot això
per tot plegat



Category: Others: Spatial expressions (without deixis)


1 clusters
 


Cluster 55
IDEnglishSpanishFrenchGermanCatalan
76
all over the world
around the world
as far as possible
at global level
at world level
from around the world
global
globally
if possible
in the world
on a global scale
on a worldwide basis
the whole world
throughout the world
to the extent possible
when possible
where possible

a escala mundial
a nivel mundial
cuando sea posible
en lo posible
en todo el mundo
globalmente

au monde entier
dans la mesure du possible
dans le monde
dans le monde entier
doit être apprécié globalement
du monde entier
globalement
monde entier
partout dans le monde
si possible

aus aller Welt
global
nach Möglichkeit von
sofern möglich
soweit möglich
weltumspannend
weltweit
überall auf der Welt

a nivell mundial
a tot arreu
arreu del món
 Other possible categories for cluster 55:

Discourse marker: Reformulation (dismissal)
Others: Modality (alethic)




Category: Others: Temporal expressions (without deixis)


12 clusters
 


Cluster 56
IDEnglishSpanishFrenchGermanCatalan
40
from the beginning
from the beginning of
from the outset
from the start
from the very beginning
right from the start

desde el principio
desde un principio

au commencement
depuis le début
dès le début
dès le départ
emblée
à partir du début

von Anfang an
von Beginn an
 


Cluster 57
IDEnglishSpanishFrenchGermanCatalan
44
all this time
at that time
in the interim
in the meantime
in the meanwhile
in those days
meanwhile

entre tanto
entretanto
mientras tanto

ce temps
en attendant
entre temps
entre-temps
pendant ce temps

derweil
in der Zwischenzeit
unterdessen
währenddessen
zwischenzeitlich
 


Cluster 58
IDEnglishSpanishFrenchGermanCatalan
46
always
as always
as ever
as usual
but now
but which
but who
by that time
each time
every time
more often than not
not always
still
still worse
when possible
whenever possible
where possible
wherever possible

aún
como de costumbre
como siempre
cuando sea posible
de cualquier manera
idealmente
más aún
para entonces
peor aún
pero ahora
siempre
siempre que sea posible
todavía

a présent
chaque fois que cela est possible
chaque fois que possible
comme d’habitude
comme toujours
encore
mais qui
pas toujours
plus souvent
toujours
toujours été

immer
immer noch
jedesmal
noch
noch immer
viel öfter
wann immer möglich
wie gewohnt
wie gewöhnlich
wie immer
wie üblich

com sempre
com és habitual
encara pitjor
més encara
 Other possible categories for cluster 58:

Discourse marker: Reformulation (dismissal)
Others: Deixis (temporal)
Others: Modality (epistemic)

 


Cluster 59
IDEnglishSpanishFrenchGermanCatalan
52
at moments
at times
from time to time
in that situation
in this situation
occasionally
often
once in a while
sometimes
this time around
very often

a menudo
a veces
algunas veces
cada cierto tiempo
con frecuencia
de cuando en cuando
de forma ocasional
de vez en cuando
en ocasiones
ocasionalmente
por momentos
vez en cuando

cette fois-ci
dans cette situation
de temps en temps
de temps à autre
neige parfois
occasionnellement
par moments
parfois
quelquefois
temps en temps
temps à autre
très souvent

gelegentlich
manchmal
teils heftiger
von Zeit zu Zeit
zeitweise

a vegades
amb freqüència
de tant en tant
de vegades
durant un temps
moltes vegades
 


Cluster 60
IDEnglishSpanishFrenchGermanCatalan
53
at the beginning
at the beginning of
fresh start
in principle
initially
new beginning
originally

al comienzo
al principio
en principio
en un primer momento
en un principio
inicialmente
originalmente

au début
au départ
dans un premier temps
initialement
originellement

anfangs
anfänglich
ursprünglich
zunächst

al començament
en principi
en un primer moment
en un principi
 


Cluster 61
IDEnglishSpanishFrenchGermanCatalan
69
at that moment
at that period
at that point
at that time
at the time
at this moment
at this point
back then
just then

en aquel entonces
en aquel momento
en aquella época
en ese momento
en ese punto
en ese tiempo
en su momento

ce stade
dans ce temps
en ce temps
à ce moment-là
à cette époque

Früher
an diesem Punkt
damals
zu diesem Zeitpunkt
zu dieser Zeit

ara bé
ara mateix
arribats a aquest punt
en aquell moment
en aquells moments
en aquest moment
 


Cluster 62
IDEnglishSpanishFrenchGermanCatalan
89
a year later
one year later
ten years later
two years later

diez años después
dos años después
dos años más tarde
un año después

deux ans après
deux ans plus tard
dix ans après
dix ans plus tard
une année plus

ein Jahr später
zehn Jahre später
zwei Jahre später

cinc anys després
dos anys després
dos anys més tard
un any després
uns anys més tard
 


Cluster 63
IDEnglishSpanishFrenchGermanCatalan
90
once upon a time

il était une fois

es war einmal
 


Cluster 64
IDEnglishSpanishFrenchGermanCatalan
91
for decades
for many years
for years
over many years

desde hace muchos años
durante años
durante décadas
durante muchos años
por décadas
por muchos años

de nombreuses années
depuis de longues années
depuis des décennies
des décennies
pendant des décennies

für Jahrzehnte
für viele Jahre
jahrzehntelang
seit Jahrzehnten
seit vielen Jahren
über Jahrzehnte

durant anys
durant molts anys
 


Cluster 65
IDEnglishSpanishFrenchGermanCatalan
94
have since
since that time
since then

a partir de entonces
desde entonces
desde ese momento

depuis lors

danach
inzwischen
mittlerweile
seit damals
seit dem
seit diesem Zeitpunkt
seit dieser Zeit
seitdem
seither
von da an
von damals

aleshores
des d'aleshores
des d'aquell moment
fins llavors
i llavors
llavors
 


Cluster 66
IDEnglishSpanishFrenchGermanCatalan
95
during the same period
during this period
during this time
in the same period
over the same period

durante el mismo período
durante este período
durante este tiempo
en el mismo período

Innerhalb dieses Zeitraums
während dieser Periode

durant aquest període
durant aquest temps
durant molt de temps
 


Cluster 67
IDEnglishSpanishFrenchGermanCatalan
99
once again

encore une fois
une fois de plus
une fois encore

abermals
einmal
erneut
mehr
noch einmal
nochmal
nochmals
wieder
wieder einmal
wieder mal
wiederum

altra vegada
i una altra
novament



Category: Others: Unclassifiable


4 clusters
 


Cluster 68
IDEnglishSpanishFrenchGermanCatalan
39
as appropriate
as far as possible
as it is
as may be necessary
as such
if applicable
if necessary
if needed
if possible
to the consumer a
to the extent possible
when necessary
where applicable
where appropriate
where necessary
where possible
where relevant
whereas
while
while the

como tal
como tales
considerando
cuando proceda
cuando sea necesario
de ser necesario
en caso necesario
en la medida de lo posible
en lo posible
en su caso
llegado el caso
mientras
según corresponda
según proceda
si es necesario
si es posible
si es preciso
si fuera necesario
si fuese necesario

alors que
au besoin
cas échéant
ce qui suit
comme il est
considérant ce qui suit
en tant que tel
en tant que telle
le cas échéant
lorsque nécessaire
pour y remédier
selon qu`il est
si besoin
si besoin est
si nécessaire
tandis que
éventuellement

als solche
bei Bedarf
bei Bedarf entsprechend
erforderlichenfalls
es ist notwendig
falls erforderlich
falls notwendig
falls nötig
gegebenenfalls
gegebenenfalls auch
je nach Bedarf
nötigenfalls
soweit anwendbar
soweit möglich
wenn möglich
wenn notwendig
wenn nötig

en el seu cas
si cal
si escau
si és necessari
 Other possible categories for cluster 68:

Discourse marker: Reformulation (dismissal)
Others: Modality (alethic)

 


Cluster 69
IDEnglishSpanishFrenchGermanCatalan
71
in such circumstances
in these circumstances
in those circumstances
under such circumstances
under these circumstances
under these conditions

en esas circunstancias
en estas circunstancias
en tales circunstancias

dans ces circonstances
dans ces conditions
dans telles circonstances
telles circonstances

unter derartigen Umständen
unter diesen Umständen
unter solchen Umständen
 


Cluster 70
IDEnglishSpanishFrenchGermanCatalan
96
so forth
so on
so on and so

et ainsi de suite

so fort
so ähnliches
und so weiter

i tot això
tot això
 


Cluster 71
IDEnglishSpanishFrenchGermanCatalan
97
or at least

tout au moins

al menys


3. Documentation

(Only partially developed)



This section contains the following items:
  1. + A synopsis of the project
  2. + People involved
  3. + Publications and theses derived from the project


3.1 Synopsis of the project

Project Fondecyt Regular 1191481, with title 'Automatic induction of taxonomies of discourse markers from multilingual corpora', is funded by Anid.cl and directed by Rogelio Nazar. It consists of a lexicographic research project aimed at cataloging discourse markers (DMs) by means of statistical analysis of large parallel corpora. It is based on a newly developed algorithm for the automatic induction of a multilingual taxonomy of DMs, which is then used to recursively identify and classify more units. The project started in April 2019 and is scheduled to finish in April 2022, but some preliminary results are already available, including a classifier of DMs and a first version of a multilingual taxonomy of discourse markers in English, Spanish, French, German and Catalan.

Discourse markers (DMs) have been in the spotlight of linguistic theory in recent years, with an increasing number of publications devoted on the subject (e.g. Casado Velarde, 1993; Fraser, 1999; Martín Zorraquino & Portolés, 1999; Pons Bordería, 2001; Fischer, 2006; Borreguero & López, 2010). Early interest on the subject began to appear in the context of discourse analysis (Halliday & Hasan, 1976; van Dijk, 1978; Halliday, 1985), where DMs were defined as particles that facilitate the interpretation of coherence relations in texts. In other words, they are instructions on how to connect propositions and organize argumentation. They are, therefore, procedural rather than conceptual or lexical. They can pertain to different categories, such as conjunctions, adverbs, prepositional phrases, idioms, and so on. The way to classify DMs is according to their functions. Some of the most common are counter-argumentation, with expressions such as however or nevertheless, cause-consequence, such as consequently or therefore, and so on. A well-known taxonomy is the one by Martín Zorraquino & Portolés (1999), but there are others. Fewer are the attempts to compile extended lists of DMs. Some dictionaries have appeared (e.g. Santos Río, 2003; Briz, 2008). The main difference between our present research and these attempts is that ours is an empirical method, i.e., a bottom-up rather than a top-down approach. This is important for practical reasons, as the automation saves a lot of effort, buy also, and most importantly, for scientific reasons, as the quantitative method favors objectivity.

The method applied in this project is purely statistical, i.e. without any type of external resource apart from a corpus, not even POS-taggers. It is a minimalistic approach based on parallel corpora, in this case Tiedemann's (2012) Opus Corpus, based on co-occurrence association measures and an entropy model. DMs are identified according to their distribution in the corpus, and their characteristic pattern is that they are independent of the content of the text. In operational terms, this means that their occurrence cannot be used to predict the occurrence of other lexical units. They are then classified according to a novel clustering algorithm. The similarity measure used for the clustering is their shared equivalence in the parallel corpus (i.e., nevertheless and however are considered similar because they share the same equivalences in a second language). Then, the result of the clustering of the different languages is aligned to obtain a multilingual taxonomy. Once a basic taxonomy is built this way, it is then used to classify new DMs in a recursive manner. The algorithm will first classify a DM candidate by language, will then decide if it is effectively a DM and, if this is the case, it will assign a category to it.

References
Borreguero, M., López, A. (2010). Marcadores del discurso: de la descripción a la definición. Vol 45. Iberoamericana.
Briz, A., Pons, S. & Portolés, J. (Coords.) (2008). Diccionario de partículas discursivas del español. [online] http://www.dpde.es
Casado Velarde, M. (1993). Introducción a la gramática del texto del español. Madrid: Arco libros.
Fischer, K. (Ed.). (2006). Approaches to discourse particles. Amsterdam: Elsevier.
Fraser, B. (1999). What are discourse markers? Journal of Pragmatics, 31: 931-952.
Gili Gaya, S. (1943). Curso superior de sintaxis española. Mexico: Minerva.
Halliday, M.A. & Hasan, R. (1976). Cohesion in English. London: Longman.
Halliday, M.A.K. (1985). An introduction to functional grammar. London: Arnold.
Martín Zorraquino, M. A., & Portolés, J. (1999). Los marcadores del discurso. In I. Bosque & V. Demonte (Eds.), Gramática
Descriptiva de la Lengua Española (pp. 4051-4214). Madrid: Espasa.
Montolío, E. (2001). Conectores de la lengua escrita. Contraargumentativos, consecutivos, aditivos y organizadores de la información. Barcelona: Ariel.
Pons Bordería, S. (2001). Connectives/Discourse markers. An Overview. Quaderns de Filologia. Estudis Literaris. 6:219-243.
Santos Río, L. (2003). Diccionario de partículas. Salamanca: Luso-española de ediciones.
Tiedemann, J. (2012). Parallel data, tools and interfaces in OPUS. European Language Resources Association (ELRA).

3.2 People involved


Lead researcher :
Rogelio Nazar

Co-researchers :
Irene Renau
David Lindemann

Research assistants:
Nicolás Acosta
Andrea Alcaíno
Patricio Arriagada
Scarlette Gatica
Ricardo Martínez
Natalie Mies
Maureen Noble
Valentina Ravest
Diego Sánchez
Jana Strohbach

Students who have finished or are working on their thesis with scholarships from this project:

PhD Thesis:

Hernán Robledo Nakagawa (2021). Categorización de los marcadores del discurso del español: una propuesta inductiva guiada por corpus paralelo.

Undergraduate theses:

Camila Alvarado Barbosa (2020). Detección de marcadores discursivos: el caso de los conectores causal-consecutivos y su polifuncionalidad.

Sara Asenjo Sotelo (2019). Estudio descriptivo del uso de marcadores discursivos en niños de 7 años con trastorno específico del lenguaje.

José Bahamonde Cano (2019). La terminología médica en la traducción audiovisual: análisis de la terminología médica en subtítulos profesionales y fansub de textos audiovisuales no especializados.

Paolo Caballería Rodríguez (2019). Modelo algorítmico para el reconocimiento automático de referentes y la resolución de anáfora pronominal en textos en español.

Yerko Leiva (2019). Análisis de modalizadores en el discurso de revistas psiquiátricas chilenas y españolas.

Belén Guerrero Carreño (2020). Análisis contrastivo del uso de préstamos simples en las variantes chilena y peninsular del castellano.

3.3 Publications derived from the project


Nazar, R. (2021). 'Inducción automática de una taxonomía multilingüe de marcadores discursivos: primeros resultados en castellano, inglés, francés, alemán y catalán'. Procesamiento del Lenguaje Natural, núm 67, pp. 127-138.


Nazar, R. (2021). 'Automatic induction of a multilingual taxonomy of discourse markers'. Iztok Kosem et al. (eds.) Electronic lexicography in the 21st century: post-editing lexicography. Lexical Computing CZ s.r.o., Brno, pages 440-454.


Nazar, R.; Balvet, A.; Ferraro, G.; Marín, R.; Renau, I. (2020). 'Pruning and repopulating a lexical taxonomy: experiments in Spanish, English and French'. Journal of Intelligent Systems, vol. 30 num. 1, pp. 376-394.


Nazar, R.; Renau, I., Acosta, N., Robledo, H., Soliman, H., Zamora, S. (2020). 'Corpus-Based Methods for Recognizing the Gender of Anthroponyms'. Names: A Journal of Onomastics
.


Asenjo, S.; Nazar, R. (2020). 'Marcadores discursivos en niños de 7 años con trastorno específico del lenguaje: estudio descriptivo'. RLA. Revista de lingüística teórica y aplicada, vol. 58 núm 1, pp. 93-114.


Nazar, R.; Galdames, A. (2019). 'Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas'. Revista Linguamatica, vol. 11, núm. 2, pp. 17-32.


Nazar, R. (2019). 'El análisis cuantitativo de la coocurrencia léxica en la lexicografía especializada'. In Sanmartín Sáez, Julia y Quilis Merín, Mercedes (eds.). Retos y avances en lexicografía: los diccionarios del español en el eje de la variación lingüística. Anejo 10 de Normas., Anejo 10 de Normas. Valencia: Asociación Española de Estudios Lexicográficos.


Robledo, H.; Nazar, R. (2018). 'Una clasificación automatizada de marcadores discursivos'. Procesamiento del Lenguaje Natural, n. 61, pp 109-116.


Home