'african page', 'corpora' in Metaglossia: The Translation World

Tags
Current selected tags: 'african page', 'corpora'. Clear

African language corpora

There are over two thousand African languages, spoken (in situ) by 15% of the world's population. In density of linguistic diversity it is rivaled only by New Guinea (which probably exceeds it to b...

From corplinguistics.wordpress.com - February 8, 2012 10:01 PM

Scoop.it!

Reactions (4)

No comment yet.

Lexiques d’Afrique corpus de référence, études quantitatives

Le projet RefLex a pour but de tester un ensemble d’hypothèses fondamentales sur la structure et l’évolution des langues d’Afrique qui sont souvent répétées dans la littérature, mais dont la validité n’a jamais pu être démontrée de façon concrète. Ces hypothèses ont en commun qu’elles ne peuvent être testées que par une approche quantitative, qui quant à elle suppose l’existence d’une documentation assez complète. Les quelque 2200 langues africaines offrent une grande diversité typologique, avec cependant quelques caractères particuliers qui transcendent les familles linguistiques comme les zones géographiques, et ceci pour chaque niveau d'analyse. Ces caractères – on peut citer comme exemples les pronoms logophoriques où l'articulation labiovélaire – n'ont jamais pu faire l'objet d'études systématiques en raison principalement du manque de données accessibles pour la majorité des langues africaines. RefLex résout ce problème grâce à l’exploitation systématique de la documentation lexicale existante qui est en fait beaucoup plus importante que la documentation grammaticale et malgré cela souvent ignorée dans les études typologiques. L’un des buts de RefLex est de rendre accessible aux chercheurs intéressés la documentation dispersée et difficile d'accès. En effet, le corpus lexical des langues africaines qui sera accessible en ligne à l’ensemble de la communauté scientifique au terme du projet fournira un accès immédiat à un volume de données considérable (au moins 2 millions d'entrées lexicales à l'issue du projet, pour plus de 1000 langues). Cette documentation permettra des avancées spectaculaires dans divers domaines : typologie, phylogénie, sémantique lexicale, diffusion lexicale, linguistique aréale. Il s'agira de la plus grosse base de données comparative en ligne au monde.

From www.agence-nationale-recherche.fr - January 11, 2012 1:48 AM

Scoop.it!

Reactions (4)

No comment yet.