African language corpora
There are over two thousand African languages, spoken (in situ) by 15% of the world's population. In density of linguistic diversity it is rivaled only by New Guinea (which probably exceeds it to b...
Get Started for FREE
Sign up with Facebook Sign up with X
I don't have a Facebook or a X account
Your new post is loading...
African language corporaThere are over two thousand African languages, spoken (in situ) by 15% of the world's population. In density of linguistic diversity it is rivaled only by New Guinea (which probably exceeds it to b...
Reactions
(4)
No comment yet.
Sign up to comment
Lexiques d’Afrique corpus de référence, études quantitativesLe projet RefLex a pour but de tester un ensemble d’hypothèses fondamentales sur la structure et l’évolution des langues d’Afrique qui sont souvent répétées dans la littérature, mais dont la validité n’a jamais pu être démontrée de façon concrète. Ces hypothèses ont en commun qu’elles ne peuvent être testées que par une approche quantitative, qui quant à elle suppose l’existence d’une documentation assez complète. Les quelque 2200 langues africaines offrent une grande diversité typologique, avec cependant quelques caractères particuliers qui transcendent les familles linguistiques comme les zones géographiques, et ceci pour chaque niveau d'analyse. Ces caractères – on peut citer comme exemples les pronoms logophoriques où l'articulation labiovélaire – n'ont jamais pu faire l'objet d'études systématiques en raison principalement du manque de données accessibles pour la majorité des langues africaines. RefLex résout ce problème grâce à l’exploitation systématique de la documentation lexicale existante qui est en fait beaucoup plus importante que la documentation grammaticale et malgré cela souvent ignorée dans les études typologiques. L’un des buts de RefLex est de rendre accessible aux chercheurs intéressés la documentation dispersée et difficile d'accès. En effet, le corpus lexical des langues africaines qui sera accessible en ligne à l’ensemble de la communauté scientifique au terme du projet fournira un accès immédiat à un volume de données considérable (au moins 2 millions d'entrées lexicales à l'issue du projet, pour plus de 1000 langues). Cette documentation permettra des avancées spectaculaires dans divers domaines : typologie, phylogénie, sémantique lexicale, diffusion lexicale, linguistique aréale. Il s'agira de la plus grosse base de données comparative en ligne au monde. |