Enbounesi la vitalitai limérique é pi la veyablletai daus parlanjhes de France :
descripciuns lenghistiques é corpus annoutais

ANR logo
ANR-21-CE27-0004

Enbounesi la vitalitai limérique é pi la veyablletai daus parlanjhes de France : <br>
descripciuns lenghistiques é corpus annoutais

Déscripciun

Chéte entrprise vedrét revilàe é avuràe mae que d’in parlanjhe de noute péyis : l’élzacén, le corsiquén, l’occitan, le poetevin-séntunjhaes. A se pllace a la croesàie de la lenghistique de déscripciun é de la lenghistique de corpus. Le principàu ét d’alàe jusqu’arive a avoer d’aruajhe daus tesces tots itàus é marquais avéc mae que d’ine entende :

  • Bati daus pilots de tésces a cha lengue den daus jhénres a rac le parlanjhe coume daus tiatres, daus tésces su la vie daus mundes é daus tésces tranlatàis ;
  • Annoutàe daus corpus den le sens daus « Universal Dependencies » ;
  • Nori daus déscripciuns cunpllétes d’aneut é daus frmalisaciuns lenghistiques naessues de çhés pilots de tésces ;
  • Assaventàe la parçounerie dau TAL (Traitement Automatique des Langues) a l’adrigall daus probllémes daus lengues nun normalisàies é le besoén de segàe l’idàie de variances den lés téchniques de TAL ;
  • Échunjhàe é viràe lés éprouvances é lés aplléts entrmi lés lengues de çhéte entrprise é défruchàe lés façuns de trmétre de pr la téchnolojhie.