Far créisser la VITALitat e la VIsibilitat numerica de las lengas de França :
Descripcions lingüisticas e corpusses anotats

ANR logo
ANR-21-CE27-0004

Far créisser la VITALitat e la VIsibilitat numerica de las lengas de França : <br>
Descripcions lingüisticas e corpusses anotats

Descripcion

Aquel projècte a per amira de far créisser la vitalitat e la visibilitat de mantunas Lengas de França : l’alsacian, lo còrs, l’occitan e lo peitavin-santongés. Se plaça a la crosada de la lingüistica descriptiva e de la lingüistica de còrpus. Sa tòca màger es la constitucion de ressorsas, en particular de còrpus nuds e anotats, amb los objectius seguents :

  • Bastir (i) de còrpus monolingües dins de genres pròches o transcrivent la lenga orala, per exemple de pèças de teatre o d’etnotèxtes narratius, e (ii) de còrpus parallèls (a partir de traduccions) ;
  • Desvolopar de còrpus anotats dins l’encastre de “Universal Dependencies” ;
  • Produire de descripcions complètas e actualizadas e de formalizacions lingüisticas a partir dels còrpus ;
  • Sensibilizar la comunautat del TAL (Tractament Automatic de las Lengas) a las problematicas de las lengas non estandardizadas e a la necessitat de prene en compte la variacion dins los sistèmas de TAL ;
  • Partejar e transferir las experiéncias e las aisinas entre las lengas del projècte e explorar los metòdes de transferiment tecnologic.