Fà cresce a VITALità è a VIsiblità numerica di e lingue di Francia :
Descrizzione linguistiche è corpora annutati

ANR logo
ANR-21-CE27-0004

Fà cresce a VITALità è a VIsiblità numerica di e lingue di Francia :<br>
Descrizzione linguistiche è corpora annutati

Descrittivu

A primura di issu prugettu hè d’accresce a vitalità è a visibilità di parechje lingue di Francia : l’alsazianu, u corsu, l’occitanu è u poitevin-saintongeais. Si pone à u crucivia di a linguistica descrittiva è di a linguistica di corpora. U so scopu principale hè a custituzione di risorze, in particulare corpora schjetti è annutati, cun parechji scopi :

  • Custruì (i) corpora monolingui in genari simili o trascrivendu a lingua orale, per esempiu pezze di teatru o etnotesti narrativi è (ii) corpora paralleli (à partesi di traduzzione) ;
  • Sviluppà corpora annutati ind’u quatru di l’“Universal Dependencies” ;
  • Pruduce descrizzione sane è attualizate è furmalisazione linguistiche à partesi di corpora ;
  • Sensibilizà a cumunità di u TAL (Trattamenut Automaticu di e Lingue) à e prublematiche di e lingue chì ùn sò standardizate è à a primura di tene contu di variazione ind’i sistemi di u TAL ;
  • Sparte è trasferì e sperienze è l’arnesi trà e lingue di u prugettu è esplurà i metudi di trasferimentu tecnologicu.