Dens l'encastre de la creacion d’apèrs de tractament automatic deu lengatge, Lo Congrès qu’a hargat mantun còrpus entà entrainar sistèmas d'intelligéncia artificiala. En avisà’s qu’aqueths còrpus podèvan tanben interessar lo public, que bastí ua interfàcia entà’us consultar.
Aquera interfàcia que permet recèrcas apregondidas e especificas : filtrar las citacions per varietat, cercar mantua fòrma, espaçada d'un o mantun mot o utilizar expressions regularas.
Lo Congrès que perpausa tanben a la consultacion un còrpus audio. Peu moment, qu’ei compausat peus enregistraments hèits entà bastir la sintèsi vocau en occitan gascon. Que serà lèu enriquit de ressorsas autas, mei que mei los enregistraments de la sintèsi vocau en lengadocian.
Per cada citacion, lo còrpus audio qu’aficha la soa transcripcion en alfabet fonetic internacional e que’n perpausa un enregistrament audio. L’interfàcia que permet de cercar ua frasa a partir de caractèrs ortografics, mas tanben a partir de fonèmas.
Lo prumèr còrpus monolingüe deu Congrès qu'estó hargat en partenariat dab Elhuyar, las edicions Reclams e Vistedit. Puish qu'estó enriquit en foncion deus besonhs deus utís deu Congrès.
Las edicions Reclams - escòla Gaston Fèbus que barrejè au Congrès los exemplars de la revista Reclams deu numèro 778 au numèro 824-825, e tanben òbras literàrias :
Preformatatge deu còrpus : Elhuyar
Numerizacion : Atelier In8 (Còrpus « Revista »), Eric Gonzalès – Conselhèr lingüistic deu Congrès (còrpus « Edicions »)
Formatatge : Fanny Lartigot (Lo Congrès), Aure Séguier (Lo Congrès)
Remerciaments : Maurici Romieu (President de las edicions Reclams), Sèrgi Javaloyès (dinerèr de las edicions Reclams)
Dab lo sostien de l'Euroregion Aquitània Euskadi
Las edicions Vistedit que barrejèn au Congrès los exemplars deu jornal La Setmana deu numèro 597 au numèro 889.
Preformatatge deu còrpus : Elhuyar
Formatatge : Fanny Lartigot (Lo Congrès), Aure Séguier (Lo Congrès)
Remerciaments : Brigitte Bouncer (anciana gerenta de las edicions Vistedit)
Au parat de l'enregistrament de la sintèsi vocau en occitan gascon, articles en aquera varietat de l'occitan qu'estón tirats de la Wikipèdia occitana.
Preformatatge deu còrpus : Eve Séguier
Formatatge : Aure Séguier (Lo Congrès)
Au parat de l'enregistrament de la sintèsi vocau en occitan gascon (dens l'encastre deu projècte europèu Linguatec), Lo Congrès que creè un còrpus audio de mantua òra tà entrainar lo logicial. Aqueth còrpus qu'estó hicat a disposicion deu public en l'estat.
Los enregistraments e las transcripcions foneticas d'aqueth còrpus que servín au desvolopament de la sintèsi vocau en occitan gascon.
Interreg Poctefa Linguatec
Lo projècte EPT 227/16 Linguatec qu’estó aprovat en lo segond aperet a projècte POCTEFA e qu’ei cofinançat a 65% peu Hons Europèu de Desvolopament Regionau (FEDER) peu miei deu Programa Interreg V-A Espanha-França-Andòrra (POCTEFA 2014-2020)
Lingua Libre qu'ei un projècte de l'associacion Wikimedia France qui a per prètzhèit de bastir un còrpus multilingüe audiovisuau collaboratiu dab ua licéncia liura. Lo Congrès que i a enregistrat los mots deu son diccionari Basic.
Enregistraments : Davidgrosclaude (David Grosclaude, Lo Congrès), Dubreuil JJ, Matulh, mfd64, Ocwiki97, Vicentico, Yep
Compilacion e formatatge : Aure Séguier (Lo Congrès)
Desvolopament de l'utís : Wikimedia France
Dens l'encastre deu son utís en linha express'Òc, lo Congrès qu'a enregistrat expressions occitanas en mantua varietat. Que n'a tanben importadas de l'utís Lingua Libre.
Enregistraments : Joan-Breç Brana, Gilles Carbou, Ricard Català, Cecília Chapduelh, Amy Cros, Dubreuil JJ, Jan-Luc Landi, Marthe Laulhé, Domenja Lekuona, Annia Maffre, Ocwiki97, Vicentico
Compilacion e formatatge : Aure Séguier (Lo Congrès)
© Lo Congrès Permanent de la Lenga Occitana, 2018, Tots los drets reservats