Còrpus

Còrpus deu Congrès

Crèdits

Dens l'encastre de la creacion d’apèrs de tractament automatic deu lengatge, Lo Congrès qu’a hargat mantun còrpus entà entrainar sistèmas d'intelligéncia artificiala. En avisà’s qu’aqueths còrpus podèvan tanben interessar lo public, que bastí ua interfàcia entà’us consultar.

Aquera interfàcia que permet recèrcas apregondidas e especificas : filtrar las citacions per varietat, cercar mantua fòrma, espaçada d'un o mantun mot o utilizar expressions regularas.

Lo Congrès que perpausa tanben a la consultacion un còrpus audio. Peu moment, qu’ei compausat peus enregistraments hèits entà bastir la sintèsi vocau en occitan gascon. Que serà lèu enriquit de ressorsas autas, mei que mei los enregistraments de la sintèsi vocau en lengadocian.

Per cada citacion, lo còrpus audio qu’aficha la soa transcripcion en alfabet fonetic internacional e que’n perpausa un enregistrament audio. L’interfàcia que permet de cercar ua frasa a partir de caractèrs ortografics, mas tanben a partir de fonèmas.

Còrpus monolingüe

Lo prumèr còrpus monolingüe deu Congrès qu'estó hargat en partenariat dab Elhuyar, las edicions Reclams e Vistedit. Puish qu'estó enriquit en foncion deus besonhs deus utís deu Congrès.

Còrpus textuau de las edicions Reclams - escòla Gaston Fèbus

Las edicions Reclams - escòla Gaston Fèbus que barrejè au Congrès los exemplars de la revista Reclams deu numèro 778 au numèro 824-825, e tanben òbras literàrias :

Crèdits :

Preformatatge deu còrpus : Elhuyar
Numerizacion : Atelier In8 (Còrpus « Revista »), Eric Gonzalès – Conselhèr lingüistic deu Congrès (còrpus « Edicions »)
Formatatge : Fanny Lartigot (Lo Congrès), Aure Séguier (Lo Congrès)
Remerciaments : Maurici Romieu (President de las edicions Reclams), Sèrgi Javaloyès (dinerèr de las edicions Reclams)
Dab lo sostien de l'Euroregion Aquitània Euskadi

Còrpus textuau La Setmana

Las edicions Vistedit que barrejèn au Congrès los exemplars deu jornal La Setmana deu numèro 597 au numèro 889.

Crèdits :

Preformatatge deu còrpus : Elhuyar
Formatatge : Fanny Lartigot (Lo Congrès), Aure Séguier (Lo Congrès)
Remerciaments : Brigitte Bouncer (anciana gerenta de las edicions Vistedit)

Còrpus textuau Wikipèdia

Au parat de l'enregistrament de la sintèsi vocau en occitan gascon, articles en aquera varietat de l'occitan qu'estón tirats de la Wikipèdia occitana.

Crèdits :

Preformatatge deu còrpus : Eve Séguier
Formatatge : Aure Séguier (Lo Congrès)

Còrpus audio

Au parat de l'enregistrament de la sintèsi vocau en occitan gascon (dens l'encastre deu projècte europèu Linguatec), Lo Congrès que creè un còrpus audio de mantua òra tà entrainar lo logicial. Aqueth còrpus qu'estó hicat a disposicion deu public en l'estat.

Còrpus audio « Sintèsi vocau gascona »

Los enregistraments e las transcripcions foneticas d'aqueth còrpus que servín au desvolopament de la sintèsi vocau en occitan gascon.

Crèdits :
Compilacion : Aure Séguier (Lo Congrès), Michaël Barret (Lo Congrès)
Construccion deu fonetizaire : Aure Séguier (Lo Congrès), Michaël Barret (Lo Congrès)
Votz : Domenja Lekuona
Enregistrament, tractament deus sons : Jean Arbus (Aux Arts et cætera)
Supervision de l'enregistrament : Philippe Boula de Mareüil, Michaël Barret (Lo Congrès)
Expertisa scientifica : Philippe Boula de Mareüil, Nicolas Quint
Descopatge deus sons : Navaprasanna Raj Srinivasan (Lo Congrès), Michaël Barret (Lo Congrès)
Correccion de la fonetica : Michaël Barret (Lo Congrès), Vincenç Gleizes (Lo Congrès)

Interreg Poctefa Linguatec
Lo projècte EPT 227/16 Linguatec qu’estó aprovat en lo segond aperet a projècte POCTEFA dab un budgèt de 1 227 500 € e qu’ei cofinançat a 65% peu Hons Europèu de Desvolopament Regionau (FEDER) peu miei deu Programa Interreg V-A Espanha-França-Andòrra (POCTEFA 2014-2020)

Arcuelh

© Lo Congrès Permanent de la Lenga Occitana, 2018, Tots los drets reservats