Share
Institution: CNRS, France
France
Retrieved : 2020-05-12 Expired
Description :

Description principale de l'offre d'emploi :
- Produire un état des lieux sur les avancées récentes de l'océrisation des textes en alphabet arabe (imprimé et cursif) au plan européen et international, et les verrous qui restent à dépasser en vue de disposer d'un outil ouvert. Le livrable prendra la forme d'un rapport écrit.
- Répertorier les possibilités concrètes d'analyse ouvertes par l'océrisation à partir d'un exemple concret de corpus textuel : identification et extraction d'information, classification, analyse sémantique et génétique. Le livrable prendra la forme d'un démonstrateur réalisé avec un prestataire en informatique et doté d'un hébergement pérenne.
- Encoder en XML-TEI et outiller un corpus test à publier en ligne, choisi parmi la collection de manuscrits et imprimés arabes maghrébins conservés à la Bibliothèque des langues et civilisations (BULAC). Le livrable prendra la forme d'une publication en ligne réalisée avec un spécialiste de l'encodage.
- Concevoir et mettre en place un plan de formation national pluriannuel dans les nouvelles philologies numériques aréales (avec organisation d'une première initiative dès fin 2020).
https://emploi.cnrs.fr/Offres/CDD/UMS2000-CYRMIC-005/Default.aspx





Disclaimer : We aim to provide correct and reliable information about upcoming events, but cannot accept responsibility for the text of announcements or for the bona fides of event organizers. Please feel free to contact us if you notice incorrect or misleading information and we will attempt to correct it.