Texte®


Corpus textuels en lettres et sciences humaines, avec conseils et outils de traitement.

Texte® entend mettre (gratuitement) à disposition de la collectivité des chercheurs et étudiants des corpus textuels en lettres et sciences humaines. Pour les textes littéraires, on privilégiera les genres brefs les plus utilisés en didactique, la nouvelle notamment. Nous disposons aussi de corpus d'oral transcrit (entretiens). Pour les textes scientifiques, les articles sont privilégiés. Nous avons par exemple recueilli des archives numériques d'une vingtaine de revues françaises de linguistique. Des textes de philosophie et de sciences humaines seront également disponibles.

À cette banque textuelle seront annexés des logiciels de traitement statistique et morphosyntaxique. Des conseils pratiques d'établissement de corpus, de codage et de traitement sont également disponibles. Des liens avec d'autres sites ressources seront naturellement établis. Il s'agit en effet de coordonner des ressources.

Il n'existe pas dans le domaine francophone de ressources textuelles numérisées qui soient gratuites (les corpus diffusés par l'Elda, trop coûteux pour le commun des laboratoires, même ceux qui ont participé aimablement à leur constitution), où dont les textes soient accessibles intégralement (Frantext, payant, ne donne accès qu'à des extraits).

Pourrait-on disposer de textes numérisés, il faut dépasser l'aspect simplement documentaire, et développer des moyens d'accès et de traitement. Alors que la linguistique de corpus est le secteur de la linguistique qui se développe le plus vite, aucune formation élémentaire n'est disponible en ligne pour les utilisateurs potentiels.

Le projet Texter entend répondre à ces deux besoins en proposant des corpus, des outils de traitements, et des conseils d'utilisation.

Ce projet vous intéresse ? Pour contribuer, ou pour plus amples informations, signalez-vous par un petit courriel à l'adresse : lpe2 ou sylvain.


[retour]