Bénel, Aurélien
Consultation
assistée par ordinateur de la documentation en Sciences
Humaines : Considérations épistémologiques, solutions
opératoires et applications à l'archéologie (Thèse,
2003)
Un
atelier de manipulation de corpus documentaires afin
d'assister un travail humain de construction de
sens au fil de ses changements de
problématique et de point de vue.
Bommier-Pincemin, Bénédicte
Lexicométrie sur corpus étiquetés (2004) [pdf]
Diffusion ciblée automatique
d’informations : conception et mise en oeuvre d’une
linguistique textuelle pour la caractérisation des
destinataires et des documents (thèse 1999) [pdf]
Dans le contexte de documents écrits à dominante scientifique et technique, quatre facettes
textuelles sont définies pour guider la conception des traitements : (i) la matière linguistique du texte ;
(ii) son organisation interne, structurée, close et orientée ; (iii) l’intertextualité ; (iv) le rôle constitutif
des lectures et la dynamique de l’interprétation. Ce modèle motive des innovations à toutes les étapes
du traitement.
Définir un corpus (1999, extrait
de thèse). [Bibliographie] (pdf)
A
partir de différents critères, l'auteur soutient que tout ensemble de
textes n’est pas un corpus ; et propose une typologie des corpus qu'il
confronte aux catégories de l'Analyse du discours.
Bourion, Evelyne
Aide
à l'interprétation des textes électroniques (2001,
thèse)
Une méthode de recherche thématique dans des
corpus multi-auteurs et des textes singuliers
s'appuyant sur une théorie sémantique et sémiotique
des textes.
Lire autrement Le Père Goriot (1999)
Les corpus électroniques et les outils élaborés pour leur analyse renouvellent la lecture et l'interprétation des textes.
Bulterman, Dick
Is It Time for a Moratorium on Metadata? (2004)
Article published in Multi-media IEEE magazine, n°11(4), reproduced with author's authorization.
Habert, Benoît
Portrait de linguiste(s) à
l’instrument (2005)
Rôle respectif des outils, des
instruments et des dispositifs expérimentaux en linguistique
pour l’annotation de données langagières.
Kastberg Sjöblom, Margareta
Comment
l'ordinateur peut-il servir dans l'étude d'un texte
littéraire ? par Margareta Kastberg Sjöblom (2003)
Quel est l’intérêt d’analyser la distribution
des catégories
grammaticales dans un corpus littéraire
informatisé ?
L’écriture
de J.M.G. Le Clézio, une approche lexicométrique par Margareta Kastberg Sjöblom (2002,
thèse de doctorat)
Aborder la spécificité de l'oeuvre leclézienne à partir des parcours lexical et sémantique.
Malrieu, Denise & François Rastier
Genres et variations morphosyntaxiques
(2001)
A
partir de l'analyse d’un corpus de textes etiquetés par variables
morphosyntaxiques on cherche à valider les différents niveaux de la
classification des genres.
Rôle et place des corpus en linguistique : réflexions introductives (2005)
Pour
la linguistique de corpus, le corpus n'est pas réceptacle mais matrice.
C'est en son sein que s'appréhende un sens non pas donné mais
construit. Pour cette raison le corpus n'est pas un recueil passif
d'exemples, à simple fonction documentaire.
Formation(s)
discursive(s) et discours politique : l'exemplarité des
discours communistes versus bourgeois durant
l'entre-deux-guerres. (2004)
La notion de "formation discursive" ne resterait-elle
pas la notion la plus opérante pour traiter des corpus de
textes politiques ?
Orlandi, Tito
Is Humanities computing a discipline? (article extrait de Jahrbuch für Computerphilologie, 2002, n°4)
It appears that most experts agree on the opinion that humanities computing is an independent discipline, and as such it should be introduced into the faculties of humanities. The article then explains how the foundation of the discipline should be understood, on the basis of computing theory and the methodology of the different humanities disciplines.
Poudat, Céline
Étude contrastive de l'article scientifique de revue linguistique dans une perspective d'analyse des genres (2006, thèse)
Élaboration en corpus et par contrastes d'une définition opérationnelle du genre de l'article de linguistique en exploitant les méthodes du traitement automatique des langues et des statistiques textuelles.
Avertissement : Ce
texte est au format PDF.
Recension et présentation comparative d'étiqueteurs pour lefrançais et l'anglais (2004)
Description comparative de six étiqueteurs morphosyntaxiques pour l'annotation du français et de l'anglais.
Doxa
et lexique en corpus - pour une sémantique des
idéologies (2004)
Comment la sémantique de corpus peut aborder la description de la doxa et/ou des idéologies.
Enjeux épistémologiques de la linguistique de corpus.
(2004)
Comment la linguistique de corpus renouvelle le rapport de la linguistique à son objet et lui propose de nouveaux objectifs.
L'accès aux
banques textuelles - des genres à la doxa (1997)
Aspects philologiques et herméneutiques liés à
l'essor de la sémantique de corpus.
Rossignol, Mathias
Acquisition sur corpus d'informations lexicales fondées sur la sémantique différentielle (2005, thèse) [pdf]
Une recherche sur la méthodologie d'apprentissage automatique à partir de corpus d'éléments de description du sens des mots tels qu'ils y sont employés, suivant la hiérarchie domaine/taxème/sémantème de la Sémantique interprétative. Des méthodes originales d'analyse statistique de données y sont développées et mises au service de la linguistique.
Vaillant, Pascal
La classification automatique des textes (2005) [ppt]
La classification automatique de textes et l'attribution des catégories.
Valette, Mathieu & Alexander Estacio-Moreno, Etienne Petitjean, Evelyne Jacquey
Éléments pour la génération de classes sémantiques à partir de définitions lexicographiques. Pour une approche sémique du sens (2006)
L'expérience rapportée vise à constituer des classes sémantiques, structurées en pseudo-sèmes génériques et spécifiques, à partir de définitions dictionnairiques.
LA MANUFACTURE
Une rubrique à vocation pratique à l'aide de ceux qui
souhaitent constituer et exploiter des corpus.
Forest, Dominic
Bibliographie
sur la Lecture et l’Analyse de Textes Assistées par
Ordinateur (LATAO) (2004)
Généralités, analyse thématique, techniques informatiques, logiciels et applications.
Loiseau, Sylvain
Rapide bibliographie XSLT (2003)
Véronis, Jean
Technologies du Langage (blog)
Habert, Benoît
Instruments et ressources électroniques pour le français (2006)
A partir d'une analyse détaillée, cet ouvrage montre les instruments et les ressources
qui sont effectivement disponibles actuellement pour le français et donne une idée du niveau de performance qui peut être
aujourd'hui espéré selon les instruments et selon les
données. Il aborde les
problèmes pratiques et présente les solutions
existantes, il fournit enfin une réflexion méthodologique.
Shirky, Clay
L'Ontologie est surfaite : catégories, tags et liens (traduit par Christophe Ducamp, 2006)
Nos connaissances à propos des catégorisations sont-elles fausses ? L'auteur soutient que les mauvaises habitudes des stratégies précédentes marquent la catégorisation appliquée au monde électronique.
Pincemin, Bénédicte
Compte
rendu du n°2 de la revue Corpus sur "La
distance intertextuelle" (2004)
Rastier, François
Eléments de
théorie des genres (2001)
Comme
tout texte relève d’un genre qui le relie à un discours, la description
de son genre est cruciale pour structurer son intertexte et constituer
son corpus.
Ballabriga, Michel
« L’étoile
a pleuré rose… » in Poésies
d’A. Rimbaud (1854-1891) : étude de sémantique
interprétative avec exploitation du corpus rimbaldien numérisé
(Frantext) (2005)
Cette étude tente
de montrer et d’évaluer l’un des partis que l’on peut
tirer de l’exploitation du corpus rimbaldien numérisé
pour l’interprétation d’un texte située dans le
cadre de la sémantique interprétative des textes.
Kastberg Sjöblom, Margareta
L’écriture de J.M.G. Le Clézio, une approche
lexicométrique (2002, thèse de doctorat)
Aborder la spécificité de l'oeuvre leclézienne à partir des parcours lexical et sémantique.
Mayaffre, Damon :
L'herméneutique numérique (2002) (Article extrait de
l'Astrolabe)
La notion de "formation discursive" ne resterait-elle
pas la notion la plus opérante pour traiter des corpus de textes politiques
?
Gadet, Françoise
Derrière les
problèmes méthodologiques du recueil des données
(2003)
Une interrogation sur les problèmes épistémologiques et éthiques de constitution d'un corpus.
Kyheng, Rossitza
De la sémantique des textes aux Web sémantique (2005)
Quel avenir pour l'édition scientifique électronique ? Les corpus, les archives, le web sémantique.
Les archives du colloque
Corpus littéraires : recueil et numérisation, analyses
assistées, didactique
Ce colloque du groupe Sémantique des textes a eu lieu le
20 et le 21 octobre 2000 à l'Université Paris VII - Denis
Diderot.
Texto ! vous fait revivre l'ambiance du colloque à
travers des enregistrements sonores.
Les archives de la Journée scientifique Corpus de Sciences sociales : établissement, numérisation, analyses sémantiques,
La
journée scientifique de l'équipe Sémantique des textes a été organisée
par le Centre de recherche en informatique multilingue, INALCO (Paris),
le 8 juin 2005.