L'AIDE À L'INTERPRÉTATION DES TEXTES ÉLECTRONIQUES
Evelyne
BOURION
CNRS / Université Paris 10
(Thèse, 2001 [*])
SOMMAIRE
TOME I
CHAPITRE I :
L'interprétation des textes
électroniques
1. 1. Pourquoi concevoir une assistance à l'interprétation
des textes électroniques ?............... 5
1. 1. 1. Banques de données, textes numérisés et usagers
5
1. 1. 2. Lecture ou interprétation ?........ 6
1. 1. 3. Langage, langue, texte … et
informatique........... 10
1. 2. La sémantique différentielle et le corpus
électronique................. 12
1. 2. 1. La problématique du signe et celle du texte.....
12
1. 2. 2. Formes textuelles et cohésion.............
13
1. 3. Perspective sémiotique et test
statistique.................... 17
1. 3. 1. Statistique et corpus électronique...........
17
1. 3. 2. SAAS, le système d'aide à l'interprétation des
textes électroniques.......... 24
CHAPITRE II :
Des discours et des genres
2. 1. La variable 'discours' ..............29
2. 1. 1. Textes et contextes............. 29
2. 1. 2. La question de la lemmatisation......... 29
2. 1. 3. Pied et son voisinage dans des corpus
contrastés............. 31
2. 2. La variable 'champ générique' 42
2. 2. 1. Les réseaux associatifs de amour dans le
corpus Roman et dans le corpus Poésie. 42
2. 2. 2. Syntagmes et relations sémantiques............
44
2. 3. Résultats, problèmes,
propositions.................... 48
CHAPITRE III :
Les unités sémantiques
3. 1. La diffusion des traits
sémantiques.................... 53
3. 1. 1. Unités signifiantes et paliers
d'interprétation.... 53
3. 1. 2. Morphologie et sémantique............. 60
3. 2. Une fonction narrative :
l'imploration................. 63
3. 2. 1. L'alternance /humain +/ /humain -/...........
63
3. 2. 2. Logique sémantique et structure.............
64
3. 2. 3. Les acteurs d'une fonction
narrative............. 68
3. 3. Thématique assistée : recherche de méthode dans un
corpus multi-auteurs... 71
3. 3. 1. SAAS, un ensemble de documents d'aide à
l'interprétation...... 71
3. 3. 2. La méthode 73
3. 4. Résultats, problèmes,
propositions.................... 74
CHAPITRE IV :
Recherche thématique 1 : la peur
4. 1. Les contenus thématiques investis dans les contextes
79
4. 1. 1. La peur est un sentiment dysphorique, mêlé et
intense 79
4. 1. 2. L'expression du sentiment : la parole et le
corps 83
4. 1. 3. La situation de peur : un événement ponctuel
91
4. 2. Faisceaux de traits et variation de
lexicalisation.............. 93
4. 2. 1. La peur, sentiment intense, dysphorique et mêlé
93
4. 2. 2. L'expression du sentiment............. 94
4. 3. Structures sémantiques et
textualité.................... 99
4. 3. 1. Associations syntagmatiques et expérience
humaine 99
4. 3. 2. Interactions entre le système lexical et les
autres sous-systèmes de la langue........... 101
4. 3. 3. Genre textuel et normes sociales...........
101
4. 4. Un sentiment : son expression dans une langue et
des textes.................. 102
4. 5. Résultats, problèmes,
propositions.................. 105
CHAPITRE V :
Recherche thématique 2 : la parure
5. 1. Système automatique et unités
sémantiques.................. 109
5. 1. 1. Les types de problèmes rencontrés en
corpus........... 109
5. 1. 2. Une autre approche de la polysémie : les aires
sémantiques......... 111
5. 2. Le thème comme structure stable de traits....
116
5. 2. 1. Le graphe sémantique représentant le
thème........... 116
5. 2. 2. Le type et les occurrences : variations sur le
thème 119
5. 3. Doxa, topoï, idéologie : le cadre de la sémiotique
des cultures.................. 120
5. 3. 1. Les topoï repérés dans le corpus 120
5. 3. 2. Le cadre de la sémiotique des
cultures........... 122
5. 4. Résultats, problèmes,
propositions.................. 125
CHAPITRE VI :
Le texte, unité signifiante : recherches assistées
sur Le Père Goriot
6. 1. Contraster une œuvre singulière sur un corpus
générique.................. 129
6. 1. 1. La composante thématique........... 129
6. 1. 2. Interaction entre les composantes
textuelles........... 134
6. 1. 3. Molécules sémiques et acteurs 138
6. 2. Un épisode-clé : le bal..... 144
6. 2. 1. Pic statistique, densité sémantique et
interaction des composantes textuelles........... 144
6. 2. 2. Le bal au chapitre 1........... 144
6. 2. 3. Le bal au chapitre 2........... 145
6. 2. 4. Le bal au chapitre 4........... 147
6. 3. Textualité et intertextualité dans la Comédie
Humaine. 151
6. 3. 1. Acteurs reparaissant....... 151
6. 3. 2. Le niveau agonistique dans Le Père
Goriot........... 152
6. 3. 3. Le niveau agonistique dans La Comédie
Humaine........... 159
CHAPITRE VII :
Conclusion et prospective
7. 1. Conclusion méthodologique......... 167
7. 1. 1. Enrichissement des corpus 167
7. 1. 2. Les documents du SAAS........... 167
7. 2. Vers de nouvelles recherches..................
169
7. 2. 1. Recherches sur La Comédie Humaine...........
169
7. 2. 2. Etudes sur le Roman d'apprentissage au
XIXès. 171
BIBLIOGRAPHIE
GLOSSAIRE
ANNEXE :
Ponctuation et
accès sémantique aux banques
textuelles
Introduction ............... 189
I. La ponctuation, la sémantique interprétative et les
textes électroniques.............. 190
II. La ponctuation des quatre corpus
"sentiments"................ 191
II. 1. La pondération statistique........... 191
II. 2. Contraste entre les quatre corpus
"sentiments"......... 192
II. 3. La pondération des ponctèmes par le test
statistique........... 193
II. 4. Commentaires des résultats........... 194
III. Le corpus peur et ses sous-corpus : ponctuation et
critères énonciatifs.................. 202
III. 1. Les hypothèses........... 202
III. 2. Commentaires des résultats
statistiques........... 204
IV. La ponctuation de trois romans, contrastée sur le
corpus de référence.................. 205
Conclusion et perspectives.................. 211
TOME II Annexes aux
chapitres
NB! Ce texte est au format PDF. La visualisation des fichiers nécessite Acrobat Reader
RÉSUMÉ : Cette étude propose une méthode de recherche thématique dans un vaste corpus multi-auteurs et dans un genre littéraire homogène, utilisant un test probabiliste. Elle s'appuie sur une théorie sémantique et sémiotique des textes et des corpus électroniques et tient compte du principe herméneutique selon lequel le local s'interprète en fonction du global. Elle permet ainsi de caractériser une œuvre sur un corpus générique, sans codage sémantique ou stylistique préalable : elle peut être utilisée pour différents types de recherches et appliquée à toutes sortes de corpus. En effet des programmes d'aide à l'analyse sémantique ont été mis au point, proposant à l'usager de corpus électroniques des documents conçus pour faciliter l'interprétation des résultats statistiques.
[*]Thèse présentée et soutenue le 14 décembre 2001 à l'Université de Nancy II en vue de l'obtention du titre de Docteur en sciences du langage. Jury : Étienne BRUNET, Bernard COMBETTES, Nicole MOZET, François RASTIER (directeur), Laurent ROMARY (co-directeur).
Vous pouvez adresser vos commentaires et suggestions à : evelyne.bourion@free.fr