LIRE AUTREMENT LE PÈRE GORIOT
EXEMPLE D'EXPLOITATION D'OUTILS ISSUS DES NOUVELLES TECHNOLOGIES
POUR L'ÉTUDE D'UN TEXTE LITTÉRAIRE

Evelyne BOURION
CNRS / Université Paris 10


Les corpus électroniques et les outils élaborés pour leur analyse renouvellent la lecture et l'interprétation des textes. Ils permettent de pratiquer une lecture non-linéaire, de rassembler des contextes particuliers pour vérifier des hypothèses, observer des régularités ou des distorsions. D'autre part,  l'usage de tests statistiques, répandus dans le domaine de la "statistique lexicale", offre des éléments pour caractériser un texte, par contraste avec un corpus constitué selon des critères de langue, genre textuel et époque, auquel les règles de la "bonne philologie" autorisent à le comparer. Les différents outils utilisés ici apportent des éléments sur le "lexique" de l'oeuvre (Le Père Goriot et La Comédie Humaine ), la morphologie, et pour la lecture méthodique : ces éclairages se complètent et stimulent l'interprétation.


1. Recherches à l'aide d'Hyperbase

Hyperbase est un outil de "traitement hypertextuel et statistique de grands corpus", distribué sur CD-ROM par son concepteur, le professeur Etienne Brunet [1] : il comporte des bases textuelles et des outils statistiques et informatiques pour effectuer des recherches sur ces bases. Les résultats donnés ici proviennent de la version 3.1 (janvier 1998).

Un mot et ses contextes : apport des concordances 

Par segmentation automatique, la machine réunit tous les segments de texte où une forme demandée est présente, sur une ligne (comprenant un nombre de signes fixé à l'avance) et affiche les résultats en mettant en évidence la forme recherchée au milieu de chaque ligne.

On peut donc lire sous forme de concordances tous les exemples du syntagme  "l'étudiant" relevés dans la base Balzac du logiciel : on y trouve 113 exemples :

Forme(s) recherchée(s): l'étudiant :

PC 161f| , disait Pauline, est bien mieux que l'étudiant du numéro sept ! Ses cheveux blonds
Go 60g| cravate noire , flétrie , mal nouée de l'étudiant , un pantalon à l'avenant et des
Go 78h| dit Eugène en se relevant un moment . ¶ l'étudiant appliqua de nouveau son oeil à la
Go 79c| un soupir . ¶ " Il est fou " , pensa l'étudiant . ¶ " Pauvre enfant ! " dit à
Go 81c| père Goriot est sorti avec un paquet . l'étudiant ne reviendra qu' après son cours ,
Go 85d| , l'on entendit dans la rue le pas de l'étudiant . ¶ " Ah bien , monsieur Eugène ,
Go 85d|allez déjeuner avec tout le monde . " ¶ l'étudiant salua les pensionnaires , et s'
Go 86a|Poiret l'idémiste . ¶ - Enfin , reprit l'étudiant en lui coupant la parole , je danse
Go 86c| Vautrin en jetant un regard profond à l'étudiant . Elle allait sans doute chez le
Go 86d| demeure rue du Helder . " ¶ à ce nom , l'étudiant regarda fixement Vautrin . Le père
Go 86f| - je pas ? ¶ - M . Goriot ! s' écria l'étudiant . ¶ - Quoi ! dit le pauvre
Go 86g| ? dit à voix basse Mlle Michonneau à l'étudiant . ¶
Go 87d| le soleil d' un beau jour en entendant l'étudiant , devint sombre à cette cruelle
Go 87g|- Jamais on ne me fera croire , s' écria l'étudiant , que la belle comtesse de Restaud
Go 89e| - là sait lui chatouiller l'âme . " ¶ l'étudiant remonta chez lui . Vautrin sortit .
Go 94h| il fondait son avenir . ¶Il se crotta , l'étudiant , il fut forcé de faire cirer ses
Go 96c| Eugène , autant pour voir la figure de l'étudiant que pour regarder dans la cour . ¶
Go 98b| cheminée , au milieu du grand salon . ¶ l'étudiant savait bien qu' il allait gêner cet
Go 98g| " M . de Restaud " , dit la comtesse à l'étudiant en lui montrant son mari . ¶ Eugène
Go 99b| son air froidement cérémonieux et salua l'étudiant . ¶ " Enchanté , dit - il ,
Go 100d| . ¶Aussi la comtesse montra - t - elle l'étudiant d' un air et par un geste pleins de
Go 101d|dit - elle vivement . ¶ - Mais , reprit l'étudiant , je viens de voir sortir de chez
Go 104d| de mariée vulgaire . Leur rire éclaira l'étudiant au moment où il compara cette
Go 108f| un regard dont l'impertinence glaça l'étudiant . ¶ Eugène comprit ce hein . Depuis
Go 109c| ¶ La vicomtesse s' intéressa vivement à l'étudiant pour une réponse d' ambitieux . Le
Go 109g| , dit Jacques en coupant la parole à l'étudiant qui fit le geste d' un homme
Go 111c| Sans le savoir , voilà ma faute " , dit l'étudiant que son génie avait assez bien
Go 111d| . ¶ " ¶ Mme de Beauséant jeta sur l'étudiant un de ces regards fondants où les
Go 111e|la plaie que venait de faire au cœur de l'étudiant le coup d' œil d' huissier -
Go 112c|- Je n' en savais rien , madame , reprit l'étudiant . Aussi me suis - je étourdiment
Go 112g| . ¶ - Ah ! c' est son père , reprit l'étudiant en faisant un geste d' horreur . ¶
Go 117d| son cou et jetant un regard de reine à l'étudiant , rendez - le moi blanc . ¶Allez ,
Go 119g| que lui avait causée la phrase de l'étudiant , ne comprit pas que les
Go 122c| pas . La vicomtesse avait eu raison . ¶ l'étudiant n' étudia plus . Il allait aux
Go 128b| , d' elle ou de toi , vaut mieux ? " l'étudiant se sentit les entrailles rongées
Go 131d| sans ailes a retrouvé son envergure . l'étudiant sans argent happe un brin de
Go 132c| bon crédit " , reprit - il en regardant l'étudiant . ¶ Rastignac fut forcé de le
Go 132d| , et s' observaient l'un l'autre . ¶ l'étudiant se demandait vainement pourquoi .
Go 133h|cent fois . ¶ - Mais ... oui " , répondit l'étudiant qui tenait ses deux sacs à la main
Go 134a| la porte qui donnait dans le salon , et l'étudiant se disposait à s' en aller par
Go 134b| fouettant la porte du salon et venant à l'étudiant qui le regarda froidement . ¶
Go 134c|carreau garni de barreaux en fer . ¶Là , l'étudiant dit devant Sylvie qui déboucha de
Go 146b|mot , cependant . " Il regarda fixement l'étudiant : " Vous avez mon secret , lui dit
Go 148a| sentiments contraires entre Vautrin et l'étudiant . Le hardi philosophe qui voudra
Go 148e| étaient émues pour lui dans le cœur de l'étudiant . ¶Cependant cette union naissante
Go 149g| . ¶ Cette promenade fut fatale à l'étudiant . Quelques femmes le remarquèrent .
Go 151b| de canon . " Les amères réflexions de l'étudiant furent bientôt dissipées par le
Go 152e| - il avec une galanterie moqueuse dont l'étudiant fut la dupe , mais je dois aller
Go 154g|beau Portugais se leva , prit le bras de l'étudiant , qui en un clin d' œil se trouva
Go 156c| drûment posées que l'était celle de l'étudiant , elle répondit à autre chose . ¶
Go 158a| encore celui qui l'abandonne . " ¶ l'étudiant revint à pied du Théâtre - Italien
Go 159b| , aidait - elle à cette fascination . l'étudiant frappa rudement à la porte du père
Go 160b| ¶ - Je préfère Mme Delphine , répondit l'étudiant , parce qu' elle vous aime mieux .
Go 160c|vous a - t - elle donc dit de moi ? " ¶ l'étudiant répéta les paroles de la baronne en
Go 163b| pensionnaires . ¶Vautrin , qui revoyait l'étudiant pour la première fois depuis leur
Go 164c| Où as - tu pris cet air grave ? lui dit l'étudiant en médecine en lui prenant le bras
Go 165e| toujours amis . ¶ - Dis donc , reprit l'étudiant en médecine , en sortant du cours
Go 166b| ainsi à la tête d' un homme , se disait l'étudiant . E le veut se servir de moi pour
Go 168f|¶ - La fille de M . Goriot " , répondit l'étudiant . ¶ à ce nom , les regards se
Go 169f| . ¶ - Oh ! cela est impossible , dit l'étudiant . Mais je suis curieux de connaître
Go 170e| voiture s' arrêta , la baronne regarda l'étudiant d' un air qui imposa silence à ses
Go 174f|misère et de cette opulence étourdissait l'étudiant , dans les oreilles duquel les
Go 176e| et sa chandelle allumée , afin que l'étudiant n' oubliât pas de lui raconter sa
Go 177f| par un sourire ? Pendant cette fête , l'étudiant mesura tout à coup la portée de sa
Go 179c| qu' il avait semés au cœur de l'étudiant pour le corrompre . Plusieurs jours
Go 180f| son argent , et s' était endetté . ¶ l'étudiant commençait à comprendre qu' il lui
Go 181a| , répondit - il , mais il râle . " ¶ l'étudiant en médecine prit ce mot pour une
Go 181f| le salon . ¶Il avait lu dans l'âme de l'étudiant et pressentait un symptôme décisif
Go 182a| les premiers moments de sa liaison , l'étudiant s' était cru le maître , Mme de
Go 184f|banque qu' il fit papilloter aux yeux de l'étudiant . Eugène était dans la plus cruelle
Go 187c| vouloir entendre la réponse négative de l'étudiant , afin de le mettre à son aise . Il
Go 188a| qui paraissait à bon droit suspect à l'étudiant en médecine . ¶ " Mademoiselle ,
Go 195e| avait senti la chaleur des lèvres de l'étudiant , la pression de sa taille par un
Go 196f| bonhomme , qui avait demandé la clef de l'étudiant à Sylvie . Vous avez cru ce matin
Go 197a| . Le père Goriot saisit un moment où l'étudiant lui tournait le dos , et mit sur la
Go 199d| - moi vous embrasser . ( Et il serra l'étudiant dans ses bras . ) Vous la rendrez
Go 199g| je n' aime qu une femme au monde , dit l'étudiant , je ne le sais que depuis un
Go 199g| fit le père Goriot . ¶ - Mais , reprit l'étudiant , le fils de Taillefer se bat
Go 201f|cassis qui purge comme de la manne , dit l'étudiant en médecine à voix basse . ¶ -
Go 201g| vin de Champagne , je le paye , ajouta l'étudiant . ¶ - Sylvie , dit Mme Vauquer ,
Go 203g| d' Eugène . ¶ En plaçant la tête de l'étudiant sur la chaise , pour qu' il pût
Go 212d| interpellation , le père Goriot regarda l'étudiant et lui vit à la main la lettre
Go 212e| . ¶ Le père Goriot saisit la main de l'étudiant et la lui serra . Il aurait voulu
Go 215f| vérifier . " ¶ La longue promenade de l'étudiant en droit fut solennelle . Il fit en
Go 222a| Poiret , approuva la proposition de l'étudiant en médecine , qui fort de l'
Go 222d| Collin , répondit - elle en jetant sur l'étudiant un regard venimeux et interrogateur
Go 227d| comprenez rien . ¶ " ¶ Thérèse sortit . l'étudiant prit Delphine dans ses bras , la
Go 231e|de dire là . " Et Mme de Nucingen baisa l'étudiant au front . ¶ " Il a refusé pour
Go 232f| Nucingen attendait . Le père Goriot et l'étudiant retournèrent à la Maison Vauquer en
Go 237a|                                    Mais l'étudiant n' était pas encore arrivé au
Go 254d| la farine avec laquelle il était fait , l'étudiant , ayant observé dans ce mouvement
Go 265a| l'emmena chez lui , remit une boîte à l'étudiant et lui dit : " Elles y sont toutes
Go 266c| d' eau fraîche , et prit le bras de l'étudiant . " Marchons ! " dit - elle . ¶
Go 266g| , et jalouse de mettre aux pieds de l'étudiant les hommages qu' elle recueillait
Go 267a|vicomtesse , croyant n' y rencontrer que l'étudiant , y vint après avoir dit adieu à M
Go 267g|pensant que ce jeune homme attendait . ¶ l'étudiant plia le genou , prit la main de sa
Go 267g| croire à quelque chose , dit - elle à l'étudiant . ¶à mon départ de ce monde , j'
Go 269a|fort attentivement sans le reconnaître . l'étudiant ne soutint pas ce spectacle , des
Go 271b| . ¶ - Allez - vous mieux ? demanda l'étudiant en lui prenant la main . ¶ - Oui ,
Go 280b|le premier salon où M . de Restaud reçut l'étudiant debout , sans le faire asseoir ,
Go 281c| " , cria - t - elle avec désespoir à l'étudiant . ¶ Eugène salua les deux époux ,
Go 281g|perdue ... oh ! cela serait bien mal . " ¶ l'étudiant se pencha sur le lit de Delphine ,
Go 282c| . ¶ Le père Goriot , ayant entrevu l'étudiant , répondit : " Elles viennent , n'
Go 282e| . Je reviendrai , Bianchon , dit - il à l'étudiant . ¶ S' il se plaignait encore ,
Go 285g| tôt " , dit la comtesse à Rastignac . ¶ l'étudiant fit un signe de tête affirmatif
Go 288b| à peine de quoi pourvoir aux frais . ¶ l'étudiant en médecine se chargea donc de
Go 289e| basse et sombre autour de laquelle l'étudiant chercha vainement les deux filles
Go 290c|prière due au bonhomme pour l'argent de l'étudiant . ¶Quand les deux fossoyeurs eurent
An1075a| fauteuil d' acajou , la bibliothèque de l'étudiant en droit , et ses meubles mesquins
IP 296a| indifférents aux phases de la nature . l'étudiant parqué dans le quartier Latin y a
UM 807c| Zélie fut flattée en le voyant . ¶ l'étudiant portait des bottes fines , un
Ra 396d| aise , en la contemplant en secret , en l'étudiant à toute heure ; Flore illumina pour
EH 348c| courts et trop étroits ; en sorte que l'étudiant semblait devoir les faire craquer


Qu'apprenons-nous de cette lecture ?

On constate :
a)
- que  "l'étudiant" dans les textes de ce corpus peut être un groupe nominal ou verbal. Certains corpus dits "enrichis" ou "étiquetés" comportent les mentions de catégories grammaticales pour chaque signe linguistique mais ce n'est pas le cas de ce corpus : on ne peut donc appliquer une "contrainte de sélection automatique" pour exclure l'un des types.
la vérification des contextes montre que l'étudiant est presque toujours un groupe nominal, sauf dans un exemple de La Rabouilleuse : "en  l'étudiant à toute heure".

b)
- que cette séquencese rencontre principalement dans Le Père Goriot : sur 113 exemples, 6 seulement sont attestés dans d'autres œuvres (La Peau de Chagrin, Les Illusions perdues, Ursule Mirouët, L'Envers de l'Histoire contemporaine, La Rabouilleuse, Le Cabinet des Antiques ).

L'étudiantest une séquence caractéristique du Père Goriot, comme le montre le graphique d'Hyperbase, réalisé à partir d'un traitement statistique [2] dans l'ensemble de La Comédie Humaine( v. ci-dessous) .


 

c)
-  à la lecture des contextes, on comprend également que cette anaphore désigne de façon massive le personnage "Eugène de Rastignac" : d'autres éléments intéressants sur Le Père Goriot et La Comédie Humaine peuvent être trouvés dans la comparaison de différents résultats statistiques de la base Balzac, en ligne sur l'Internet (v. ci-dessous) .


2. Recherches dans la base "Balzac"  [3]  

Sur l'Internet, aller à l'adresse suivante :  http://lolita.unice.fr/~brunet/BALZAC/Balzac.htm


 

A. Comparaison de concordances : "étudiant" et "l'étudiant" (ci-dessus )

Aller à la lettre "E" et choisissez le vocable "étudiant" :


Une différence de fonctionnalités fait que, dans la base en ligne, on peut afficher les concordances de la forme "étudiant"  mais pas du syntagme "l'étudiant" (comme c'est le cas dans certaines versions d'Hyperbase) : la comparaison des contextes sélectionnés dans les deux cas est cependant instructive.

Qu'observe-t-on par rapport aux résultats obtenus avec la séquence " l'étudiant" ?

La demande de concordances de "étudiant" entraîne du bruit  parce que la machine sélectionne d'autres exemples où il s'agit du participe présent du verbe "étudier" , en particulier dans l'expression "en étudiant" : mais on observera qu'elle n'est pas employée dans Le Père Goriot, où il s'agit toujours du substantif.

D'autre part, la machine sélectionne des exemples où étudiant est précédé d'un déterminant (un, quel, ce), d'un groupe nominal (un pauvre diable d'étudiant ), ou d'un adjectif : on peut vérifier si l'ensemble des exemples du Père Goriot concerne bien le personnage de Rastignac.

C'est le cas, sauf dans le premier exemple où le sens est générique (" l'étudiant en général, la classe des étudiants") et dans le syntagme  l'étudiant en médecine (qui n'est attesté que sept fois) et qui désigne Bianchon (Bianchon n'est désigné qu'une seule fois par  l'étudiant, par le narrateur, mais dans un contexte où l'ambiguïté n'est pas possible : "je reviendrai, Bianchon, dit-il (le médecin) à  l'étudiant" , dans une scène où Bianchon et le médecin sont au chevet du père Goriot mourant).

Concernant le personnage de Rastignac, des adjectifs comme pauvre, courageux, naïf, malicieux, malencontreux, fournissent des éléments sémantiques pour l'analyse de ce personnage et d'autres personnages aussi :
* dans quels sens est employé pauvre ?
* est-ce par le narrateur ou d'autres personnages (foyer énonciatif) ?
* qui le considère comme malencontreux, et pourquoi ?

D'autres éléments d'interprétation peuvent être trouvés dans des énoncés comme : "il est fou, pensa  l'étudiant", "cette promenade fut fatale à  l'étudiant", "cette opulence étourdissait  l'étudiant ", " l'étudiant ne soutint pas ce spectacle". En les replaçant dans le contexte dont ils sont issus, on peut les étudier sous l'angle du "caractère" du personnage et de ses rôles, de ses interactions avec d'autres personnages du roman. De même, on peut par exemple rapprocher de l'attribut naïf les énoncés suivants : "je n'en savais rien, madame. Aussi me suis-je étourdiment ...", "une galanterie moqueuse dont  l'étudiant fut la dupe", " l'étudiant commençait à comprendre qu'il ... ", et de l'adjectif pauvre " l'étudiant sans argent", "un pauvre diable d'étudiant". 

B. Régularités dans une œuvre : utilisation des graphiques

- 1) Dans Listes de graphiques, demander les graphiques de "Eugène" et "Rastignac", puisqu'on sait que dans le Le Père Goriot , le même personnage est évoqué par ces trois désignations. Le graphique "Rastignac" permet de voir dans quels textes de La Comédie Humaine , on retrouve ce personnage.


 

La comparaison de  ces graphiqueset de celui de l'étudiant (ci-dessus) montre que si le narrateur emploie aussi bien Eugène que l'étudiant ou Rastignac pour désigner ce personnage dans Le Père Goriot, Rastignac est la  seule  désignation sélectionnée par le test comme mot spécifique, caractéristique, pour les autres romans de La Comédie Humaine où il est mis en scène (voir ci-dessous).

Il parait conforme à la "réalité représentée" que le narrateur ne le désigne plus par le syntagme l'étudiant puisque c'est seulement dans Le Père Goriot qu'on le représente arrivant de sa Charente natale pour faire des études de droit à Paris, mais on aurait pu penser que le narrateur emploierait aussi Eugène , or ce n'est pas le cas.

Pour La Peau de Chagrin, Rastignac, seul, est sélectionné par le test statistique et l'on sait que ce roman a été écrit antérieurement au Père Goriot ; mais selon l'axe du temps représenté il se place après "l'entrée dans le monde", qui se déroule dans le chapitre II du Père Goriot , et Rastignac y est déjà décrit comme un dandy du tout-Paris, dans le rôle de l'ambitieux qui est le sien dans La Comédie Humaine.

C'est doncla notion de type chez Balzac qui explique ces différences et on sait que c'est en écrivant Le Père Goriot que Balzac a mis au point sa technique des "personnages reparaissant" ; de plus, il a alors renommé "Eugène de Rastignac" le personnage de La Peau de Chagrin, qu'il avait d'abord nommé "Eugène de Massiac".

On peut comparer l'importance relative de ce personnage pour la thématique et les schémas narratifs dans les tableaux des "spécificités" des différents textes où Rastignac est un mot sélectionné par le test statistique  :
son score le plus important se trouve dans Le Père Goriot (51), suivi de La Maison Nucingen (score 29), et de L'Interdiction (10), les scores dans les autres textes étant plus faibles : 4 dans Le Cabinet des Antiques, 7 pour Splendeurs et Misères des Courtisanes, 7 dans Une Fille d'Eve, et 6 pour Le Député d'Arcis.
 

C. Utilisation de la fonction "Vocabulaire spécifique"

Aller à Résultats statistiques et là, à "vocabulaire spécifique" de Balzac [5]

Cliquer sur le titre Le Père Goriot

Les résultats sont présentés, selon deux modes, côte à côte :
- à gauche, par ordre de score statistique (test statistique), séparant les noms propres des noms communs
- à droite, par ordre alphabétique, interclassant noms propres et noms communs

 

LE PERE GORIOT

 

 

NOMS PROPRES
Text.Corpus Écart

LISTE ALPHABETIQUE(noms propres + voc.commun)

Text.Corp.Écart

  418   434   99 Eugène
  296   306   99 Goriot
  194   205   81 Vautrin
  169   187   74 Vauquer
  100   123   54 Beauséant
   80    80   54 Sylvie
  103   139   52 Delphine
 
212   566   51 Rastignac
etc...

 

91624273   10 !              
105629849    9 "              
170351986    8 -              
473913888   17 .              
58116273    7 ?              
50515345    5 a              
4    35    3 acceptez       
122 2280    8 ah
etc...

VOCABULAIRE COMMUN
Text.Corpus Écart
129 190 56 étudiant
58 76 40 pensionnaires
406 4135 28 père
63 172 27 vicomtesse
etc.

 

On constate que les noms qui désignent les personnages principaux sont sélectionnés en tête, par le test statistique, comme étant "spécifiques", caractéristiques de ce texte :
- noms propres : Eugène et Goriot, les deux principaux sont en premières positions
- noms communs, étudiant, pensionnaires, père, vicomtesse , etc.

Les listes alphabétiques permettent de vérifier, parmi les différentes formes possibles d'un mot (selon que le mot est adjectif, substantif, verbe : masculin, féminin, pluriel, singulier, formes verbales), quelles formes sont sélectionnées par le test statistique.

Exemple: le mot "gendre"est sélectionné pour la forme du pluriel, car le père Goriot a deux filles mariées et donc deux gendres, mais "père"et " papa" figurent au singulier seulement.
 

On peut vérifier aussi, si tel mot qui pourrait être " synonyme " de tel mot étudié est employé dans le texte et sélectionné par le test statistique.

 

3. Recherches à l'aide des programmes du Système d'Aide à l'Analyse Sémantique (SAAS) [6]

Lecture méthodique et thématique

Les résultats donnés sur le site "recherche hypertextuelle dans La Comédie Humaine" ont été obtenus en contrastant l'œuvre de Balzac sur le corpus Frantext, un ensemble de textes de différents genres.

Des résultats plus précis sont obtenus par les programmes du Système d'Aide à l'Analyse Sémantique (SAAS) : ils contrastent le Père Goriot sur le corpus des textes de même genre, le roman, de 1830 à 1970, corpus extrait de Frantext.

Le test permettant de comparer le vocabulaire d'une œuvre à un corpus de référence, de même genre, en signalant les mots "saillants", renouvelle la recherche sur la thématique des textes. On a choisi d'appliquer le test statistique à différentes parties de texte, le chapitre et le texte entier et ces deux types de sélection donnent des résultats complémentaires.

Les mots sélectionnés en tête par le test statistique sont présentés dans le tableau ci-dessous (où les chiffres correspondent aux scores obtenus).

Chapitre I

Chapitre II

Chapitre III

Chapitre IV

Tout

120 vermicellier

70 kt

60 pensionnaires

62 jussienne

98 étudiant

94 vicomtesse

66 étudiant

47 broum

44 souscrite

89 vicomtesse

66 étudiant

44 vicomtesse

39 cagnotte

41 gendre

82 vermicellier

56 froitorama

29 épouserez

31 étudiant

38 séreuse

64 pensionnaires

49 pensionnaires

27 vous

29 forçat

35 père

38 gendres

45 telet

24 réussirez

23 mouchards

34 soigneraient

38 père

45 crottent

23 mandarin

21 dit

34 sinapisme

36 jussienne

37 comtesse

16 gendres

19 tronche

33 moxas

31 froitorama

34 ro

15 francs

18 reculez

29 lamée

30 comtesse

30 pension

15 mille

17 vous

28 étudiant

30 dit

28 morganatique

15 flairé

17 vermicellier

24 elles

28 vous

28 cor

14 prévoyante

17 causeuse

24 courrons

25 pension

24 muséum

13 rapportez

16 bagne

23 vicomtesse

25 telet

24 vendraient

13 chagrins

16 police

22 veillât

25 drûment

24 gendarmer

13 écus

16 excellence

22 raisonnaient

25 crottent

24 empressant

13 soeurs

15 veuve

22 filles

25 muséum

22 bouffons

12 baronne

15 respectez

21 bonhomme

23 bonhomme

21 pensionnaire

12 patriarcale

15 père

20 bal

21 broum

21 escompteur

12 singeries

15 muséum

20 comtesse

20 souscrite

20 vermeil

11 remontons

14 dînons

19 liard

20 filles

20 notifier

11 sentirez

14 -

17 récompensera

20 vendraient

20 galantin

11 fallût

14 casé

17 grabat

20 bal

Score statistique des premiers mots sélectionnés dans Le Père Goriot contrasté sur un corpus Roman XIX-XXès.

Les mots qui désignent les personnages principaux sont sélectionnés par le test [7], au niveau d'un ou plusieurs chapitres et/ou de l'ensemble du texte, comme vermicellier, étudiant, père, vicomtesse, comtesse, pensionnaire(s), baronne, filles, soeurs, gendre(s), bonhomme.

Les titres des chapitres qui annoncent leur thématique principale, "Une pension bourgeoise", "L'entrée dans le monde", "Trompe-la-mort", "La mort du père" peuvent être mis en relation avec ces sélections : par exemple des mots comme forçat, mouchard, tronche, bagne, police sont liés au personnage de Vautrin et ne sont sélectionnés que pour le chapitre III. Au chapitre I des jeux de mots parmi les pensionnaires de la pension Vauquer donnent lieu à la saillance de  froitorama , quant à telet et  ro , formes tronquées pour roitelet et caro (mot italien), ils obtiennent ce score parce qu'ils ne figurent dans aucun autre texte du corpus de référence.

Les différents résultats montrent que pour contraster une oeuvre singulière, il est important de pouvoir appliquer le test à différentes zones de localité, ensemble de l'œuvre et chapitre.

D'autre part, si le corpus de référence est constitué de textes de même genre textuel, les résultats sont plus fins, ce qui met en évidence l'importance du genre textuel : mais quand on contraste un texte sur un corpus hétérogène, les résultats sont "lissés". Le respect des textes, qui sont des systèmes pluri-sémiotiques engendrés dans des pratiques sociales spécifiques, impose de constituer le corpus auquel on peut les comparer (philologie électronique). Il faut donc souhaiter une plus vaste disponibilité de textes en version électronique fiable, qui permettra de constituer des corpus selon les buts de la recherche, afin de comparer ce qui est comparable.
 

Conclusion

De nouveaux types de recherches sur les textes sont d'ores et déjà permis par les nouvelles technologies, même s'il reste beaucoup à faire pour disposer de réelles "stations de travail". Quand on lit les textes en "fragments éclatés", organisés autour des désignations d'un personnage particulier (par exemple) ou pour une autre raison sémantique, on peut trouver des "suppléments de sens" dans les données quantitatives fournies par les traitements informatiques et statistiques. Cette lecture non-linéaire questionne et enrichit l'interprétation des systèmes pluri-sémiotiques complexes que sont les textes.


NOTES

[1] Sur ce logiciel voir la notice d' Etienne Brunet : Hyperbase.
     AVERTISSEMENT : Ne vous désespérez pas si le lien n'est pas opératoire : ce serveur est souvent défaillant.

[2]  Score statistique, test statistique : Le test statistique de l'écart réduit permet d'avoir des faits chiffrés, des données quantitatives pour caractériser un texte (exemple :Le Père Goriot ) par rapport à l'ensemble dont il fait partie (un sous-corpus de Frantext) ; une formule mathématique calcule, à partir des chiffres du nombre total de mots figurant dans le corpus Frantext (le corpus de référence), du nombre total de mots du texte à contraster (le corpus de travail : Le Père Goriot), quels sont les mots qui sont sur-représentés dans Le Père Goriot (par rapport à la probabilité de se trouver dans ce texte) . A chacun des mots sélectionnés par le test est affecté un chiffre, son score : à partir du score 3, on considère que le mot est sur-représenté, et spécifique à ce texte, pour des raisons de "sens" qu'il faut interpréter.

Test de l'écart réduit : de formule

p est le rapport du nombre d'occurrences du corpus de travail, au nombre d'occurrences du corpus de référence. L'écart réduit permet d'apprécier la déviation d'une fréquence observée (Fobs.) par rapport à la fréquence théorique (Fthéor.) (Fthéor *p) qu'elle devrait avoir si l'on fait l'hypothèse que les mots se répartissent au hasard dans un texte (plus le score d'écart réduit est élevé, moins la présence s'explique par le hasard).

Principe de la sélection par le test statistique :

[3] La base Balzac, constituée par Etienne Brunet, est une base de données expérimentale qui donne accès provisoire et gratuit à la quasi totalité de la Comédie Humaine

[4] Bruit: Dans le traitement automatique des documents, des textes, on nomme "bruit" les réponses non pertinentes fournies par la machine. La machine ne reconnait que des "suites de lettres" (ce sont des "caractères" comme dans caractères typographiques, mais au sens informatique, un caractère est une combinaison de chiffres binaires, cf. le code Ascii) ou un signe isolé (!), une lettre isolée (o), précédés et suivis d'un "blanc", ou espace : si on veut pouvoir lui demander "étudiant" en tant que substantif, il faut avoir au préalable mis, sur tous les mots du corpus, des étiquettes, des annotations, où sont précisées les catégories grammaticales (on parle alors de corpus étiqueté, ou enrichi).

[5] Dans la fonction "spécificités" de la Base Balzac sont donnés les résultats du test statistique de l'écart réduit, qui contraste :
- soit l'ensemble des "mots" de la base Balzac sur le corpus de référence des textes des XIXè et XXè siècles de
Frantext, la base textuelle de l'Institut National de La Langue Française : ce sont les "mots spécifiques" à Balzac, à La Comédie Humaine (à interpréter en contexte)
- soit les mots de chaque texte de La Comédie Humaine sur l'ensemble de cette œuvre ("mots spécifiques" à tel texte)
Les deux sortes de tri apportent des résultats complémentaires dans l'interprétation des structures textuelles (pour des résultats de tri statistique effectué sur le corpus Roman 1830-1970 de Frantext, voir
dans la partie 3 Lecture Méthodique et Thématique ).

[6] Ces programmes ont été mis au point à l'Institut National de la Langue Française par l'auteure et l'informaticien J. Maucourt pour l'étude du corpus Roman XIXè-XXès. de Frantext. Ils ne figurent pas dans l'actuel  moteur de recherche de cette base textuelle.

[7] Remarque : Les programmes du SAAS éliminent avant le test statistique les noms propres et les mots de fréquence 1 : c'est pourquoi on ne trouve pas dans ce tableau Eugène ou Rastignac, ni froidorama qui n'est attesté qu'une seule fois.

[8] Froitorama :
"Les pensionnaires, internes et externes, arrivèrent les uns après les autres, en se souhaitant mutuellement le bonjour, et se disant de ces riens qui constituent, chez certaines classes parisiennes, un esprit drôlatique dans lequel la bêtise entre comme élément principal, et dont le mérite consiste particulièrement dans le geste ou la prononciation. Cette espèce d'argot varie continuellement. La plaisanterie qui en est le principe n'a jamais un mois d'existence. Un evènement politique, un procès en cour d'assises, une chanson des rues, les farces d'un acteur, tout sert à entretenir ce jeu d'esprit qui consiste surtout à prendre les idées et les mots comme des volants et à se les renvoyer sur des raquettes. La récente invention du Diorama, qui portait l'illusion de l'optique à un plus haut degré que dans les Panoramas, avait amené dans quelques ateliers de peinture la plaisanterie de parler en
rama, espèce de charge qu'un jeune peintre, habitué de la pension Vauquer, y avait inoculée.
- Eh bien !
monsieurre Poiret, dit l'employé au Muséum, comment va cette petite santérama ? Puis, sans attendre sa réponse : Mesdames, vous avez du chagrin, dit-il à madame Couture et à Victorine.
- Allons-nous
dinaire ? s'écria Horace Bianchon, un étudiant en médecine, ami de Rastignac, ma petite estomac est descendue usque ad talones .
- Il fait un fameux
froitorama , dit Vautrin. Dérangez-vous donc, père Goriot ! Que diable ! votre pied prend toute la gueule du poêle.
- Illustre monsieur Vautrin, dit Bianchon, pourquoi dites-vous
froitorama ? il y a une faute, c'est froidorama.
- Non, dit l'employé au Muséum, c'est
froitorama, par la règle : j'ai froit aux pieds."

[9] Telet :
- "Dites-nous votre aventure, demanda Mme Vauquer.
- Hier j'étais au bal chez madame la vicomtesse de Beauséant, une cousine à moi, qui possède une maison magnifique, des appartements habillés de soie, enfin qui nous a donné une fête superbe, où je me suis amusé comme un roi...
-
Telet , dit Vautrin en interrompant net.
- Monsieur, reprit vivement Eugène, que voulez-vous dire ?
- Je dis
telet , parce que les roitelets s'amusent beaucoup plus que les rois.
- C'est vrai : j'aimerais mieux être ce petit oiseau sans souci que roi, parce que... fit Poiret l'
idémiste.
- Enfin, reprit l'étudiant en lui coupant la parole, je danse avec une des plus belles femmes du bal, une comtesse ravissante, la plus délicieuse créature que j'aie jamais vue. Elle était coiffée avec des fleurs de pêcher, elle avait au côté le plus beau bouquet de fleurs, des fleurs naturelles qui embaumaient ; mais, bah ! il faudrait que vous l'eussiez vue, il est impossible de peindre une femme animée par la danse. Eh bien ! ce matin j'ai rencontré cette divine comtesse, sur les neuf heures, à pied, rue des Grès. Oh ! le cœur m'a battu, je me figurais...
- Qu'elle venait ici, dit Vautrin en jetant un regard profond à l'étudiant. Elle allait sans doute chez le papa Gobseck, un usurier. Si jamais vous fouillez des cœurs de femmes à Paris, vous y trouverez l'usurier avant l'amant. Votre comtesse se nomme Anastasie de Restaud, et demeure rue du Helder. A ce nom, l'étudiant regarda fixement Vautrin. Le père Goriot leva brusquement la tête, il jeta sur les deux interlocuteurs un regard lumineux et plein d'inquiétude qui surprit les pensionnaires.
- Christophe arrivera trop tard, elle y sera donc allée, s'écria douloureusement Goriot."

[10] Ro :
- "Dites donc, lui cria le comte quand elle rentra, ma chère, la terre où demeure la famille de monsieur n'est pas loin de Verteuil, sur la Charente. Le grand-oncle de monsieur et mon grand-père se connaissaient.
- Enchantée d'être en pays de connaissance, dit la comtesse distraite.
- Plus que vous ne le croyez, dit à voix basse Eugène.
- Comment ? dit-elle vivement.
- Mais, reprit l'étudiant, je viens de voir sortir de chez vous un monsieur avec lequel je suis porte à porte dans la même pension, le père Goriot.
A ce nom enjolivé du mot
père, le comte, qui tisonnait, jeta les pincettes dans le feu, comme si elles lui eussent brûlé les mains, et se leva.
- Monsieur, vous auriez pu dire monsieur Goriot ! s'écria-t-il.
La comtesse pâlit d'abord en voyant l'impatience de son mari, puis elle rougit, et fut évidemment embarrassée ; elle répondit d'une voix qu'elle voulut rendre naturelle, et d'un air faussement dégagé : Il est impossible de connaître quelqu'un que nous aimions mieux ... Elle s'interrompit, regarda son piano, comme s'il se réveillait en elle quelque fantaisie, et dit : - Aimez-vous la musique, monsieur ?
- Beaucoup, répondit Eugène devenu rouge et bêtifié par l'idée confuse qu'il eut d'avoir commis quelque lourde sottise.
- Chantez-vous ? s'écria-t-elle en s'en allant à son piano dont elle attaqua vivement toutes les touches en les remuant depuis l'ut d'en bas jusqu'au fa d'en haut. Rrrrah !
- Non, madame. "
Le comte de Restaud se promenait de long en large.
- C'est dommage, vous êtes privé d'un grand moyen de succès.
-
Ca-a-ro, ca-a-ro, ca-a-a-a-ro, non du-bita-re , chanta la comtesse.
En prononçant le nom du père Goriot, Eugène avait donné un coup de baguette magique, mais dont l'effet était l'inverse de celui qu'avaient frappé ces mots : parent de Mme de Beauséant. Il se trouvait dans la situation d'un homme introduit par faveur chez un amateur de curiosités, et qui, touchant par mégarde une armoire pleine de figures sculptées, fait tomber trois ou quatre têtes mal collées. Il aurait voulu se jeter dans un gouffre. Le visage de madame de Restaud était sec, froid, et ses yeux devenus indifférents fuyaient ceux du malencontreux étudiant."


Vous pouvez adresser vos commentaires et suggestions àevelyne.bourion@free.fr

©  juillet 1999 pour l'édition électronique.

Référence bibliographique : BOURION, Evelyne. ALire autrement "Le père Goriot". Texto ! juillet 1999 [en ligne]. Disponible sur : <http://www.revue-texto.net/Corpus/Publications/Bourion/Bourion_Lire.html>. (Consultée le ...).
 

Mis à jour en mars 2002.