Denise Malrieu & François Rastier : GENRES ET VARIATIONS MORPHOSYNTAXIQUES

--- 558 ---

3. Les genres, champs génériques et discours prédéfinis peuvent-ils se différencier automatiquement ?

Nous exploiterons successivement plusieurs approches, car dans un souci méthodologique, nous souhaitons les hiérarchiser.

3.1. L'approche univariée

Evaluons dans un premier temps la distance entre genres, champs génériques et discours par le nombre de variables qui les différencient de façon statistiquement significative (au moyen du test de Scheffe) : sans prendre parti a priori sur le poids relatif des variables dans la différenciation des genres, on admettra que plus leur nombre est grand, plus sont éloignées les classes comparées. Cela permet de caractériser les spécificités d’une classe et de vérifier que les distances entre discours sont plus élevées que les distances entre champs génériques, lesquelles sont à leur tour plus grandes que les distances entre les genres.

3.1.1. Différenciation des discours : l'exemple du discours juridique

Les variables qui opposent le discours juridique aux autres sont en premier lieu les variables liées au discours impersonnel, par opposition au dialogue représenté (cf. infra, tableau 6, le facteur 1), en très fort déficit pour le discours juridique. Pour détailler ces différences, on peut sélectionner les variables distinctives de la classe étudiée à partir des valeurs absolues des valeurs-test supérieures à 1, 2. Ainsi pour le discours juridique, on obtient le haut du tableau suivant :

En comparant ensuite le discours juridique avec l’ensemble de tous les autres, on peut esquisser une première interprétation des spécificités, en les regroupant sous des catégories comme défini vs indéfini   (voit Tableau 2 ci-dessous). On relève dans le discours juridique le poids des substantifs par rapport aux verbes, les déterminants définis, les verbes à COD obligatoire (liés vraisemblablement au discours normatif qui se doit d'être explicite), la détermination par les compléments circonstanciels et subordonnées, probablement liés à l'explicitation des conditions d'application des lois et règlements. Si toutes ces spécificités ne sont pas également interprétables, la plupart convergent pour faire du discours juridique écrit un modèle de discours thétique, conforme à sa fonction normative. Ces spécificités confirment par exemple que le discours juridique écrit se singularise d’abord par son déficit de marques de l’énonciation représentée, comme les pronoms personnels de première et seconde personne, ou les ponctuations « émotives » comme les points d’exclamation et de suspension.

--- 559 ---

D. juridique > tous les autres

D. juridique < tous les autres

 

Abstrait / concret:

% noms abstraits, noms comm uniqt abstraits, adj tjrs avec nom abstrait, % Vb à COI uniquement concret, Vb à COD uniqt concret

Abstrait / concret :

% Vb à COD uniqt abstrait; Vb à COI pouvant être abstrait, Vb à sujet pouvant être ou uniqt concret, noms commun animal; % noms concrets Noms com. de lieu

Discours normatif :

% Vb au subjonctif présent, subjonctif imparfait, Vb au conditionnel, adj épithètes, % adj de temps, Vb à COD uniqt humain, % Vb de temps

Indices d'interlocution : adverbes d'affirmation, points d'exclamation, Vb à l'impératif, % phrases interrogatives, % points de suspension

Adjectifs antéposés

Défini :

% articles définis/ déterminants, % articles définis / mots, articles définis / articles; % noms propres

Indéfini :

Adj indéfinis / mots, articles indéfinis / déterminants

Discours impersonnel :

% Vb 3PS, Adj poss 3PS, % Vb tjrs impersonnels

 

Discours « personnel » :

% pron pers 1PP / pron pers sujets, Vb 1PP, phrases exclamatives, vb et pronom pers à la 2PS, noms com d'adressage, Vb pronominaux, Adj poss 2 PS, pronom pers 1PS / sujets, Vb 2PP, pronom poss 1PS; Vb 1PS, Noms propres humains, % pronoms / sujets, % pronoms pers / sujets, Adj poss 1PS

Discours descriptif :

% Vb au passé composé, % noms communs épithètes

Discours narratif :

Vb au subjonctif passé, au futur antérieur, au passé simple, à l'imparfait. Adjectifs interrogatifs

Nominal : % substantifs / mots signifiants, moyenne substantifs / prop, moyenne lettres /mot, % dét / mots

Verbal  :

% Vb / mots signifiants

Registre élaboré : % propositions subordonnées / prop, % phrases avec au moins une subordonnée.

% mots ambigus grammaticalement, noms com avec homonymes; % de prop indépendantes

Discours spécialisé

Discours non spécialisé :

% mots très courants, % mots du vocabulaire de base, Vb à sujet animal, Vb à COD animal ou animé

3.1.2. La comparaison des discours et des champs génériques

Si l'on fait le total des différences significatives liées à un discours ou à un champ générique, on constate que les classes qui se différencient le plus sont par ordre

--- 560 ---

décroissant : le discours juridique, les textes narratifs, le théâtre, les essais, la poésie, et les écrits scientifiques.

Le pourcentage de variables significativement différentes par paires de champs génériques varie de 48 à 89%, comme le montre le tableau ci-dessous. Le discours juridique totalise 909 comparaisons significatives contre 733 pour le discours scientifique. Les différences entre discours (ici juridique, scientifique, essayiste, littéraire) l’emportent sur les différences entre champs génériques que nous avons détaillés dans le discours littéraire : poésie, théâtre, récits.

Champs
génériques

J/R

J/H

J/P

J/T

J/E

R/H

R/P

R/T

R/E

H/P

H/T

H/E

P/T

P/E

T/E

% DS

88,7

67,0

77,8

78,7

83,0

70,9

67,0

84,3

77,8

61,7

70,9

48,3

76,1

68,3

76,5


 

J

H

E

R

P

T

% DS

79

63,7

70,7

77,7

70,1

77,3

Ces indications restent partielles, car nous privilégions dans cette étude les données quantitatives calculées sur les variables. Le travail d’interprétation qualitative n’en est qu’à ses débuts, car il demande une réflexion spécifique sur les regroupements de variables, en fonction des composantes textuelles et des effets mimétiques induits par leur interaction.

3.1.3. La comparaison entre champs génériques et genres

Pour la mener, nous avons comparé systématiquement les différences entre champs génériques et les différences au sein d’un même champ générique, celui des genres narratifs : (i) Le cas où toutes les paires se différencient se rencontre pour cinq variables entre les champs génériques mais pour aucune entre les. genres narratifs (ii) La répartition des variables en fonction du nombre de paires de classes significativement différentes n'est pas la même pour les champs génériques et pour les genres narratifs ; dans le premier cas, peu de variables ne différencient que peu de paires alors que beaucoup de variables restent neutres à l’égard des genres narratifs, si bien que 61 variables ne différencient aucune paire, comme l’atteste le tableau ci-dessous :

--- 561 ---

Champs génériques

 

Genres narratifs

Nb de
Paires S
pr 1
variable

Nb de Variables
répondant au
critère col.1

Nb
cumulés

% cumulés

 

Nb
Variables
répondant
critère col.1

Nb
Cumulés

% Cumulés

Ttes S

5

5

2,17

 

0

0

0

14

22

27

11,7

 

0

0

0

13

38

65

28,3

 

0

0

0

12

49

114

49,6

 

2

2

0,86

11

45

159

69,1

 

6

8

3,43

10

18

177

77

 

7

15

6,44

9

16

193

83,9

 

12

27

11,6

8

10

203

88,3

 

23

50

21,5

7

15

218

94,8

 

19

69

29,6

6

5

223

97

 

29

98

42,1

5

3

226

98,3

 

32

130

55,8

4

1

227

98,7

 

16

146

62,7

3

1

228

99,1

 

14

160

68,7

2

1

229

99,6

 

9

169

72,5

1

0

229

99,6

 

3

172

73,8

0

1

230

100

 

61

233

100

Au niveau des champs génériques et à celui des genres , le nombre et la répartition des variables montrant une différence significative ne sont pas du tout les mêmes. On vérifie que les champs génériques se différencient entre eux plus que les genres.

3.1.4 . La comparaison des genres : l'exemple des genres narratifs

Comme plus haut, on n’a retenu que les différences significatives au seuil de .05 au test de Scheffe. Si l'on décompte les comparaisons significatives pour l'ensemble des variables, le roman policier se distingue le plus nettement des autres genres narratifs (515 comparaisons significatives) ; puis viennent les mémoires (373), le roman "sérieux" (340), et le récit de voyage (336), enfin la nouvelle (251) et le conte (217). Le policier se différencie d'abord du roman sérieux (par 52% de différences significatives), puis des mémoires (42%) puis du récit de voyage (40%), puis de la nouvelle. Les deux genres les plus proches sont la nouvelle et le conte (9% de différences significatives) et le roman "sérieux" et la nouvelle (7,3%). Voici deux exemples plus détaillés.

--- 562 ---

a) Nouvelles et contes

Alors que le roman « sérieux » et la nouvelle ne diffèrent que par très peu de variables (17 sur 254, soit le minimum dans l’ensemble des genres), la nouvelle et le conte diffèrent entre eux par 19 variables. La nouvelle est ainsi un peu plus près du roman que du conte ; mais cette différence reste négligeable, et en diachronie le conte tend d’ailleurs à se confondre avec la nouvelle (cf. les recueils de Contes et nouvelles ) , du moins dans notre corpus où ces deux genres sont pour l’essentiel représentés dans la même période « tardive » (XIX e ).

b) Roman « sérieux » et roman policier

Comme notre corpus est essentiellement constitué de romans, romans "sérieux" et romans policiers en constituent la "norme" quantitative. La comparaison de ces deux genres doit tenir compte du décalage diachronique entre le corpus de romans sérieux et le corpus de romans policiers : ce genre récent est surtout représenté dans la seconde moitié du XX e siècle, et l’on ne peut attribuer toutes les variations à la seule différence des genres.

Le roman sérieux et le roman policier diffèrent par 121 variables, soit 7 fois plus que les nouvelles et les contes. On peut donc faire l’hypothèse qu’il s’agit de deux genres différents, et non de deux sous-genres [15] , ce que confirme la différence des pratiques de production et de lecture, alors qu’il n’en va pas de même pour la nouvelle et le conte littéraire.

--- 563 ---

R. policier > R. sérieux

R. sérieux > R. policier

Interlocution représentée :

% de § et phrases de dialogue; phrases interrogatives, points d'interrogation, adj interrogatifs / déterminants

% pronoms /sujets, pronoms pers/sujets, pronoms personnels et possessifs 2PS, Verbes à la 2PS.

 

Moindre complexité de la période  : moins d'enchassements, moins de relatives mais plus de subordonnées conjonctives

% phrases avec au moins une proposition subordonnée

% de prop subordonnées / prop.

Interlocution représentée :

Complexité et longueur du §.

Complexité et longueur de la phrase: conjonctions de coordination et subordination, pronoms relatifs, prop relatives, moyenne prop par phrase, moyenne pronoms par proposition.

 

Complexité supérieure de la période   Complexité de la proposition: % prop incises, prop avec COD, COI ou CC de temps ou CC ni temps ni lieu, prépositions, pronoms poss / mots.

Complexité du syntagme : % noms communs appartenant à un GN, adj épithète, adv précédant un adj.

Ponctèmes :

% points et points de suspension

Ponctèmes :

Virgules, points virgules

Positions dialectiques:

Plus d'action, % mots signifiants/mots, % Vb; % noms propres, abréviations, noms propres humains; noms composés.

 

Plus de concret, moins d'humain : noms concrets; adj avec nom concret, adj de couleur, adj tjrs avec nom abstrait

 

Plus de commentaires

% substantifs, adjectifs, noms communs, moyenne subst, adj, adverbes par prop, prop participiales.

noms abstraits; noms comm. Humains ou humanoïdes, nom comm. animal, adj avec subst humain ou animé, Vb à sujet concret, noms comm. de profession

Déterminants:

Articles indéfinis /mots et /déterminants, articles définis / articles, adj cardinaux, adj interrogatifs

Déterminants:

% déterminants / mots, Adj indéfinis / dét; adj possessifs / mots et / dét, adj démonstratifs

Temps :

Passé composé

Temps :

Imparfait, futur, conditionnel,

Circonstances  :

adj de lieu, noms comm de lieu, adv de manière

Circonstances  :

Adv de temps, prop avec CC de temps, adv de quantité, adv d'affirmation

Personnes :

Adj poss 1PS, 1 PP, pronoms pers et poss et verbes 2 PS ; Pronoms poss 3PS

Personnes :

Pronom poss 1PP et 3PP, Adj poss 3 PS, 2 PP, pronoms pers 1 PP, Verbe 3 PP

On peut ainsi caractériser, minimalement, le roman policier : caractère bref et ramassé de la phrase, compatible avec des propositions subordonnées complétives ; importance du dialogue ; importance de l'action (par opposition aux analyses et commentaires) ; caractère objectiviste du policier, par contraste avec le roman psychologique. La technique narrative diffère du roman « sérieux », où dominent l'imparfait, le présent et le passé simple, l'imparfait jouant un rôle clé dans la création du monde subjectif de la remémoration, alors que le récit policier privilégie le passé composé qui domine à l'oral et dans les dialogues, et présente le compte rendu d'évènements "réels", non par un narrateur omniscient mais à travers le récit des personnages.

L'approche univariée a permis de préciser les différences et proximités entre genres prédéfinis ; elle a montré que les distances en termes de nombre de différences significatives variaient selon le niveau de la hiérarchie des genres, champs génériques et discours. Fait notable, alors qu’on pouvait penser que certaines variables sont cruciales pour différencier des genres, par exemple celles qui intéressent les temps verbaux, ces « intuitions » sont infirmées : par exemple le futur ni le présent ne différencient le théâtre du discours scientifique et du discours juridique [16]. Il faut donc analyser les corrélations entre variables sur le corpus entier pour distinguer les groupements de variables qui constituent des dimensions différenciant les sous-ensembles du corpus.

--- 564 ---

3.2. Approche multivariée

3.2.1. L'analyse en composantes principales

Les composantes principales sont des combinaisons linéaires des variables d’origine, et l'Analyse en composantes principales a pour but de rendre compte de la plus grande part possible de la variance totale par le nombre le plus réduit possible de variables. On transforme donc en un nouvel ensemble de variables les composantes principales, qui sont non corrélées, et l’on réduit ainsi un grand nombre de variables à un petit nombre de dimensions. Nous l’avons effectuée sur l'ensemble du corpus sans sélection a priori des variables actives : les facteurs 1 à 40 expliquent

--- 565 ---

80% de l'inertie, les 10 premiers facteurs 60%, le premier facteur expliquant 39% de la variance.

Le premier facteur fait apparaître l'existence de corrélations dans les dialogues représentés entre les marques d’interlocution, les déictiques liés aux personnes de l'interlocution, l’importance des pronoms personnels, la dominance de la première personne du singulier par rapport à la troisième, la dominance des verbes par rapport aux noms et adjectifs, l’emploi d'un vocabulaire de base (mots courants et très courants), les mots et phrases brèves, les propositions simples, les adjectifs antéposés, les articles indéfinis. Selon ce premier facteur, les valeurs positives sont maximales pour le théâtre (comédie et drame), puis le roman sérieux, puis les mémoires ; les valeurs négatives sont maximales pour le discours juridique, puis le scientifique, puis les essais. Soit, en distinguant successivement les corrélations positives et les corrélations négatives :

FACTEUR1

    Intitulé de la variable

0,911

    % de pronoms parmi l'ensemble des sujets

0,895

    % de pronoms personnels parmi l'ensemble des sujets

0,850

    % de verbes par rapport au total des mots

0,799

    % d'adjectifs possessifs à la 1e personne du pluriel/ adj poss

0,787

    % des verbes à sujet pouvant être animal

0,787

    % des verbes à COD pouvant être abstrait

0,777

    % d'adjectifs antéposés

0,747

    % d'adjectifs ayant des homonymes

0,735

    % de noms communs ayant des homonymes

0,726

    % des verbes à COD pouvant être animé

0,701

    % d adverbes par rapport au total des mots

0,692

    % d'adjectifs possessifs / déterminants

-0,706

    % de verbes à la 3e personne du pluriel

-0,749

    moyenne mots/proposition

-0,776

    moyenne adjectifs/proposition

-0,791

    % d'articles définis / articles

-0,793

    % de déterminants par rapport à l ensemble des mots

-0,797

    % de substantifs par rapport au total mots signifiants

-0,801

    % de prépositions par rapport à l ensemble des mots

-0,825

    % d'adjectifs possessifs à la 3e personne du singulier

-0,834

    % des verbes à COD uniquement concret

-0,887

    % d articles définis par rapport à l ensemble des mots

-0,897

    moyenne lettres/mot

-0,905

    moyenne substantifs/proposition

Les facteurs suivants sont moins significatifs, et nous ne mentionnerons que le deux premiers. Le deuxième facteur concerne essentiellement la dimension abstrait / concret, l'abstraction étant corrélée positivement avec la complexité de la phrase et la transitivité directe et indirecte des verbes et négativement avec les verbes pronominaux et le temps de l'imparfait. Le troisième facteur touche la complexité de la période et de la phrase, corrélée positivement avec les pourcentages de mots outils, de compléments directs et indirects, de groupes nominaux avec en coordonnées positives les essais philosophiques, Saint-Simon, Sade, Proust, Bourdieu, et en coordonnées négatives, le discours juridique, la poésie, le roman policier.

3.3. La classification hiérarchique ascendante

Nous avons voulu tester si une classification automatique non supervisée à partir de l'Analyse en composantes principales et par la méthode de Ward pouvait retrouver les champs génériques prédéfinis.

3.3.1. Le haut de la classification

Dans le haut de la hiérarchie, la classification hiérarchique ascendante opère un découpage en sept classes. Elles se différencient de façon significative sur les variables qualitatives (auteur, période, champ générique et genre). Un premier groupe (G7), le discours juridique, s'oppose à tous les autres. Puis viennent le théâtre(G4) et la poésie (G3) qui s’opposent au reste. Ensuite, un groupe (G2) composé essentiellement d'essais et écrits scientifiques et techniques s'oppose au groupe (G5) composé de textes narratifs du XX e (romans « sérieux », romans policiers et mémoires) et au groupe (G6) de la même période avec une plus forte proportion de policiers. Enfin, le groupe (G1), composé de romans du XVIII e et de la première moitié du XIX e , s'oppose au groupe précédent.

--- 566 ---

Figure 2. Classification hiérarchique ascendante.
Première moitié d’un siècle : a ; seconde moitié d’un siècle : b.

L’opposition entre discours juridique d’une part, discours littéraire et scientifique d’autre part, domine d’abord l’opposition entre champs génériques (théâtre, poésie, récits), puis l’opposition entre romans et essais. La classification ascendante hiérarchique retrouve donc les différences entre discours, puis entre champs génériques. En revanche, au niveau immédiatement inférieur, elle ne retrouve pas les divisions entre genres narratifs, et conduit notamment à une tripartition des récits, en particulier des romans « sérieux » . Pour en rendre compte, on peut proposer cette hypothèse : les romans « sérieux » [17] du Groupe 1 de la classification correspondent au roman du XVIII e et XIX e , qui partage des traits avec les essais (philosophiques et politiques [18]) ; les romans «sérieux» du Groupe 5 sont des romans modernes proches du roman policier (principalement du début du XXe), les romans « sérieux » du Groupe 6 sont aussi des romans modernes mais plus autobiographiques, d'où leur rapprochement avec les récits de voyages et les mémoires. Il restera à éclaircir la bipartition des romans policiers qui se répartissent de façon inégale dans les classes 5 et 6 : ces sous-groupes du roman paraissent correspondre à trois esthétiques différentes : romans à idées, romans d’aventures (dont roman policier), romans récits de vie. [19]

--- 567 ---

Si la classification ascendante hiérarchique ne distingue pas « correctement » les genres narratifs, on peut avancer deux raisons à cela : d’une part, les genres narratifs, surtout les romans, occupent une place prépondérante dans le corpus et donc on ne dispose pas d’ensemble complémentaire suffisamment étendu pour jouer le rôle d’un corpus de référence contrastive ; d’autre part, les romans, et pour une moindre part les autres genres narratifs, sont des genres hétérogènes ou du moins intégrants : l’esthétique même du roman le conduit à inclure des dialogues, des lettres, des portraits, des descriptions, ce qui affaiblit ses spécificités au palier d’analyse choisi.

En tenant compte des résultats de l’analyse factorielle, et des faibles différences entre certains genres narratifs, nous chercherons si à ce niveau de la classification les variations de techniques narratives ne l’emportent pas sur les variations de genres, alors même qu’au niveau le plus bas de la classification les distinctions de genres restent généralement valides.

3.3.2. Le bas de la classification

Par proximité décroissante, les premières classes formées automatiquement regroupent :
(i) les mêmes œuvres (mais avec des titres différents par erreur ou doublons),
(ii) des œuvres de même auteur et de même genre,
(iii) des œuvres de même genre et de même époque. Voici des exemples probants (deux œuvres sur une même ligne constituent une classe) :

Doublon

 

Harmonies poétiques

Les harmonies poétiques

Œuvres de même auteur

 

Balzac

 

La muse du département

Les illusions perdues

La vieille fille

Le curé de village

Druon

 

Les rois maudits (2. La reine étranglée)

Les rois maudits (3. Les poisons de la couronne)

Frison-Roche

 

  La grande crevasse

Premier de cordée

Michaux

 

  La connaissance par les gouffres

L'infini turbulent

Molière

 

L'Ecole des maris

Les femmes savantes

Le bourgeois gentilhomme

Le malade imaginaire

Œuvres d'auteurs différents

 

Laclos

Mme de Sévigné

Les liaisons dangereuses

Lettres choisies

--- 568 ---

Ces exemples, que nous pourrions multiplier, témoignent que les appariements sont souvent très fins : chez le même auteur, ils rapprochent les œuvres de même genre ; au sein du même genre, ils rapprochent les œuvres appartenant à la même série ou saga. Même l’exemple relevé plus haut de genres et d’auteurs différents rapproche des textes de même facture épistolaire (les Lettres de Sévigné et Les liaisons dangereuses ).

Sur les 60 premières classes formées dans le bas de la classification, qui consistent en paires d'œuvres (donc sur 120 titres), on compte ainsi 4 doublons (œuvres enregistrées par erreur sous deux titres différents), 3 désaccords de période historique (intervalle de 50 ans), 4 désaccords de champ générique, 8 désaccords de genre, et seulement 9 cas d'auteurs différents, pour l’essentiel d’ailleurs parmi les romans policiers, où les différences d’auteurs sont moins affirmées que dans les romans « sérieux » [20]. On pourrait mettre au défi un expert littéraire de parvenir « à l’aveugle », en ignorant les données de date, de genre et d’auteur, à des regroupements aussi pertinents. Sur les 50 premiers appariements, 11 regroupent des parties de la même œuvre ou de la même série ou saga ; 13 sont datés de la même année ; 31 sont de la même décennie [21]. Du moins a-t-il fallu un patient travail seulement pour contrôler leur bien-fondé. Ce défi s’adresse a fortiori à un expert linguiste qui n’opérerait que sur des étiquettes morphosyntaxiques, sans accéder aux chaînes de caractères correspondantes…

Bien que peu nombreux, les désaccords croissants reflètent des degrés de caractérisation : faible pour la période historique, médiocre pour le champ générique, fort pour le genre, très fort pour l’auteur. On décompte 45 paires sur 60 en accord sur les 4 critères, 50 paires en accord sur la période, le champ générique et le genre, 51 en accord sur le champ générique et le genre, 48 en accord sur la période et l’auteur. On voit que les trois quarts des paires de textes concordent sur les quatre critères retenus. Les accords sur le champ générique et le genre l’emportent en nombre : cinq sixièmes des paires de textes. Soit :

Nombre d’accords

Période

Champ générique

Genre

Auteur

45

48

50

51

+

+

+

+

 

+

+

+

 

+

+

+

+

Tableau 7. Accords au sein des paires de textes

--- 569 ---

Examinons par contraste 50 classes formées dans le milieu de la classification : le nombre d'œuvres du même auteur chute, mais les accords restent forts pour le champ générique, puis pour la période, puis pour le genre. On relève par exemple ces regroupements de classes :

Classe 2058 :

Classe 1532 :

On retrouve dans ces classes l’unité de genre, et secondairement l’identité d’auteur. Le critère d’auteur reste le plus faible à tous les niveaux de la classification : comme il s’agit ici de textes littéraires, cela affaiblit la thèse romantique ordinaire que l’auteur reste toujours le critère déterminant, qui l’emporte sur tous les autres.


NOTES

[15] page 562 : Pour une discussion et un approfondissement, cf. Beauvisage, 2001.

[16] page 562 : C’est là une limite de l’approche morphosyntaxique : une analyse sémantique montrerait que les acceptions de ces temps varient nettement, voire s’opposent, comme le futur prescriptif et le présent d’habitude du discours juridique s’opposent aux emplois du futur éventuel et du présent ponctuel dans le discours littéraire.

[17] page 566 : Ce n’est pas surprenant, car traditionnellement le roman est un genre très divers, rhapsodique et attrape-tout, comme le note déjà le curé au chapitre 47 du Don Quichotte.

[18] page 566 : Cf. Les Misérables , roman qui alterne des chapitres romanesques et des chapitres essayistes.

[19] page 566 : L’opposition entre « points de vue » et notamment entre subjectivité et objectivité est traditionnelle dans les études sur les techniques narratives ; par exemple on oppose le récit psychologique dont le narrateur est externe à l’action au récit psychologique dont le narrateur est interne à l’action, et au récit non psychologique.

[20] page 568 : Ces chiffres ne sont qu’indicatifs et pourraient faire l’objet d’une correction statistique, car la variable auteur ne sélectionne que de petites classes.

[21] page 568 : Cela semble indiquer qu’au niveau de discrimination atteint, la sensibilité aux variations diachroniques est importante, d’autant plus qu’à la différence des règles linguistiques, dont la diachronie se mesure à l’échelle du siècle, la vitesse d’évolution des normes de discours, de genre et de style est évidemment plus rapide et se mesure à l’échelle de la décennie.