Denise Malrieu & François Rastier : GENRES ET VARIATIONS MORPHOSYNTAXIQUES

4. Au-delà ou en-deça des genres ?

Pour mettre à l’épreuve ces résultats, cherchons si d’autres critères de classification et d’autres regroupements de variables ne seraient pas productifs : nous aborderons l’énonciation représentée sous deux aspects : la représentation de l’interlocution et les régimes de subjectivité et d’objectivité.

4.1. La représentation de l’interlocution et ses transpositions

Comme l’analyse multivariée a bien confirmé les distinctions entre discours et entre champs génériques, mais non celles qui opposent les genres narratifs entre eux, on peut se demander si le premier facteur, lié aux dialogues, et qui capte 40% de la variance, n’est pas déterminant : il refléterait des différences de techniques mimétiques dans les genres narratifs. De fait, la représentation de l’interlocution semble partout discriminante de façon cruciale : elle singularise la littérature par rapport aux autres discours, et sépare le théâtre de la poésie et du roman. Au sein même du théâtre, elle gouverne l’opposition entre comédies et tragédies. On la retrouve au sein même des tragédies [22]: Beaudouin, (2000, ch. VIII) établit ainsi deux régimes distincts chez Racine, les dialogues et les récits, et nous résumons ainsi son analyse :

--- 570 ---

    Dialogue

Récit

Sémantique

 

    Amour

Mort

Morphologie

 

    Verbes modaux
    Marqueurs de modalisation
    Interjections
    Pronoms de 1
    e et 2 e personne
    Formes d’adresse (Monsieur) 




Pronoms de 3
e personne
Noms propres  

Prosodie

 

    Rythmes irréguliers
    Rythmes iambiques 

Rythmes réguliers
Rythmes anapestiques [23]

Enfin, nous l’avons vu, le critère d’interlocution représentée rapproche — c’est le seul cas d’erreur de classification sur plus de deux critères (cf. supra , 3.3.2.) — des textes séparés tant par le genre que par la période : un roman par lettres, Les liaisons dangereuses , et les Lettres de Madame de Sévigné .

Hors de notre corpus, dans le discours religieux, on peut retrouver le caractère discriminant de l’énonciation représentée, comme le montre l’étude de David Mealand (1997). En utilisant le logiciel SAS sur le texte grec des Evangiles, notamment celui de Marc, il identifie trois genres, l’épître, l’évangile, l’apocalypse. L’évangile différencie clairement le récit et les paroles du locuteur central ( speech vs narrative). En outre, il se distribue en genres inclus : parabole, récit de miracle ( healing narrative), apophtegme (dit rapporté) et logia (dits), autres récits. Soit ces exemples de répartitions spécifiques, à quatre niveaux :

Figure 2. L’interlocution représentée à quatre niveaux de la classification

Le premier niveau correspond à celui du discours, le second à celui des champs génériques, le troisième celui des genres, le quatrième à celui des « séquences » ou configurations (sous-genres inclus).

Il est vraisemblable que les effets de l’opposition entre les modes d’interlocution représentée soient encore accentués par la sensibilité des variables retenues : l’oral représenté se singularise ainsi par ses ponctuations, son régime pronominal, etc. Mais, même ainsi accusée, l’opposition n’en demeure pas moins à problématiser.

--- 571 ---

4. 2. Les positions dialogiques : objectivité vs subjectivité

L’énonciation représentée relève de la composante dialogique de la sémantique textuelle (cf. Rastier, 1989, ch. VIII) et elle peut être caractérisée à plusieurs niveaux. L’opposition générale entre l’oral et écrit est transposée au sein de l’écrit par celle qui oppose le dialogue et le récit. Elle oppose ensuite, au sein du récit, l’objectivité et la subjectivité. L’objectivité semble avoir pour indices la troisième personne, l’objectivation par le substantif, les mots longs (généralement monosémiques) et les propositions longues ; mais aussi les temps et modes thétiques (indicatif notamment) et le défini (déterminants définis). En revanche, la subjectivité serait représentée par les pronoms personnels sujets ; les adjectifs antéposés évaluatifs. Les temps et modes hypothétiques sont plus fréquents, de même que les déterminants indéfinis. Voici, en somme, un tableau des régularités qui nous ont paru notables :

 

Régime subjectif

Régime objectif
 

Registre et ton

Oral ou familier
Adj. Antéposés courts

Ecrit et savant
Adj. postposés

Modalités

Hypothétique
Points d’exclamation, suspension, interrogation

Thétique
Articles définis

Personne

Pr. Pers. 1 e personne
Pr. Pers. Sujet

Pronoms 3 e personne

Catégories morphologiques

Verbes
Adverbes

Substantifs
Adjectifs

Prosodie

Brisée
Mots courts

Régulière
Mots longs
Propositions longue
Phrases brèves

Tableau 8. Quelques indices des régimes de l’énonciation représentée

Ce tableau n’indique que des tendances et doit être spécifié selon les discours, champs génériques et genres. Par exemple, la poésie et le discours scientifique se distinguent par un surcroît de substantifs et d’adjectifs. C’est un des indices que leurs textes présentent une vision statique et objective du monde, bien qu’il ne s’agisse évidemment pas du même monde : le discours scientifique relève du réalisme empirique, et la poésie du réalisme transcendant.

--- 572 ---

Bien entendu, aucun indice n’est nécessaire et suffisant pour caractériser un régime d’autant plus que l’on a affaire non pas à des traits isolés, mais à des sous-systèmes [24]. Il reste donc difficile de parler de régime indépendamment des genres, voire, à l’intérieur du même texte, des configurations comme la description ou le dialogue : ainsi, la description sera généralement en régime objectif, et les dialogues en régime subjectif. La caractérisation des régimes reste ainsi une direction de recherche.

4.3. Et si Benveniste avait eu raison ?

Dans un article illustre (1966, pp. 237 sq), mais dont on a négligé la généalogie platonicienne, Benveniste oppose l’usage des historiens ( L’histoire grecque de Glotz) et des romanciers ( Gambara de Balzac), pour distinguer entre deux régimes d’énonciation, l’ histoire et le discours . Le critère reste celui qu’utilisait Platon ( qui parle ?) : « personne ne parle ici » écrit Benveniste à propos du régime d’énonciation qu’il appelle histoire [25] . En revanche, dans le discours quelqu’un parlerait — c’est Balzac, apparemment confondu avec le narrateur de Gambara . Si

--- 573 ---

mal fondée que soit cette distinction, son succès considérable suggère qu’elle met en évidence soit une vérité scientifique, soit un préjugé majeur dont la mise en évidence aurait de toutes façons un intérêt scientifique. Dans cette seconde hypothèse, on peut souligner la portée culturelle de cette opposition, qui a déterminé les modes discursifs occidentaux et la typologie des « genres » (ou modes d’énonciation) qui va de Platon et Aristote jusqu’à Diomède, puis chez les modernes de Hegel jusqu’à Benveniste. En revanche, dans la première hypothèse, il conviendrait d’examiner la portée anthropologique de l’opposition : le « discours », à régime subjectif, correspondrait au couplage de l’individu avec son environnement social, car il suppose une interlocution qui se traduit par des représentations diverses de l’oral ; l’ « histoire », à régime objectif, au couplage avec la zone distale que décrivent chacun à leur manière les discours scientifique, artistique et religieux. L’opposition dialogique entre les deux régimes de l’énonciation représentée pourrait être alors étudiée dans le cadre de la théorie des zones anthropiques (cf. Rastier, 1996) [26].


5. Perspectives

Les résultats de la classification n’auraient pas pu être interprétés sans un patient travail préalable de classification des genres, champs génériques et discours ; mais a posteriori , ils en confirment le bien-fondé. Ce travail correspond à un étiquetage sémantique global, dans la mesure où les structures textuelles semblent pour l’essentiel sémantiques et où la détermination des genres dépend principalement de critères sémantiques.

À partir des variables morphosyntaxiques dont nous disposons, les trois techniques utilisées, l'analyse univariée, l'analyse en composantes principales et la classification hiérarchique ascendante, concordent pour mettre au jour des différences très significatives tant entre discours qu’entre champs génériques et qu’entre genres. L'amplitude impressionnante de ces variations confirme la diversité des normes linguistiques selon les types de discours et le caractère instituant du genre. Cette diversité insoupçonnée, ou du moins encore trop peu étudiée, constitue évidemment un domaine d’avenir pour la linguistique générale et comparée : après

--- 574 ---

la recherche sur la diversité des langues, il faut en effet étudier la diversité interne de chaque langue, telle qu’elle s’exprime par la diversité de ses usages oraux et écrits. Le travail sériel sur corpus étendus en est évidemment un moyen privilégié.

L’interprétation des variables pose des problèmes délicats, et il faut se garder de projeter directement des catégories interprétatives « massives » sur des variations ou co-variations. Nous ne souhaitons pas reconduire une des ambiguïtés rencontrées par la lexicométrie : comme du mot à la période, puis au texte, on change de palier de complexité (de la micro- à la macrosémantique), on ne peut conclure directement de l’un à l’autre. En outre, les variations internes au texte, selon les parties et passages (dialogues, descriptions) peuvent conduire à lisser des différences significatives.

Par ailleurs, l’interprétation des résultats, même significatifs, reste bien entendu conjecturale. Elle le sera moins quand aura décrit les faisceaux de catégories, comme celui de l’énonciation représentée, qui regroupent des variables actives à tous les niveaux, et permettent d’opposer aussi bien des discours que des parties au sein d’un texte.

Le travail d'interprétation des corrélations observées entre variables n'en est qu'à ses débuts et se développera en faisant varier expérimentalement les sous-corpus et les inventaires de variables actives. À notre demande, Dominique Laurent a enrichi de plusieurs dizaines de variables les étiquettes apposées par le logiciel Cordial et nous souhaitons l’enrichir encore, en distinguant par exemple les types de relatives, les types d'infinitives, les parties dialoguées (discours direct) des autres parties. Nous entendons ainsi explorer les différences entre genres textuels chez un même auteur.

Nous attendons d’importants progrès de l’étude de sous-corpus où la structure des textes serait accessible par un balisage TEI minimal : cela permettrait d'étudier précisément l’interaction des composantes textuelles, thématique, dialectique, dialogique, tactique, dans leurs interactions au palier des sections de texte (chapitres, voire paragraphes ou strophes), pour affiner encore le travail de caractérisation.

Les premiers résultats présentés ici semblent en tout cas confirmer la nécessité de considérer dans tout travail sur corpus textuels la variable des genres. Enfin, ces résultats ouvrent une réflexion sur six relations problématiques.

a) Malgré les théories formalistes sur l’autonomie de la syntaxe, la corrélation syntaxe / sémantique est assez forte pour qu’une catégorisation morphosyntaxique permette de recouper massivement une classification préalable des genres, qui relève essentiellement de critères sémantiques globaux. Si bien que l’hypothèse de Hjelmslev selon laquelle la syntaxe relève de l’étude du contenu linguistique trouve là une confirmation de poids.

b) En outre, les variables utilisées sont locales, au palier du mot et de la phrase, et confirment cependant la classification initiale qui était globale : la relation confirmée entre local et global témoigne évidemment de l’unité de fait et de droit entre la linguistique du signe et de la phrase et la linguistique des textes. Plus

--- 575 ---

généralement, la corrélation entre descriptions locales et description globale permet de préciser l’articulation entre la problématique du signe et la problématique du texte, en subordonnant la première à la seconde.

c) Ensuite, la relation même entre les plans du langage , signifiant et signifié, « contenu » ou « expression » reçoit un éclairage nouveau. Certes, l’analyse morphosyntaxique, dans le catégoriseur Cordial même, n’est pas purement « formelle », et s’appuie sur un lexique qui contient des informations sémantiques. Mais cette étape franchie, elle ouvre la possibilité de mettre à jour des corrélations fortes entre régularités de l’expression et régularités du contenu. L’étude des genres conduit ainsi à poser le problème de la sémiosis textuelle . On définit ordinairement la sémiosis au palier du signe, et comme un rapport entre signifié et signifiant ; mais on ne s’interroge guère sur les paliers supérieurs, comme si leur sens se déduisait par composition de la signification des signes. Or, un genre définit précisément un rapport normé entre signifiant et signifié au palier textuel : par exemple, dans le genre de l’article scientifique, le premier paragraphe, sur le plan du signifiant, correspond ordinairement une introduction, sur le plan du signifié ; dans le genre de la nouvelle, il s’agit le plus souvent d’une description.

La sémiosis limitée proposée par la langue aux paliers de complexité inférieurs, du morphème à la phrase, ne devient effective que si elle est compatible avec les normes de genre voire de style qui assurent la sémiosis textuelle.

d) Dans la mesure où les genres sont un niveau privilégié de regroupement des textes au sein des corpus, il reste possible de les neutraliser, par exemple pour caractériser un discours par rapport à d’autres, mais cela doit être fait explicitement, et en mesurant les biais méthodologiques induits par cette neutralisation. En effet, les relations sémantiques entre textes s’établissent préférentiellement entre textes du même genre.

e) Les deux linguistiques, celle « de la langue » et celle « de la parole », que Saussure cherchait explicitement à articuler (cf. sous presse), sont unies par l’espace des normes. Dans le domaine des textes, les normes qui déterminent en premier lieu les genres permettent de lier les régularités singulières, les styles qui apparaissent dans le bas de la classification et qui unissent notamment les œuvres d’un même auteur, avec les régularités communes, qui apparaissent dans le haut de la classification, au niveau des discours. Sans préjuger de l’existence d’une langue générale qui s’exprimerait dans d’introuvables textes « hors discours », convenons que le niveau des genres est bien le niveau stratégique qui permet de passer de la généralité de la langue aux particularités des textes.

f) Enfin, l’opposition humboldtienne entre la forme intérieure et la forme extérieure des textes, qui a fait couler tant d’encre chez les stylisticiens, pourrait recevoir une nouvelle formulation qui la relativise : la forme intérieure, loin d’être un mystère esthétique, ne serait-elle pas constituée par les régularités jusqu’à présent imperceptibles de la forme extérieure, mais que les nouveaux moyens théoriques et techniques permettent à présent de mettre en évidence ?

--- 576 ---


NOTES

[22] page 569 : On sait que la tragédie classique française comprend des récits d’événements (morts, combats) qui ne devaient pas se représenter sur scène.

[23] page 570 : Métriquement, le thème de l’Amour correspond à un nombre d’accents supérieur (rythmes iambiques plutôt qu’anapestiques) et à l’irrégularité des schèmes métriques d’hémistiches : de fait, dans les dialogues un vers se partage souvent entre plusieurs locuteurs.

[24] page 572 : Par exemple, la paire je/tu est fréquente dans les dialogues et en régime subjectif, mais la paire je/il est fréquente dans les passages de narration ; la paire présent/passé composé est fréquente en régime objectif, la paire imparfait/passé simple en régime subjectif (la première domine dans le roman policier, la seconde dans le le roman psychologique.

[25] page 572 : L’ambiguïté demeure patente entre le régime d’énonciation nommé histoire , qui est un concept linguistique, et l’histoire comme objet des historiens et nom de leur discipline.

[26] page 573 : La strate sémiotique de l’entour humain se caractérise par quatre décrochements d’une grande généralité, et qui semblent attestés dans toutes les langues décrites, si bien que l’on peut leur conférer par hypothèse une portée anthropologique. (i) Le décrochement personnel oppose à la paire interlocutive JE/TU une troisième personne, qui se définit par son absence de l’interlocution : IL, ON, ­ÇA. (ii) Le décrochement local oppose la paire ICI/LÀ à un troisième terme, LÀ-BAS, ou AILLEURS qui a également la propriété définitoire d’être absent du hic et nunc . (iii) Le décrochement temporel oppose le MAINTENANT, le NAGUÈRE, et le FUTUR PROCHE au PASSÉ et au FUTUR. (iv) Enfin, le décrochement modal oppose le CERTAIN et le PROBABLE au POSSIBLE et à l’IRRÉEL. Les homologies entre ces décrochements permettent de distinguer trois zones : une de coïncidence, la zone identitaire  ; une d’adjacence, la zone proximale  ; une d’étrangeté, la zone distale . Le principal décrochement sépare les deux premières de la troisième.


BIBLIOGRAPHIE

[ADA 99] Adam, J.-M., Linguistique textuelle. Des genres de discours aux textes , Paris, Nathan, 1999.

[BAR 00] Barlow, M. & Kemmer, S, éds., Usage-based models of language , CSLI Publications, Standford, 2000.

[BEAU] Beaudouin, V., Mètre et rythmes de l’alexandrin classique : Corneille et Racine , Paris, Champion, coll. Lettres numériques, à paraître.

[BEA 01] Beauvisage, T., « Exploiter des données morphosyntaxiques pour l’étude statistique des genres — Application au roman policier », 2001, TAL, 16.

[BEN 6] Benveniste, E.,  Problèmes de linguistique générale , Gallimard, Paris, 1966.

[BIB 88] Biber, D., Variation across Speech and Writing . Cambridge, Cambridge University Press, 1988.

[BIB 92] Biber, D., « On the complexity of Discourse Complexity ; a multidimensional Analysis » , Discourse Processes , 15, 1992, p. 133-163.

[BIB 93] Biber, D., « Using register-diversified corpora for general language studies » . Computational Linguistics , vol. 19, 2, 1993, p.243-258.

[BIB 00a] Biber, D., « Investigating language use through corpus-based analyses of association patterns », in M. Barlow & S. Kemmer (éds) : Usage-based models of language , CSLI Publications, Stanford, 2000.

[BIB 00b] Biber, D., Johanson, S., Leech, G., Conrad, S., Finegan, E., The Longman grammar of spoken and written English . Londres, Longman, 2000.

[BIN 99] Binongo, J; N. G., Smith, M. W. A., The application of Principal Component Analysis to Stylometry, Literary and Linguistic Computing , vol. 14, n° 4, 1999, p. 445-465.

[BOU 98] Bouquet, S., « Linguistique textuelle, jeux de langage et sémantique du genre », Langages , 129, 1998, p. 112-123.

[GEE 98] Geertz, C., The Interpretation of Cultures , New York, Basic Books, 1972.

[GEN 86a] Genette, G., « Introduction à l’architexte », in Genette G. et Todorov T., Théorie des genres , Paris, Seuil, 1986, p. 89-146.

[GEN 86b] Genette, G., (éd.), Théorie des genres , Paris, Seuil, 1986.

[ILL 99] Illouz G., Habert B., Fleury S., Folch H., Heiden S., Lafon P., « Maîtriser les déluges de données hétérogènes », Actes TALN 1999 , Cargèse, 1999.

[HAB 00] Habert, B. et coll., « Profilage de textes : cadre de travail et expérience », Actes des 5èmes JADT . 2000.

[HAM 86] Hambürger, K., La logique des genres , Paris, Seuil, 1986.

[KAR 94a] Karlgren, J., « Text genre recognition using discriminant analysis », International Conference on Computational Linguistics , 1994.

[KAR 94b] Karlgren J., Cutting D., « Recognizing text genres with simple metrics using discriminant analysis », Proceedings of COLING 94 , Kyoto, 1994.

[KES 97] Kessler B., Nunberg G., Schütze H., Automatic detection of genre , Palo Alto Research Center, 1997.

[LAB 00] Labbé, D., « La France, chez de Gaulle et Mitterand », in  Des mots en liberté — Mélanges Maurice Tournier , Saint-Cloud, ENS Editions, 2000, pp. 183-193.

[MEA 97] Mealand, D., « Measuring Genre Differences in Mark with correspondance analysis », Literary and Linguistic Computing , 12, 4, 1997, p. 227-243.

[RAS 89] Rastier, F., Sens et textualité , Paris, Hachette, 1989.

[RAS 96] Rastier, F., « Représentation ou interprétation ? — Une perspective herméneutique sur la médiation sémiotique », in V. Rialle et D. Fisette (dir.), Penser l'esprit : des sciences de la cognition à une philosophie de l'esprit , Grenoble, Presses Universitaires de Grenoble, 1996, pp. 219-239.

[RAS 00] Rastier, F.,  « Philologie numérique », in Tyvaert, (éd.) Philologie électronique et assistance à l’interprétation des textes, Recherches en Linguistique et Psychologie cognitive , 16, 2000, p. 117-149.

[RAS 01] Rastier, F., Arts et sciences du texte , Paris, PUF, 2001.

[RAS 99] Rastier, F., & Pincemin, B., « Des genres à l'intertexte », Cahiers de Praxématique , n°23, 1999, p. 90-111.

[SAU 01] Saussure, F. de, Ecrits de linguistique générale , Paris, Gallimard [éd. Simon Bouquet et Rudolf Engler], sous presse.