COMPTE RENDU

Par Damon MAYAFFRE
CNRS / Université de Nice

(Texte paru dans la revue Corpus : Stylisitique et corpus, 2006, n°5, p. 232-236)

La collection « Lettres numériques » d’Honoré Champion est un des rares lieux éditoriaux aujourd’hui qui s’applique à promouvoir des ouvrages de philologie numérique. L’essai de Margareta Kastberg Sjöblom ne déroge pas à la ligne éditoriale fixée par les directeurs de collection, François Rastier et Jean-Marie Viprey, et propose une étude linguistique assistée par ordinateur de l’œuvre littéraire de Jean-Marie Le Clézio.

La force de l’ouvrage tient d’abord dans le corpus étudié et la méthode utilisée : la quasi-totalité des livres d’un des auteurs francophones les plus prolifiques de notre époque a été numérisée et traitéé. Soit quelque 31 ouvrages, étalés sur près de quatre décennies, du Procès-verbal paru en 1963 à Hasard, paru en 1999, en passant par exemple par L’extase matérielle (1967), Mondo (1978), Désert (1980), Onitsha (1991) ou Poisson d’or (1997). Devant l’étendue du corpus (2.281.659 occurrences exactement) que Margareta Kastberg Sjöblom détaille (Section I ; pp. 25-32), le parti pris méthodologique du recours à la linguistique quantitative et à l’ordinateur ne parait pas seulement légitime mais indispensable. Le logiciel Hyperbase -central dans l’analyse mais non unique- avec ses fonctions hypertextuelles, documentaires et statistiques s’avère un outil précieux de description exhaustive et d’interrogation systématique des textes lorsqu’ils sont si nombreux.

La force de l’ouvrage tient surtout dans la rigueur d’une analyse d’origine universitaire [Kastberg Sjöblom 2002]. Non seulement nous y retrouvons l’appareil critique le plus apparent des travaux scientifiques (annexes, bibliographie, citations précises et référencées, figures, index thématique et notionnel, etc.) mais la posture épistémologique d’une auteure qui y défend de manière suivie et documentée sa thèse en considérant les problématiques actuelles de la recherche linguistico-littéraire, de la linguistique de corpus, de l’analyse de données textuelles.

Le long de 4 sections (section II : La structure du vocabulaire ; section III : La phrase leclézienne et son rythme ; section IV : Les parties du discours ; section V : Sémantique lexicale) Margareta Kastberg Sjöblom établit, en effet, avec opiniâtreté, l’incidence des genres littéraires et le poids de la chronologie sur une œuvre tout sauf homogène et statique. D’apparence attendue, cette double conclusion est, en l’espèce, originale, dans la mesure où Le Clézio réfute plusieurs fois, explicitement, l’influence du genre sur une écriture qu’il voudrait libre [1], et que l’évolution diachronique de son art, souvent décrite comme binaire par la critique littéraire, est en réalité ternaire.

C’est sans aucun doute l’effet d’accumulation qui persuade le lecteur car la démonstration convoque une batterie d’analyses qui fait de cet ouvrage un des plus aboutis en matière d’analyse de données textuelles depuis les travaux de Charles [Muller 1964 et 1967] et d’Etienne [Brunet 1981]. On en jugera simplement par l’énumération des principaux chapitres du livre : « La richesse du vocabulaire », « L’accroissement lexical », « La distance lexicale », « La longueur du mot », « La ponctuation forte », « La segmentation interne de la phrase », « La complexité de la phrase », « La distribution des catégories grammaticales », « Le syntagme nominal », « Les pronoms », « La catégorie verbale », « Les spécificités lexicales », « Les structures thématiques ». Au terme de ce parcours, le sous-titre de l’ouvrage devient explicite et pêche finalement par modestie. « Des mots aux thèmes », Margareta Kastberg Sjöblom rend compte de l’ensemble du texte leclézien de ses plus petites unités aux plus complexes, de la lettre ou des signes de ponctuation jusqu’aux isotopies ou corrélats sémantiques en passant par le lexique, les codes grammaticaux, les structures syntaxiques ; l’étude n’est donc pas seulement lexi-cométrique, mais grammatico-métrique, stylo-métrique, texto-métrique, logo-métrique.

Appliqués aux différents niveaux linguistiques mentionnés (lettres, n-grammes, mots, lemmes, codes grammaticaux, enchaînements syntaxiques), les grands outils classificatoires de l’analyse de données textuelles (l’analyse factorielle des correspondances, l’analyse arborée) font merveille : ce sont eux qui, de manière endogène, et sans avoir recours aux a priori ou à la critique, permettent d’établir une typologie générique pertinente et une chronologie assurée de l’œuvre.

On attirera l’attention du lecteur, par exemple, sur l’AFC figure 23 qui éclaire la question grammaticale. Elle montre combien, d’un point de vue générique, les écrits ethnographiques sur-utilisent les substantifs et les déterminants lorsque les œuvres fictionnelles utilisent les pronoms et les verbes ; de la même manière, mais d’un point de vue chronologique, elle montre « l’assagissement de l’écriture » (p. 137) de Le Clézio qui se recentre au fil du temps sur les catégories fondamentales (le nom, le verbe) lorsque ses premiers écrits étaient marqués par les adjectifs, les adverbes ou les interjections.

On attirera l’attention du lecteur, plus précisément, sur les figures 35, 36, 37, 38 et 39 qui épuisent la question verbale ; elles illustrent, notamment, comment d’un point de vue diachronique Le Clézio abandonne progressivement, dans sa narration, l’imparfait au profit du passé composé ; et d’un point de vue générique, la complexité du nouveau roman qui diversifie les modes (subjonctif, impératif, conditionnel à côté de l’indicatif).

On remarquera encore la figure 28 qui dessine la renonciation, en trois temps, de Le Clézio pour la sophistication lexicale. Ou encore la figure 22 qui démontre, dans la chronologie, le système de vases communicants entre les coordonnants (sur-utilisés en début de période) et les subordonnants (sur-utilisés en fin de période).

Nous signalerons pour finir ce compte-rendu deux points forts supplémentaires de l’ouvrage.

D’abord les études lexicométriques françaises sur corpus littéraires ont l’immense avantage de disposer d’un corpus de référence : le Trésor de la Langue Française dont Hyperbase a en mémoire les principales données quantitatives. Ainsi Margareta Kastberg Sjöblom peut établir les caractéristiques formelles objectives leclézienne par rapport aux grands auteurs français (ici limités à ceux du XX° siècles pour plus de pertinence historique). La phrase de Le Clézio se révèle alors plutôt longue par rapport à celle de ses condisciples (21,09 mots/phrase pour Le Clézio contre 14,60 en moyenne pour les auteurs contemporains). Son écriture est plutôt nominale (mais sans être adjectivale !), son vocabulaire plutôt riche. Son lexique caractéristique, déshumanisé, tourne autour du monde naturel, particulièrement du monde minéral (la « mer » et la « lumière » comme chacun sait, mais aussi le « vent », la « plage », le « ciel », le « soleil », la « terre », les « montagnes », « l’eau », les « nuages », etc.).

Ensuite, Margareta Kastberg Sjöblom tire profit des dernières innovations de l’analyse de données textuelles pour mettre à jour les isotopies [Rastier 1987 – 1996 2ème éd.] ou isotropies [Viprey 2005]. L’étude automatique des collocations et de la micro-distribution des termes permet de reconstruire objectivement les thématiques majeures de l’œuvre. Sont ainsi systématiquement explorés, au plus grand plaisir du lecteur, les thèmes de la mer (pp. 226-233), de la terre (pp. 234-238) et du regard (pp. 245-254) ainsi que le bestiaire leclézien (pp. 238-245). Lecture réticulaire des textes, contrôle des parcours interprétatifs et objectivation des faisceaux sémantiques du corpus apparaissent ainsi comme les enjeux majeurs des prochaines études de philologie numérique dont cet ouvrage emprunte la voie.


NOTES

[1] Le Clézio, en effet, en appelle à l’écriture pure, et Margareta Kastberg Sjöblom, à rebours de ce qu’elle démontre, rappelle ce passage naïf de La fièvre : « Tout et rien. Je prenais des feuilles de papier, les plus grandes possible, et je les couvrais d’écriture, presque sans y prendre grade, presque au hasard. Mais ça n’avait aucun genre littéraire, c’était simplement de l’écriture » (p. 271).


BIBLIOGRAPHIE

Brunet É. (1981). Le vocabulaire français de 1789 à nos jours. Paris : Genève.

Kastberg Sjöblom M. (2002). L’écriture de J. M. G. Le Clézio, une approche lexicométrique. Thèse de doctorat, Université de Nice-Sophia Antipolis. Publication électronique dans Texto ! [http://www.revue-texto.net/Inedits/Kastberg_these/Kastberg_LeClezio.html|].

Muller Ch. (1964). Essai de statistique lexicale. L’illusion comique de Pierre Corneille. Paris : Klincksieck.

Muller Ch. (1967). Le vocabulaire du théâtre de Pierre Corneille. Etude de statistique lexicale. Paris : Klincksieck.

Rastier F. (1987 - 1996 2ème éd.). Sémantique interprétative. Paris : Puf.

Viprey J.-M. (2005). « Philologie numérique et herméneutique intégrative », in Adam J.-M. et Heidmann U. (éds.), Sciences du texte et analyse de discours. Genève : Slatkine, pp. 51-68.


Vous pouvez adresser vos commentaires et suggestions à : Mayaffre@unice.fr

©  septembre-décembre 2006 pour l'édition électronique.

Référence bibliographique : MAYAFFRE, Damon. Compte rendu de Kastberg Sjöblom, L’écriture de J. M. G. Le Clézio. Des mots aux thèmes (2006). Texto ! Vol. XI, n°3-4, 2006 [en ligne]. Disponible sur : <http://www.revue-texto.net/Parutions/CR/Mayaffre_Kastberg.html>. (Consultée le ...).