François Rastier : LA MACROSÉMANTIQUE

6. La lancinante question des dinosaures

Pour mettre en pratique ce qui précède, nous avons choisi un texte de référence reproduit en annexe, portant sur la disparition des dinosaures, et paru dans une revue de vulgarisation sous le titre : La lancinante question de la disparition des espèces (Sciences et avenir, novembre 1985) [18]. Nous allons l’étudier sous deux aspects : la construction des acteurs et des fonctions, et la hiérarchisation des isotopies temporelles, tonales, et modales. Nous formulerons ensuite des conclusions sur le discours de vulgarisation.

6.1. Les anaphores et la construction des acteurs et des fonctions

Précisons les conditions diverses (morphosyntaxiques et sémantiques) qui permettent de construire les acteurs. Les anaphores viennent en premier lieu.

On sait que le mot anaphore s’emploie pour désigner toutes sortes de renvois sémantiques par des mots ou syntagmes à des mots ou syntagmes précédents ou successifs dans le même texte. Nous ne distinguerons pas dans la suite l’anaphore au sens strict, qui renvoie à des segments situés plus haut dans le texte, et la cata­phore, qui renvoie à des segments situés plus bas. Nous proposons cependant de distinguer  les morphèmes anaphoriques, dont l’interprétation requiert d’identifier un autre contenu (ex. possessifs, déictiques) et les anaphores sans marque mor­phologique, comme les anaphores dites associatives (ex. :  Nous montâmes dans le fiacre. La chanson du cocher couvrait-elle le bruit de nos baisers?), dont on peut rendre compte en termes de coréférence partielle ou implicite (ici entre ‘cocher’ et ‘fiacre’), et dont le décodage demande des inférences sur le lexique et/ou le recours à des schémas de compréhension.

Dans les deux premiers paragraphes du texte, nous relevons cinq chaînes ana­phoriques que voici, chaque occurrence étant située par son numéro de paragraphe suivi de son numéro de phrase.

1. La fonction Disparition : que / s’est il passé (1.1), il s’est passé / quelque chose (1.2), les résultats (1.3.), la terrible crise (1.4), le massacre (1.5), des crises (2.9), (tous) rayés du monde (2.13).

2. L’acteur Savants : tout le monde (1.2), on (les connaît) (1.3), on (a décou­vert) (2.2.), on (a retrouvé) (2.3.).

3. Les acteurs animaux méritent une attention particulière. On peut en distin­guer trois classes, qui appariassent dans le tableau ci-dessous.

§1

3.

les dinosaures

 

 

4.

tous

 

le monde animal

 

 

 

les familles d’invertébrés

 

 

 

dont certains groupes...

 

 

 

le plancton

5.

des grands reptiles

 

les mammifères

§ 2

1.

les dinosaures

 

 

2.

ils

 

 

 

leurs restes fossilisés

 

 

3.

(les traces de) centaines d’espèces de dinosaures

 

 

4.

ceux-ci

 

 

 

un monde extrêmement varié

 

mammifères aujourd’hui

 

géants fameux

petites bêtes

 

 

dinosaures

 

 

5.

certains étaient bipèdes

d’autres quadrupèdes

 

 

les uns étaient herbivores

les autres carnivores

 

 

des dinosaures fins

de gros patauds caparaçonnés

 

 

des dinosaures pourvus de becs

 

ancêtres des oiseaux

6.

les dinosaures

 

 

8.

ils

 

 

 

 

 

premiers mammifères

 

 

 

premiers oiseaux

 

 

 

naissance des fleurs

9.

ils ont traversé

 

 

10.

ils ont survécu

 

 

12.

les fossiles des dinosaures

 

 

 

ils vivaient

 

 

13.

rien

 

 

14.

 les maîtres de la planète

 

 

15.

les gros

les petits

 

 

les herbivores

les carnivores

 

 

les quasi-lézards

les presque oiseaux

 

 

tous

 

 

 

 

 

du monde vivant

Les superpositions, approximatives, marquent des anaphores, avec ou sans coréférence partielle ou totale. Elles permettent de distinguer trois classes de syntagmes.

(i) Le monde animal, opposé dans ce contexte aux familles d’invertébrés , dont les ammonites, et auxquelles le plancton est adjoint. L’ensemble est repris à la fin du second paragraphe dans monde vivant. Bien entendu, nous ne nous chargerons pas d’arguer que le monde animal ne s’oppose pas à l’océan, et qu’il est fort dou­teux que le plancton ait disparu sans que les poissons disparaissent aussi : ce serait étudier le texte par rapport à des textes de référence définissant le vrai et le faux, ce qui n’est pas notre propos. Le problème qui se pose à nous est celui des conditions de construction d’un acteur : nous conjoignons les cinq syntagmes cités comme des descriptions partielles, la dernière synthétique, d’un seul acteur Le Monde Vivant. Outre les comparaisons (tout aussi spectaculaire ) et la coordi­nation (et le plancton), c’est l’équivalence des processus (tous sont morts, le mas­sacre, tous rayés) qui permet d’homologuer la classe de syntagmes.

(ii) La deuxième classe contient les mammifères (trois occurrences) spécifiés en premiers et aujourd’hui , ainsi que les oiseaux et les fleurs. Considérée dans son ensemble, cette classe comprend trois acteurs d’un même agoniste, que l’on peut nommer provisoirement Successeur . Ces acteurs partagent des traits com­muns, comme le trait aspectuel /inchoatif/ six fois réitéré dans les mammi­fères […] ont commencé à s’épanouir (§ 1, 5), l’apparition des premiers mammi­fères et des premiers oiseaux, la naissance des fleurs (§ 2, 8). Dans cette classe, le parangon (ou terme le plus valorisé)[19] est certainement les mammifères : non seulement ils sont les plus fréquemment nommés, mais encore opposés dialecti­quement et comparés thématiquement aux dinosaures. Les mammifères constituent en effet un monde  [...] comparable à celui des dinosaures.

(iii) La classe des dinosaures est riche de 32 occurrences. Elle comprend deux acteurs, les Dinosaures dans leur ensemble, et les Fossiles, traces et restes d’autre part. L’acteur Dinosaures est présenté synthétiquement et distributivement (cf. un monde extrêmement varié). La classe des syntagmes qui le manifestent est articulée par des relations d’équivalence, mais aussi par des relations hiérarchiques (est-un, sorte-de, etc.).

Mais les descriptions antithétiques, comme géants fameux et petites bêtes, ne manifestent-elles pas des acteurs différents ? Elles le pourraient dans des contextes où elles seraient opposées par les processus qui leur sont associés. Ici, elles manifestent simplement des termes opposés sur divers axes sémantiques : (a) géant / petit, (b) bipède / quadrupède, (c) herbivore / carnivore, (d) fin / gros, (e) lézard / oiseau. On remarque d’ailleurs au début et à la fin du deuxième para­graphe le retour dans le même ordre des mêmes axes sémantiques de compa­raison. Ainsi, dans les  phrases 4 et 5 on relève : (a) taille et masse (b) mode de locomotion (c) régime alimentaire (d) allure ; et dans la phrase 15 : (a, c, b) lézard, oiseau (d) quasi-, presque (qui soulignent l’aspect hybride des monstres). L’acteur Dinosaures se caractérise ainsi par des traits contradictoires, comme un acteur de récit mythique.

Nous verrons ultérieurement si les Dinosaures et les Fossiles diffèrent par leurs fonctions et se rapportent à deux parties différentes du récit événementiel, ou s’ils relèvent d’un même agoniste.

Les chaînes anaphoriques sont évidemment inégales en longueur et en complexité, mais seul importe ici le problème que pose leur constitution. D’une part, on compte peu d’anaphores obligatoires (portées par des signes dits anaphoriques) et de toute façon aucune n’est explicite. D’autre part, la décision de distinguer des acteurs dans une chaîne anaphorique dépend de conditions métho­dologiques générales. Si par exemple des actants ont des descriptions opposées mais des fonctions analogues, ils relèvent du même acteur et manifestent divers aspects, fussent-ils contradictoires, de sa molécule sémique. Si en revanche ils ont des fonctions opposées dans le même intervalle de temps narratif, ils relèvent d’acteurs différents.

Cependant les registres actoriels varient selon les discours, et leur construction doit en tenir compte : par exemple, dans le discours mythique, les acteurs syncrétiques sont très fréquents. Ici, nous sommes dans une situation intermédiaire entre le discours mythique et le discours scientifique.

Pour corroborer cette analyse, précisons les interactions entre acteurs :

(i) Les Savants sont en interaction avec les Fossiles.

(ii) Les Dinosaures sont apparemment localisés dans le Monde vivant (cf. rayés du monde vivant, §2, 13). En fait cette relation fonctionnelle de localisation est redoublée d’une relation de domination (les dinosaures régnaient en maîtres sur la planète, §2, 1), et ce redoublement apparaît dans l’expression rayés de la planète (§1, 3). Il y a là l’indice d’un dédoublement discursif, la relation de locali­sation relevant du discours scientifique, et la relation de domination d’un discours mythique.

(iii) Par rapport aux Dinosaures, les Successeurs sont aussi des rivaux : ils vi­vaient dans l’ombre, puis ont commencé à prendre le pouvoir. La succession temporelle (dans le discours scientifique) se double ainsi d’un combat qui rap­pelle une dramatisation mythique.

Rapportée aux éléments de thématique que nous venons de préciser, l’organi­sation tactique présente deux caractères notables. D’une part, le texte suit les normes d’exposition du discours didactique, qui conduisent du général au particu­lier, pour revenir au général. On remarque ainsi, dans le déroulement des deux premiers paragraphes, des mouvement antithétiques de spécification puis de géné­ralisation qui correspondent à des phases différentes de l’argumentation : soit la succession : 1. Dinosaures, 2. Monde animal, 3. Dinosaures, 4. Monde vivant. La première apparition de Dinosaures présente le thème général. Les phases suivantes marquent le début (général), le développement (spécifiant) et la fin (généralisante) de l’introduction ainsi clôturée.

Par ailleurs, comme la disparition des dinosaures est mentionnée mais non décrite, il en résulte un effet de suspens, une dramatisation de la narration, qui redouble la dramatisation du récit.

6.2. Les isotopies temporelles et tonales

Des faisceaux d’isotopies définissent différents plans de description.

1. Les isotopies temporelles définissent des plans temporels ou chronotopes . Le texte étudié en contient trois : (i) la préhistoire (§1, 2, 11, 12, 13) ; (ii) l’époque des hypothèses nouvelles (1980-1983) (§ 3, 4, 5, 6, 7) ; (iii) l’état présent (§ 8,  9,   10, 14, 15,  16). Chacun de ses plans a son propre passé, même le premier : depuis 150 millions d’années (2. 6),un bail ! (2. 7). Le second est marqué par le présent de narration, le troisième par le présent de simultanéité, et même un futur proche (on va chercher, § 14). Il inclut un retour en arrière hypothétique, exposé sur un mode thétique (§ 11, 12, 13).

À ces trois plans thématiques correspondent trois structures narratives diffé­rentes (dans la composante dialectique) : le récit de la vie des dinosaures ; le récit de la recherche, dont les Alvarez sont les héros, et qui inclut une version de la disparition des dinosaures ; le récit des débats actuels, qui inclut une nouvelle version de la mort des dinosaures. Ces récits sont dramatisés de façon décroissante. En passant du premier au troisième, on passe du mythe à la science.

2. Des isotopies évaluatives (dimensionnelles) définissent des niveaux de tonalité ou strates . On remarque des renvois entre des termes ou expressions qui se situent à différents niveaux de tonalité : par exemple dinosaures est un terme neutre, relativement à dinosauriens /scientifique/, gros patauds /familier/, ou géants fameux  /mythique/. Ces tonalités peuvent se succéder au sein d’un même syntagme. Par exemple, dans gros patauds caparaçonnés le familier se conjugue au mythique, comme dans les contes, car caparaçonnés renvoie aux chevaliers moyenâgeux [20]. Ou encore, d’une phrase à l’autre, des anaphores relient des syn­tagmes relevant de ces différentes strates tonales, par exemple depuis 150 millions d’an­nées /scientifique/et un bail! /familier/.

On peut distinguer ici trois niveaux :

(1) Le niveau du discours scientifique se caractérise par un lexique technique et des structures argumentatives causales.

(2) Le niveau familier paraît réécrire en style oral le texte scientifique. Tous les spécialistes concordent sur ce point (dans un texte scientifique) devient ici Sur ce point, tout le monde est d’accord. Ce niveau est juxtaposé au précédent. Par exemple dans Les dinosauriens /scientifique/ ont donc /scientifique/ eu un beau /familier/ règne . Ou encore Et les trilobites /scientifique/ alors ? /familier/. Les ponctuations “émotionnelles” renforcent cette mise en scène d’une oralité, par de nombreux points d’exclamation, d’interrogation, de suspension.

(3) Le niveau mythique apparaît de façon dense au début, puis épars dans des expressions comme les maîtres de la planète, la fascinante horloge mortelle, comme une sorcière, etc. Entre le Crétacé et le Tertiaire /scientifique/, les maîtres de la planète ont disparu /mythique/.

3. Les connexions entre les isotopies scientifique et familière peuvent être rapportées à la fonction didactique du texte et à la formule rédactionnelle de la revue, qui s’adresse plutôt à des adolescents. D’où des repérages censés faciliter la compré­hension : “ À la fin du Crétacé, la mer […] s’est retirée au large de Brest ” ; le ton primesautier d’expressions comme feu la grosse bête ; voire des expressions qui peuvent favoriser l’identification : dans le géologue Walter Alvarez et son papa, le foyer interprétatif est celui que peut occuper un lecteur jeune sinon infantile. Corrélativement, le recours à des énonciateurs délégués, spécialistes dont les propos sont rapportés dans un style familier, confirme la posture paternaliste des foyers énonciatifs. Enfin, l’usage fréquent du on inclusif vise sans doute à associer le jeune lecteur à ceux qui savent.

La connexion entre l’isotopie scientifique et l’isotopie mythique pose des problèmes plus complexes, car elle concerne non seulement la différence des tons (rapportés à des dimensions sémantiques) mais encore une différence de domaines. Le principal connecteur est sans doute le mot règne , qui désigne à la fois une division de la nature (comme le règne animal), et l’exercice du pouvoir. Ces deux acceptions coexistent par exemple dans : “ la grande crise Primaire / Secondaire qui a vu la fin du règne des poissons et des amphibiens et le démar­rage de celui des reptiles comme espèce dominante ”.

Il n’est pas exclu que l’isotopie mythique ait une fonction ludique, comme le laisse supposer l’expression retour […] à la case départ (§11). Mais au dernier paragraphe, la mention de la comète tueuse, et l’allusion à l’origine extraterrestre de la vie nous renvoient au genre du roman d’anticipation. Et l’on sait que la science-fiction est une grande consommatrice de dinosaures, successeurs malgré eux des dragons des légendes.

Le texte de vulgarisation propose ainsi au lecteur un contrat interprétatif complexe, à la fois ludique et informatif. Ce dispositif dialogique a sans doute une incidence sur la compréhension du texte, d’abord sur la construction des acteurs, mais aussi des versions de la structure narrative : les dinosaures sont tout à la fois des reptiles au niveau événementiel et des tyrans au niveau agonistique.

On sait que les théories classiques de la compréhension de texte en psycho­lin­guistique et en Intelligence Artificielle partent du postulat discutable qu’un texte serait un moyen pour véhiculer des informations. Mais même les textes de vulgarisation ne sont pas purement informatifs et contiennent des éléments qui relèvent d’autres objectifs. La question qui se pose alors peut se formuler ainsi : si nous maintenons le postulat que ces textes sont principalement informatifs, en quoi les éléments émotifs ou ludiques ont-ils une incidence sur la transmission et la rétention de ces informations? Ce thème de recherche est fort peu traité en linguistique comme en psychologie cognitive, car la recherche cognitive en général a jusqu’ici concédé fort peu de place aux affects. Une sémantique des textes ne peut cependant éluder cette question.

Dans la section suivante, nous l’aborderons par un autre biais, celui de la composante dialogique dans les interviews d’experts.

7. Analyse de textes d’expert

Pour aborder cette question qui relève de l’ergonomie linguistique, nous nous limiterons à des corpus oraux transcrits après recueil en situation d'entretien. Le recueil d’expertise n’est pas une situation artificielle, mais tout simplement une nouvelle pratique sociale, où les échanges linguistiques sont déjà codifiés en un genre (qui reste d'ailleurs à décrire comme tel). Nous n’aborderons pas les pro­blèmes que posent le recueil et la transcription du corpus, encore que la riche expé­rience accumulée par les linguistes de terrain puisse à ce propos être mise à profit. Mentionnons également pour mémoire les problèmes propres à la descrip­tion syntaxique de l’oral : elle décourage l’emploi des méthodes habituelles, toutes fondées sur l'usage standard d'une langue écrite normée ; notamment les reprises et reformulations se traduisent par des "structures de listing" comme le gars, la personne  ( DR, 5) [21], qui n’entrent pas dans les gentils arbres syntaxiques coutumiers aux linguistes (cf. Blanche-Benveniste, 1990).

7.1. Deux stratégies

Dans son application au génie logiciel, l’analyse sémantique a pour objectif d’identifier les "objets" et les "processus" qui seront modélisés par le système d'information. Ces entités sont en fait des contenus linguistiques construits par l’analyste à partir de ceux du texte, notamment par réduction des classes d'équiva­lence, des paraphrases, etc. De ce point de vue, les "connaissances" manipulées sont simplement des contenus linguistiques normalisés. Pour identifier les conte­nus pertinents, deux stratégies peuvent être envisagées : (i) faire l’inventaire des marques linguistiques qui signaleraient les objets et les processus recherchés ; (ii) pratiquer une analyse globale et structurée des composantes sémantiques du texte.

Sans revenir sur les ambiguïtés de la notion de marque, soulignons que la première stratégie, atomisante, reste fort discutable, car une langue n’est pas une nomenclature, et un texte ne se réduit pas à une suite de mots. L'analyste peut certes parvenir à des conclusions comme celles-ci : à l’oral, donc en début de période introduit non pas l’étape suivante dans une argumentation, mais un résumé de l'étape précé­dente ; voilà introduit généralement un changement de thème générique ; alors introduit généralement une solution ; les dates précises et les noms propres introduisent des exemples ou des anecdotes. Ce genre d’observations, si utiles qu'elles puissent être pour les codeurs, ne dispensent pas d’une analyse globale du texte ; au contraire, elles la présupposent. Par ailleurs, relever des “ marques ” ne suffit pas à élaborer une véritable stratégie d’interprétation. Enfin, les problèmes les plus délicats, comme par exemple la distinction entre l’exemple et l’anecdote, ne peuvent être traités en se contentant de cette sorte d'indices [22].

La stratégie globalisante, qui nous paraît préférable, consiste à décrire dans leurs interrelations les composantes sémantiques du texte. Pour l’extraction d'ex­pertise, seules les composantes thématique et dialectique sont ordinairement rete­nues dans leur intégralité : l’étude de la composante thématique permet notamment d’identifier les objets et leurs relations dans le domaine représenté, et celle de la dialectique permet d'identifier les processus attachés à ces objets. Dans la composante dialogique, on élimine généralement tout ce qui concerne l'énonciation représentée et les propositions contrefactuelles, pour ne retenir que les propositions conditionnelles (comme : “ la personne qui demanderait une fenêtre isolée avec deuxième classe, il va y avoir une erreur ”, DR , p. 7). Dans la composante tactique, on ne retient que les positions qui sont l’indice  de relations de succession temporelle ou de causalité, et qui à ce titre jouent le rôle d’interprétant pour identifier des unités dialectiques.

7.2. L’exemple de l'exemple

Voici un aperçu de cette méthode, à propos de l'exemple. Cette forme d'expli­cation pose des problèmes délicats : comment l'identifier, comment interpréter les données qu'il présente (et qui ne peuvent évidemment pas être codées telles quelles)? Analysons d’abord quelques cas remarquables, après quoi nous propose­rons une typologie.

A. Analyse de cas

a) Dans le corpus MG , on relève, à propos du TGV (train à grande vitesse) 

(i) “ Alors je l'ai toujours comparé à un engin de course. Ceux qui aiment la voiture, il existe des Ferrari, des Testa Rossa, c'est des voitures qui sont faites pour rouler sur autoroutes mais qui ne sont pas faites pour rouler sur des départementales. Le TGV c'est à peu près pareil ” (v. 11). Cette comparaison illustre par analogie une contradiction entre vitesse possible et vitesse réelle. Sur le plan thématique, elle renforce l'évaluation positive du TGV, et l'évaluation négative des conditions d'exploitation (cf. supra : “ le TGV ça a été [...] je dirais galvaudé ”). Elle introduit donc indirectement une suggestion d'optimisation. Or les optimisations relèvent, dans le domaine de la dialogique, des mondes contrefactuels (cf. infra, §3). Comme l'application à construire ne doit contenir que les règles en vigueur, ce passage ne doit pas être retenu.

(ii) “ Vous pouviez faire un Paris-Marseille, Marseille-Paris et dans votre jour­née vous faisiez une distance relativement longue. Maintenant vous faites un Paris-Nice, 1004 km, il faut sept heures pour descendre, au bout de sept heures vous arrivez à une période où il n'y a plus de départ  en service commercial, donc que fait la rame ? Elle couche à Nice ” (v. 19-20). Or, à Nice, elle ne peut être révisée. L'exemple illustre alors la contradiction entre roulement et maintenance. Les données propres au parcours (destination, temps, distance) ne doivent donc pas être retenues.

(iii) “ Une rame TGV qui va rouler à 270 km/h entre la bifurcation de Combes-la-Ville, qui est l'entrée de la ligne à grande vitesse, et Lyon, va se retrouver au-delà de Lyon pour descendre dans la vallée du Rhône à 140, 160 [...] Et puis il y a des lignes où vous avez par exemple, pour ceux qui connaissent la géographie ferroviaire, lorsqu'elles font Paris-Berne ou Lausanne jusqu'à la moitié de la ligne à grande vitesse à peu près, qui s'appelle Passilly, elles roulent à 270 km/h, là elles quittent la ligne à grande vitesse, elles se trouvent entre Aisy et Dijon, et là roulent à 140, voire 150 km/h à certains points. Entre Dijon et Dôle, elles vont rouler à 140 km/h, et entre Dôle pour monter jusqu'en Suisse, c'est-à-dire à Vallorbe la frontière, ben là elles vont jusqu'à Mouchard, ça va à peu près à partir de Mouchard on monte 60, 70, 80 km/h et cela jusqu'à Lausanne. Donc la rame arrive à Lausanne et elle y reste ” (v. 23-25). Ces trois exemples enchaînés illustrent à nouveau la contradiction entre vitesse possible et conditions d'exploitation, comme entre roulement et maintenance. Pour les mêmes raisons que ci-dessus (cf. ii), ils ne doivent pas être retenus. Ils n'illustrent pas les règles en vigueur. Leur  fonction argumentative est polémique, comme on le reconnaît par leur structure dialectique et tactique : raisonnement a fortiori (de moins en moins vite : 140-160, puis 140-150, puis 60-80) ; et groupement par trois, conformément aux normes classiques de la rhétorique (dans la tradition indo-européenne, trois est le nombre canonique de la totalité ).

b) Typologie des énoncés

Le rôle et la structure des exemples ne peuvent être décrits que par rapport au contexte dans lequel ils s’insèrent. En premier lieu, ils diffèrent selon les discours et les genres. Ainsi, dans le discours philosophique, ils paraissent avoir un rôle de problématisation; dans le discours scientifique, un rôle d’objectivation ; dans le discours technique, un rôle de typification. Les textes d’experts relèvent certes du discours technique, mais leurs exemples ne se réduisent pas à leur fonction didac­tique : nous avons vu qu’ils peuvent avoir une fonction polémique. En second lieu, ils prennent leur sens par rapport aux périodes qui les entourent. Une typo­logie des énoncés devient donc nécessaire. Après analyse du corpus, nous pou­vons en distinguer cinq types.

(1) Les énoncés légaux  expriment les normes valides. Ainsi : “  À l'heure actuelle, il existe deux services à la SNCF , qui sont le service d’été et le service d’hiver ” (MG , v. 26). Ces énoncés sont généralement de forme gnomique : ils se caractérisent par le présent dit d'habitude (aspect imperfectif), et par une énoncia­tion débrayée (indices impersonnels comme on ou il y a ). Leur éclaircisse­ment peut exiger une référence aux documents techniques : “ je vous dis : quand vous voudrez du détail, il faudra que j’aille chercher mon bouquin et puis après on regarde ”.

(2) Les cas de figure prévisibles décrivent une application ordinaire de la norme. Ainsi : “ Ça s’appelle une réunion d'adaptation, elle a lieu assez longtemps avant le début du service. Pour vous donner un exemple, la réunion d'adaptation du service d’été 1990 s’est tenue il y a à peu près une quinzaine de jours” (MG , v. 34). Les “marques” d'énonciation sont ici personnelles, et on relève des futurs proches à valeur habituelle. À chaque intervalle dialectique, l'intervalle suivant est en effet prévisible. Ainsi dans : “ Si vous voulez que j'aille plus loin, mon collègue lui quand il va faire sa sélection de trains et de tranches compatibles, il va laisser tomber tout ce qui n'est pas assise-première, hein, bon alors donc moi je vais me trouver avec des assises-première ” (DR , p. 8).

(3) Les cas particuliers légitimes correspondent à des exemples d'application des normes, en d’autres termes à des feuilles de l’arbre de décision. Ainsi :“ Voyez il y a des trains là, ceux que j'aime, le 21 par exemple c'est un Paris-Lausanne, il a un régime de circulation quotidien, c’est-à-dire qu’il roule tous les jours de l’année et s’appelle le Lutétia ” (MG , v. 53). Le présent imperfectif demeure, comme les indices personnels de l’énonciation, mais on relève en outre des déterminations maximales (noms propres, chiffres).

(4) Les cas particuliers illégitimes présentent des situations considérées comme anormales. Les énoncés sont alors au passé perfectif, en particulier au passé composé (le passé simple n’est pas attesté dans ces corpus oraux). En outre, les indices de l’énonciation sont personnels, et la détermination maximale (dates, noms propres). Ainsi  dans : “ On a eu une anomalie qui nous a été signalée le 13 juillet, là où pour Cuneo en Italie... Seulement, pour cette gare là de Marseille à Cuneo en passant par Vintimille, ben ça passe pas, ça marche pas. Et j'en ai parlé longuement ce matin avec le gars qui s'occupe de ça en programmation, il m’a dit c’est incompréhensible, ben oui c'est incompréhensible ” (DR , p. 24).

(5) Les énoncés non pertinents ne sont considérés comme anecdotiques qu’en fonction de la tâche. On peut en distinguer trois sortes. Certains décrivent une situation de légitimité périmée. Ainsi : “  En 1981, nous faisions des Paris-Lyon, Paris-Genève, Paris-Dijon, Paris-Saint Etienne, donc une rame qui tourne à grande vitesse ” (MG , v. 18). Ces énoncés sont explicatifs (cf. ibid . : “ Le pour­quoi de l’affaire est très simple ”). Ils pourraient être retenus dans des systèmes d’information qui ne se contenteraient pas de décrire le statu quo.

D'autres relèvent de la culture d'entreprise, et ont sans doute pour objectif d'établir ou de maintenir une connivence avec le cogniticien. Ainsi : “  L'élément le TGV orange, deux motrices, huit caisses au milieu, 400 mètres de long, sauf un, il est un peu plus long parce qu'un jour on l'a tiré sur la ligne à grande vitesse et on l'a allongé de quelques millimètres, oui, cela fait partie de l'histoire ” (MG , v. 61).

Les derniers illustrent des maximes personnelles. Ainsi : “ Dans notre maison, il y a toujours quelqu’un qui au dernier moment se réveille. Voyez, on a eu la réunion d'adaptation, j’avais préparé une certaine somme de documents, y a un monsieur qui a dit : “Mais l’année dernière nous avons fait un service d'été qui allait de telle date à telle date. Cette année, je le verrais bien de telle date à telle date”. Donc le simple fait de modifier une date, le brave homme m’a fait refaire entièrement les documents que j'avais préparés auparavant ” (MG , v. 43).

c) Conclusions

Les énoncés étudiés ci-dessus se répartissent sur trois niveaux de généra­lité : universels ( i), généraux ou habituels (ii), particuliers (iii, iv,v). Les types ii, iii, et iv peuvent être considérés comme des exemples. Leur valeur de connais­sance dépend de leur rapport aux énoncés du premier type. Seuls les types ii et iii peu­vent être retenus dans l'extraction de connaissances, telle qu'elle se pratique ordi­nairement. Les types iv et v se rapportent en effet à des normes passées (invalidées) ou non validées (états de fait).

Voici comment se déroule le cycle explicatif .

1) La formule initiale signale un décrochement par rapport au niveau de géné­ralité supérieur. Le mot exemple est employé indifféremment  pour les exemples et les anecdotes. D’autres expressions, comme je prends, ou simplement comme   (cf. "un train comme le 21") sont également employées.

2) Le corps de l'exemple décrit un processus, éventuellement détaillé par des conditions (généralement introduites par si ) qui entraînent des variantes (généra­lement introduites par quand ).

3) La "remontée" de l’exemple le situe par rapport aux énoncés normatifs, de généralité supérieure (cf. des formules comme si tous les trains étaient comme ça, ou on ne va pas rentrer dans les détails ). En revanche, la “ remontée ” des anec­dotes les situe non par rapport aux énoncés normatifs, mais par rapport à l'énon­ciation représentée (formules de justification comme ça aura une grande influence sur  ou c'est pour ça que je dis que ).

Enfin, voici le bilan des observations qui touchent les indices linguistiques.

1) Les deux premiers niveaux de généralité ont en commun l’aspect imperfec­tif des processus, mais diffèrent par leur degré de détermination, supérieur au deuxième. On ne rencontre d'aspect accompli qu’au troisième niveau, dans les exemples de processus illégitimes, ou dans les anecdotes des deux dernières sortes ; le passé composé leur est donc réservé. En revanche, le présent  est com­mun aux deux premiers niveaux de généralité, et le futur proche est propre au deuxième.

2) Quant à la personne, le on est commun aux deux premiers degrés de géné­ralité, et le vous   est propre au deuxième. Le je ne se rencontre dans les anomalies et dans les anecdotes des deux dernières sortes.

(3) La détermination va croissant du premier au cinquième type d'énoncé. On relève des affinités entre l'aspect imperfectif et les pronoms personnels indéfinis (ou inclusifs) d'une part ; et d'autre part entre l'aspect perfectif et les pronoms per­sonnels définis de première personne. Elles reposent sur des relations séman­tiques fines que nous ne pouvons détailler ici.

Les observations qui précèdent ne pourraient pas être transposées sans précautions dans une autre langue que le français. Si la méthode présentée ici procède d'une théorie sémantique générale, sa capacité descriptive exige de tenir compte des spécificités des langues particulières.

7.3. L’énonciation représentée

Ordinairement, les méthodes "d'extraction des connaissances" ne tiennent pas systématiquement compte de l’énonciation représentée dans le texte. On paraît tenir pour négligeable l'attitude de l’expert à l'égard de son interlocuteur, comme à l’égard de ses propres propos. Cela procède d’une conception du langage qui en fait un simple instrument de représentation : il représenterait la réalité, et véhicule­rait ainsi des connaissances qu’il ne resterait plus qu’à extraire par des méthodes appropriées. Cette conception, fort ancienne dans la philosophie du langage, a sans doute le mérite d'être simple, mais aussi le défaut d'être simpliste. En effet, si le langage peut être, dans certaines conditions plus complexes qu’il ne paraît, un moyen de représenter et de communiquer de l’information au sens non-technique du terme, il ne se réduit jamais à cela : tout échange linguistique met en jeu des facteurs émotifs divers (ludiques, passionnels, phatiques, etc.) ; cela apparaît avec évidence dans les textes oraux comme ceux qui nous occupent.

Une analyse linguistique globalisante doit tenir compte de ces facteurs, ne serait-ce que pour identifier leurs effets, quitte à les éliminer si l’application le requiert. En guise d’illustration, nous allons d'abord présenter, dans un des corpus choisis, l’établissement d'un contrat interlocutif. Cette analyse relève de la composante dialogique du texte.

a) Un contrat interlocutif

On dit depuis Malinowski que le langage a, entre autres, une fonction pha­tique, qui consiste à établir et à maintenir le contact entre les participants de l'échange linguistique. Elle est à l'œuvre en particulier dans les échanges oraux. De cette fonction relèvent non seulement les incises du type vous me suivez, qui marquent l’intérêt à l’égard de l'interlocuteur, mais encore de véritables stratégies interlocutives. Indépendamment de toute hypothèse fonctionnelle, nous décrirons cette part de la composante dialogique qui traite de l’interlocution représentée. Voici par exemple les phases de l'établissement d'un contrat interlocutif, telles qu’elles apparaissent au début du corpus MG.

(i) L'entretien commence ainsi : “ Voilà comment je comptais procéder : le but final étant le roulement, on définira après ce que c'est que le roulement, c'est de vous faire passer par tous les cheminements [...]” (v. 1). L'emploi du on inclusif (je +vous ) permet de constituer une communauté de travail, après une entrée en matière courtoise (l'imparfait a ici un sens atténuatif).

(ii) “Alors il y a deux solutions : soit je vous donne tous les documents avant, ce qui vous permet de suivre dans la montée, soit je vous les donne en final. La règle veut qu'on ne les donne pas avant, parce que les gens les regardent et n'écoutent pas ce que l'on dit, mais des fois, entre des personnes mûres on peut les distribuer avant, cela permet... lorsqu'on explique...” (v. 2). Ici, l'expert propose au "cogniticien" de choisir un rôle interlocutif : celui du néophyte, conforme à "la règle", ou celui de la "personne mûre".

(iii) Faute de réponse, il va se présenter et retracer sa carrière : “ Un petit historique quand même : je vais vous dire qui je suis. Je suis rentré à la SNCF en juillet 1964 [...] ”. Le quand même souligne que l'expert sait bien que sa biographie n'entre pas dans le cadre standard de l'entretien, mais qu'il entend lui donner un tour personnel. Et dans ce récit, il va glisser une sorte d'apologue : “ j'ai donc marché de pair avec un ingénieur informaticien […] avec lui nous avons fait un petit peu ce que vous allez faire maintenant, nous avons mis sous forme informatique. Alors je vous dirai qu'en ce qui concerne l'informatique, je sais ce qu'est un écran, un clavier, une disquette, mais le reste ne m'intéresse pas donc je ne m'y suis jamais penché. Et ce garçon était lui, complètement ignorant de ce qu'était la partie ferroviaire et donc nous avons, ensemble, nous avons mis nos moyens à disposition, notre vie commune a duré plusieurs mois et à la fin nous avons réussi à sortir un produit, un produit performant [...]” (v. 7). Après avoir attribué au cogniticien le rôle du néophyte, l'expert s'attribue un rôle équivalent, et donc instaure une relation d'égalité nécessaire au contrat.

(iv) Après quoi, il dramatise l'entretien en désignant un acteur opposant, la SNCF : “ Je suis dans un boulot qui ne me plaît pas du tout [...] enfin à la SNCF on ne fait pas toujours ce que l'on veut [...] Pas de question là-dessus ? Non de toutes façons c'est trop tard, ma carrière est déjà loin derrière ” (v. 7). L'expert cherche ici à mettre le cogniticien de son côté, et à créer ainsi une connivence.

(v) En conséquence, il élimine les usages terminologiques de la SNCF, dési­gnée comme opposant : “ J’essayerai d'employer le moins possible d'abréviations, je sais que ça foisonne à la SNCF [...] Ça partait de l'IVG [interruption volontaire de grossesse], le TGV, enfin tous des sigles où à la fin les gens ne comprennent plus rien du tout ”.

(vi) De même que la polémique avec un tiers absent pris comme tête de Turc (ici la SNCF), la plaisanterie avec l'interlocuteur a aussi une fonction phatique : “ vous verrez je plaisante souvent [...] Le TGV, moi j'ai toujours essayé de connaître qu'une chose, la couleur. Je sais qu'ils sont oranges. C'est déjà pas mal. Le reste il y a des techniciens qui sont là pour le connaître ” (v. 9).

(vii) Après diverses explications, et ses propositions de contrat interlocutif étant restées sans réponse, l’expert s’interrompt : “ Pas de questions là-dessus ? Vous m'arrêtez parce que je ne vais pas tarder à avoir soif si cà continue ” (v.17). Il ne s’agit pas ici, ou pas seulement, de se faire payer à boire, forme canonique du contrat social en France. À ce mandement, l'expert doit répondre par une accepta­tion, celle du contrat interlocutif. Il le fait, après un silence, par une phrase de relance : “  Vous dites que depuis 81 la rentabilité des rames décroît ?”.

L'ensemble de la relation interlocutive mériterait une étude détaillée. L'analyse partielle et préliminaire que nous venons de présenter peut du moins dissiper l’illusion que "l'extraction d'expertise" repose sur une communication neutre et purement informative. Les facteurs humains présents dans la relation interlocutive ont sans doute une incidence sur la qualité même des données recueillies.

b) Les évaluations et les optimisations

Outre l'énonciation représentée dans le texte, et dont relèvent les contrats interlocutifs, la composante dialogique rend compte des modalités évaluatives. Ces modalités situent les objets sur des échelles d’acceptabilité, qui varient ordi­nairement selon les acteurs. Les textes d'experts fourmillent d'évaluations, et la compétence d'un expert pourrait précisément se définir par sa capacité à produire des évaluations jugées pertinentes. Par exemple, dans le domaine des lancements de satellites, il est crucial de définir ce que l'expert appelle une mesure foireuse (cf. “dans le cas lancement qui nous intéresse [...], si tu lances le calcul d'orbite et qu'il y a des mesures foireuses dedans, il peut très bien arriver le phénomène sui­vant : c'est que tu n'arrives pas à les éliminer, et que tu as de gros résidus partout”, document du Centre National d’Etudes Spatiales (CNES), d’après Vogel, 1988 b, p. 3). Le caractère esthétique des évaluations ne doit pas surprendre : passé un certain degré de compétence, l’expert utilise un vocabulaire esthétique (ex : "ça fait un joli bruit"), non seulement parce qu'il n'a pas d’autres mots à sa disposition, mais sans doute aussi pour témoigner de l'investissement affectif dans la tâche (sans lequel il ne serait pas parvenu à l’excellence).

Outre les paramètres propres aux tâches, les évaluations portent aussi sur les tâches elles-mêmes. Dans le corpus MG, on relève par exemple : “ en ce qui concerne les régimes de circulation, alors là c’est ma bête noire [...]. Je prends par exemple un train qui s’appelle le 643 [...] voilà gagné le cocotier [...]. Chaque jour de calendrier est pour certains trains un poème. Alors quand ce train est un poème et qu'il est tout seul, je dirais que c'est un moindre mal. Mais lorsque ce poème est marié avec un autre poème, c'est que vous avez des trains qui sont à tranches, cette fois-ci ils vont partir de la gare A vers la gare B, mais seulement à un point avant la gare B, ils vont éclater et il y en aura un qui ira vers la gare C ” (v. 52-60). Ces évaluations mettent obliquement en cause les normes en vigueur dans l'entre­prise : “ On est arrivé à un stade où c'est tellement touffu, j'allais dire foutu (rires)... qu'il faudrait remettre à plat l’ensemble du système pour essayer d'y voir et repartir sur d'autres bases. Maintenant on peut faire ce que les gens appellent de la dentelle, moi j'appelle cela du replâtrage et ainsi de suite... ” (v. 75).

Or, par principe, les systèmes d'information décrivent les normes en vigueur. Cependant, quand il conteste ces normes, l’expert évoque des possibilités d'optimisation. Elles sont soit locales (cf. la 'dentelle' dans l'univers des 'gens', c'est-à-dire le 'replâtrage' dans l’univers du locuteur), soit globales (“ Mon idée est très simple, c'était de dire : on va les faire rouler en service commercial, et comme ils roulent pratiquement que la journée, entre 5 et 23 heures, et puis on fera le service d'en­tretien de ce matériel entre 23 heures et cinq heures. Ce n'est pas le cas, nous on ne travaille pas de nuit ”, v. 15-16). Sur le plan sémantique, les optimisations locales se situent dans le monde possible de l'univers du locuteur. En revanche, les optimisations globales se situent dans le monde contrefactuel de cet univers (cf. "c'était de dire", qui marque l'irréel, et "ce n'est pas le cas").

Quels que soient les objectifs de l'application visée, et, au-delà, la politique de l'entreprise, il apparaît que l'analyse sémantique des textes d'experts ne peut négliger ce type de phénomènes. Sans plus détailler, il semble que l'analyse linguistique des textes experts se justifie, pour peu qu'elle donne la prééminence à la sémantique. Il reste bien sûr à élaborer une méthodologie pratique d'analyse à l'usage des cogniticiens. Elle ne se substitue pas aux méthodes du type KOD, KADS, NIAM, ou REX, car elle constitue un préalable à leur application. Par ailleurs, il paraît souhaitable d'entre­prendre une étude interdisciplinaire des textes d'experts. Elle associerait linguistes, psychologues et informaticiens, dans le cadre d’une recherche ergonomique.

Retour au sommaire


NOTES

[18] Nous remercions l’auteur et la rédaction de nous avoir autorisés à le reproduire (cf. annexe 3).

[19] Dans une classe lexicale, aussi bien que dans une classe de syntagmes, d’acteurs ou d’agonistes, le parangon est l’élément le plus valorisé. La valorisation peut être propagée par le contexte, et/ou être déterminée par l’axiologie.

[20] Un caparaçon est une pièce d’armure destinée aux chevaux, même si l’analogie avec carapace s’impose dans ce contexte. On retrouve ici le topos du monstre attendrissant, du dragon de sainte Marguerite aux multiples dinosaures de dessins animés.

[21] Nous prenons nos exemples dans deux entretiens réalisés dans le cadre de projets de la SNCF,  et aimablement communiqués par la Cisi-Ingéniérie. Les extraits sont référencés par des initiales de l’expert, suivies du numéro de page ou de "verset" ; nous avons parfois modifié l'orthographe ou la ponctuation de la transcription. N’ayant pu obtenir de l’entreprise l’autorisation de reproduire ces textes, nous en avons extrait les citations pertinentes pour notre propos.

[22] Ainsi, le mot exemple signale aussi bien des exemples que des anecdotes, mais le mot anecdote ne signale que des anecdotes.


© 2002 pour l'édition électronique