Rosenthal : Approche microgénétique du langage et de la perception 2

On commence par l'observation des patients aphasiques dits agrammatiques dont le langage spontané est dépourvu des morphèmes fonctionnels (articles, auxiliaires, pronoms, conjonctions, prépositions, terminaisons des verbes, etc..), de sorte qu'il apparaît comme un langage télégraphique [32] . Au cours des années 1970, de nombreux chercheurs se sont penchés sur la production et la compréhension du langage de ces patients et ont pour la plupart constaté un parallélisme dans le type de déficits affectant la production et la compréhension : les agrammatiques tendaient à omettre les morphèmes fonctionnels en production et à se conduire en compréhension comme s'ils ignoraient leur présence dans la phrase (Caramazza & Zurif, 1976; Heilman & Scholes, 1976; Kremin & Goldblum, 1975; Rosenthal & Bisiacchi, 1982; von Stockert, 1972; Zurif, Caramazza, & Myerson, 1972; Zurif, Green, Caramazza, & Goodenough, 1976) . Ce comportement se traduisait par des erreurs [33] de compréhension de phrases, notamment lorsque ces morphèmes fonctionnels étaient critiques pour l'interprétation.

L'opinion dominante autour de 1980 était que ces patients avaient perdu la morphologie fonctionnelle et que leur syntaxe était gravement compromise (Berndt & Caramazza, 1980; Schwartz, Saffran, & Marin, 1980) . Le seul élément discordant dans ce concert était l'observation faite par Andreewsky et Seron (1975) que, compte tenu de l'ambiguïté morpho-syntaxique omniprésente dans le langage (par exemple son , ton , car , as , sous , or sont tous, selon le contexte, des mots fonctionnels ou des noms), il est impossible de ´laisser de côté' les mots fonctionnels de la phrase sans les avoir préalablement identifiés comme tels, ce qui implique le traitement de tous les mots de la phrase et des rapports syntaxiques locaux qu'ils entretiennent à l'intérieur de celle-ci. Andreewsky et Seron ont étudié la compréhension en lecture d'un patient agrammatique et montré qu'il lisait ou ne lisait pas à haute voix un mot donné ( car ) selon que celui-ci était, dans le contexte, un nom ou une conjonction (par exemple Le car ralentit car le moteur chauffe ), ce qui confirmait ainsi leur analyse (voir aussi Linebarger, Schwartz, & Saffran, 1983, qui ont trouvé que les patients agrammatiques sont capables d'évaluer la grammaticalité d'une phrase sans être pour autant en mesure de l'interpréter correctement) . Parallèlement, les chercheurs en linguistique automatique étaient eux aussi confrontés, quoique d'une façon différente, au problème de l'ambiguïté morpho-syntaxique des phrases (voir il lit le livre vs. il livre le lit ; il montre la règle vs. il règle la montre ) qui rendait très difficile le traitement automatique du langage. Avec ces travaux, la désambiguation morpho-syntaxique apparaissait comme le préalable à tout traitement linguistique utile. Nous avons suggéré avec Evelyne Andreewsky qu'une désambiguation morpho-syntaxique revient en fait à repérer les domaines de connaissance relatifs à l'énoncé traité donc à induire l'étape générale de l'interprétation (Andreewsky & Rosenthal, 1986; Andreewsky, Rosenthal, & Bourcier, 1987) .

A partir de ces premiers constats théoriques, nous avons procédé avec Martine Dési à une étude détaillée de la lecture de trois patients agrammatiques. Il s'agissait de l'expérience suivante : on présente au patient des phrases comportant des homographes non-homophones dont la prononciation change en fonction de la classe grammaticale [34] . On peut ainsi contraster la lecture à haute voix (et surtout la prononciation des mots tests) de phrases comportant deux acceptions lexico-grammaticales du même morphème, comme dans :

Pour rendre cette tâche plus difficile nous avons même introduit des biais sémantiques, comme dans les exemples suivants :

Bien que les patients éprouvaient des difficultés à lire tous les mots de ces phrases, qu'ils tendaient à omettre un certain nombre de mots fonctionnels ou à produire des paralexies (par ex. lire ‘Vivre dans les nuages' à la place de 'Je vis sur un nuage'), dans tous les cas leur lecture (i.e. leur prononciation) manifestait une désambiguation lexicale correcte- et par cela-même une détermination de la classe syntaxique- des homographes tests utilisés (cf. Dési, Rosenthal et Andreewsky, 1986, Rosenthal & Goldblum, 1989) . On notera que seule la capacité de traiter les relations morpho-syntaxiques locales permet de savoir que 'rations' dans 'nos rations sont...' correspond à un nom prononcé [ rasjõ ] tandis que 'rations' dans 'nous rations le...' ne peut correspondre qu'à une forme de verbe conjugué que l'on prononce [ ratjõ ]. On remarquera également que le traitement de ces relations morpho-syntaxiques locales reposait dans l'exemple cité sur le traitement des mots fonctionnels qui précèdent et suivent la cible 'rations'. Dès lors comment pouvait-on accepter l'idée que les agrammatiques aient perdu la morphologie fonctionnelle et que leur syntaxe était gravement compromise, alors qu'en même temps on pouvait constater une telle capacité à réaliser la catégorisation lexicale sur la base des relations morpho-syntaxiques, et cela en dépit du petit piège sémantique (induit par le couplage lexical religieuses – couvent, rations- train, etc.)? Il faut souligner que ces patients tombaient par ailleurs dans tous les pièges habituels que les neurolinguistes tendent aux patients agrammatiques; leur performance était aléatoire quand il s'agissait d'apparier des images à des phrases de type : 'le carré est au dessus du cercle' ou 'le chat que le chien poursuit est noir', ou ils choisissaient systématiquement la structure thématique usuelle en désignant comme actants, pour des phrases de type : 'la petite fille donne à manger à sa maman' ou 'le patient examine le médecin', respectivement, la maman et le médecin.

Dans cette même étude nous avons comparé le comportement de ces patients et de sujets normaux dans une épreuve de détection de lettres au cours de la lecture silencieuse d'un texte. Dans ce type d'épreuve, Healy et ses collaborateurs (Drewnowski & Healy, 1977; Healy, 1976) avaient déjà montré l'existence d'un effet de la classe syntaxique. Lorsqu'on demande aux sujets de lire un textetout en cochant toutes les occurrences d'une lettre donnée, ils ´oublient' de cocher (c'est-à-dire ne détectent pas) la lettre-cible beaucoup plus souvent dans les mots fonctionnels que dans les mots pleins, et cela même lorsqu'il s'agit de la même forme lexicale (par exemple les deux occurrences de 'son', 'ton', cf. Greenberg & Koriat, 1991) . Nous avons observé le même phénomène avec nos patients agrammatiques qui par ailleurs ne différaient pas qualitativement des sujets témoins. Lorsque nous avons présenté aux sujets les mots issus du même texte mais en désordre (scrambled text), l'effet de la classe syntaxique a disparu : les agrammatiques, tout comme les sujets témoins, faisaient autant d'omissions dans les mots fonctionnels que dans les mots pleins. Cette expérience montrait de toute évidence que les agrammatiques n'avaient perdu ni la syntaxe ni la morphologie fonctionnelle et qu'ils procédaient à des traitements morpho-syntaxiques et syntaxiques complexes dont la nature reste à déterminer.

D'autres travaux, notamment ceux de Grodzinsky (1984) montraient que la thèse de la perte de la morphologie fonctionnelle est incompatible avec les observations de l'agrammatisme dans une langue comme le russe dont la morphologie est plus riche que celle du français ou de l'anglais, ou qu'elle est totalement impossible dans le cas de l'hébreu où l'absence de la morphologie fonctionnelle conduirait à des non-mots.

En analysant le polonais, dont la grammaire repose essentiellement sur la morphologie flexionnelle, j'ai réalisé que les transformations flexionnelles créent dans une telle langue (et cela vaut pour toutes les langues à déclinaison) d'innombrables accidents homonymiques, de sorte que l'identité lexicale de tout mot d'une phrase est potentiellement ambiguÎ. Les exemples suivants illustrent ce propos. Ainsi tous les mots dans la phrase :

sont ambigus dans la mesure où les mêmes formes correspondent à d'autres mots (où leurs formes déclinées) du polonais. Ainsi, les deux premiers mots 'nie' (adverbe de négation) et 'damy' (première personne du pluriel du verbe 'donner') peuvent se retrouver dans :

où ils deviennent, respectivement, un nom au pluriel (dames) et un pronom objet féminin (les). Les autres mots du premier exemple vont, dans les exemples suivants, également changer d'identité lexicale et de classe syntaxique :

le pronom datif 'ci' (te) devenant un pronom indicatif alors que le nom génitif 'grabi' (râteau) devenant un verbe (dévaliser). Ces exemples n'ont pas pour but d'indiquer une curiosité spécifique au polonais (cela vaut également pour le russe, le tchèque,.. et pour toute autre langue dans laquelle les relations syntaxiques sont encodées par les flexions) mais de montrer l'ambiguïté générale des formes lexicales. Cette ambiguïté est très fréquente en français ( il lit le livre vs. il livre le lit ; il montre la règle vs. il règle la montre , etc.), et elle est particulièrement sensible quand l'on considère le problème de la segmentation de la parole continue en mots. Ainsi :

peut être segmenté par un système dépourvu de toute analyse morpho-syntaxique

Ces travaux et ces considérations ont pavé la voie à la théorie de l'identification lexicale et de la structuration référentielle (Rosenthal & Goldblum, 1989) . La détermination de l'identité lexicale de tous les mots des énoncés constitue le préalable linguistique à tout autre traitement utile. Un individu ne pourrait rien comprendre s'il n'était pas capable de mener à bien la détermination de l'identité lexicale. Cette détermination est accomplie par un ensemble de procédures de désambiguation morpho-syntaxique basées sur des interdépendances structurelles locales et l'inventaire morphémique de la langue. Elle n'est pas suffisante, et de loin, pour l'interprétation correcte du langage mais suffisante pour induire une interprétation de type agrammatique (Baum, 1989; Schwartz, Linebarger, & Saffran, 1987) . Pour se conduire en agrammatique le patient doit au minimum être capable de la désambiguation morpho-syntaxique. Les lois d'interdépendance structurelle locale diffèrent d'une langue à l'autre en fonction notamment de leurs propriétés morphologiques, mais le principe de ces lois reste toujours le même : la désambiguation morpho-syntaxique doit conduire à l'identification d'un item comme un mot m k de l'inventaire morphémique de la langue, ce qui revient aussi à déterminer sa classe grammaticale.

A partir de là nous avons fait des prédictions concernant le comportement des agrammatiques dans un certain nombre de langues et évalué expérimentalement l'une d'entre elles, relative au français. Selon les données disponibles de la littérature aphasiologique les agrammatiques étaient strictement incapables de faire un quelconque usage des articles. Or, en français, le genre de l'article constitue parfois le seul moyen pour déterminer l'identité du nom ( le moule vs. la moule , le vase vs. la vase , le poêle vs. la poêle , etc.). Suivant notre théorie les agrammatiques devaient être capables d'identifier correctement de tels noms en fonction du genre de l'article. Cette prédiction a été corroborée expérimentalement, d'abord par Rosenthal et Goldblum (1989) , puis, dans deux études conduites au Québec, par Jarema et Kehayia (1992) et Jarema et Friederici (1994) . L'intérêt de ces deux dernières études réside, d'une part dans la confirmation expérimentale de certaines prédictions de la Théorie de l'Identification Lexicale par des chercheurs travaillant dans un cadre différent du notre (Jarema et Friederici, 1994) et, d'autre part, dans l'extension de nos résultats concernant la compréhension d'articles par les patients agrammatiques à la production d'articles par ces patients (Jarema et Kehayia, 1992).

La théorie présentée dans Rosenthal et Goldblum (1989) marque très nettement la distinction entre identification lexicale (réalisée au moyen de la désambiguation morpho-syntaxique) et structuration référentielle . Traditionnellement, la linguistique décomposait la grammaire en deux parties autonomes, chacune constituant un tout : la morphologie (concernant la forme des mots) et la syntaxe (concernant la structure syntagmatique des phrases). Or cette division du travail paraît fonctionnellement et téléologiquement incorrecte; d'une part, la morphologie et certains éléments de la syntaxe locale sont interdépendants (cf. de Bleser & Bayer, 1988) , d'autre part, et surtout, l'identification lexicale et la détermination de la structure référentielle ne servent nullement les mêmes objectifs et sont réalisées avec des moyens très différents.

Un exemple reprenant le problème de l'emploi des articles en français permet d'illustrer ce propos. Selon la théorie de l'identification lexicale et de la structuration référentielle, l'analyse du genre de l'article fait partie des moyens mis en úuvre par l'identification lexicale (car elle est souvent indispensable pour déterminer l'identité lexicale du nom), alors que la détermination du nombre de l'article relève de l'analyse référentielle (car elle sert à coindexer différentes entités). Ainsi, les patients agrammatiques doivent pouvoir identifier un nom sur la base du genre de l'article qui le précède (cf. ci-dessus) tout en se montrant incapables de se servir de l'indice référentiel que fournit le nombre de l'article dans leur interprétation des énoncés. Et en effet, une patiente agrammatique a montré cette dissociation dans une épreuve de jugement de grammaticalité de phrases. Alors que cette patiente n'éprouvait aucun mal à repérer les usages erronés du genre, elle acceptait invariablement comme correctes des phrases de type : * Le mille-pattes marchent vite , c'est-à-dire des phrases où le jugement de grammaticalité reposait d'une façon critique sur la capacité d'analyser le nombre de l'article.

Par structure référentielle il faut entendre la structure implicite de l'ensemble des relations internes [35] à l'énoncé qui forment une sorte de trame permettant d'orienter et de structurer l'interprétation. Le concept de structure référentielle présuppose donc que tout énoncé comporte des traces des intentions thématiques du locuteur (au plan de l'interprétation conventionnelle dont il a été question plus haut) et que l'analyse de ces traces fournit un schéma au processus interprétatif. L'identification lexicale rend possible toute une série de processus liés à l'interprétation mais ne fournit à cette dernière aucune structure. Toutefois, dès que les mots de la phrase sont connus, les anticipations thématiques prennent tout leur relief, et l'on peut ´utiliser' les connaissances normalement associées à la cooccurrence de ces mots ainsi que la connaissance des situations dans lesquelles cette combinaison est susceptible d'avoir lieu. Tout ceci est loin d'être négligeable mais nous n'irions pas très loin en interprétant les énoncés exclusivement sur la base de ce que nous attendons ou savons déjà et non pas en fonction de ce qui a été dit. L'interprétation conventionnelle implique de toute évidence une transformation des attentes et une actualisation, ad hoc , des savoirs en fonction des indices référentiels des énoncés (ces traces dont l'analyse fournit un schéma hic et nunc au processus de l'interprétation).

La définition des ´processus [36] ' référentiels constitue donc un problème incontournable pour modéliser la compréhension du langage. Il s'agit de processus au pluriel car la structure référentielle est comme une sorte de toile tissée d'une variété de fils de nature parfois assez différente, pouvant être aussi bien syntaxiques que pragmatiques. Ainsi, bien que tous les éléments de la structure référentielle concourent au même objectif (fournir un schéma hic et nunc à l'interprétation), leur analyse n'implique pas forcément les mêmes moyens. Cette différence d'analyse permet de traiter certains phénomènes référentiels de façon locale, comme s'il s'agissait de phénomènes indépendants (cf. par exemple Altmann, 1989; Garnham & Oakhill, 1987; Halliday & Hasan, 1976; Levinson, 1987; Tanenhaus, Boland , Garnsey, & Carlson, 1989) . Mais en dépit de l'intérêt des travaux concernés, de tels découpages thématiques ne permettent pas de rattacher les éléments de la structure référentielle étudiés à ce à quoi ils servent.

L'analyse référentielle doit notamment permettre de déterminer qui fait quoi parmi les différents agents, d'orienter l'action, les personnes et les objets dans le temps et dans l'espace, de relier les entités co-référencées, de signaler ce qui est important, etc.., autant d'éléments qui contribuent à la cohésion du discours, maintiennent sa continuité et... se co-définissent. Le langage emploie une panoplie considérable d'indices référentiels : structure argumentale des verbes (un verbe prend un certain nombre de places définies qui renvoient à des entités telles que : agent, bénéficiaire, instrument, etc..), structure pronominale (sujet-objet directs, démonstratifs, relatifs, adverbiaux, etc..), co-référents, co-spécificateurs, formes définies, (ex. articles définis), structures clivées, formes déictiques (ex. je-tu , ici-labas , près-loin ), etc.. Tous ces indices référentiels constituent des traces des intentions du locuteur, permettent d'orienter et de structurer l'interprétation en termes d' ici et maintenant . Mais leur analyse au cours de l'interprétation comporte une structure hiérarchique (c'est-à-dire doit respecter un ordre, certaines analyses pré-conditionnant d'autres), de sorte que ce qui peut paraître hétérogène en juxtaposition ne fait qu'exprimer une certaine logique de traitement dans la dimension temporelle.

L'analyse des troubles aphasiques dont l'origine semble souvent se situer au niveau de certaines phases de l'analyse référentielle (affectant en cascade les opérations qui suivent) constitue l'un des moyens les plus propices pour étudier la structuration référentielle de l'interprétation. Certains travaux neurolinguistiques laissent penser que la séquence des principales analyses référentielles reflète le sens général dans lequel se déroule l'interprétation [37] . Les premières opérations semblent fournir la base d'une interprétation très grossière (par exemple, le thème général) qui peut néanmoins être suffisante dans certains contextes du point de vue comportemental. Ainsi, la détermination de la structure argumentale du verbe et l'attribution globale des rôles thématiques (sujet-action-objet) paraissent faire partie des principales opérations référentielles effectuées dans la première phase du traitement. Ces opérations semblent être assez ´résistantes à la lésion' et sont souvent épargnées chez les aphasiques (cf. Canseco-Gonzalez, Shapiro, Zurif, & Baker, 1990; Canseco-Gonzalez, Shapiro, Zurif, & Baker, 1991; Shapiro & Levine, 1990) ce qui explique la bonne performance des patients dans les expériences qui reposent sur l'attribution globale des rôles thématiques (on demande aux sujets de mimer l'action décrite par la phrase-cible ou d'apparier phrases et images), c'est-à-dire les expériences qui n'examinent que les éléments les plus grossiers de l'interprétation. Toutefois, dès que l'on examine l'attribution des rôles thématiques d'une façon plus complète, tenant compte du traitement des formes définies, des co-référents pronominaux et des co-spécificateurs (ex. : Pierre est tombé en essayant d'escalader le mur de l'école. L' enfant s'est cassé la jambe.) [38] – ce qui dépasse le contexte d'une phrase simpleñ on constate des erreurs massives chez certains patients, des erreurs ponctuelles chez d'autres.

Avec Michel de Fornel nous avons présenté une première ébauche de la théorie de structuration référentielle (de Fornel & Rosenthal, 1987) . Dans cette première formulation, nous avons conceptualisé la structure référentielle en termes d'espace- espace de travail , espace référentiel - en nous focalisant tout d'abord sur le repérage et la délimitation des savoirs nécessaires à l'interprétation [39] .

Nous sommes partis du constat que la détermination de l'identité lexicale des mots d'une phrase constitue le préalable nécessaire pour repérer et délimiter les domaines du savoir concernés [40] . En effet, pour s'engager dans le processus d'interprétation d'une phrase il faut délimiter les domaines de savoir qui la concernent, ceux notamment qui sont associés aux mots pleins (substantifs, verbes, etc..) de cette phrase. Cela présuppose un lien déterminable entre mots de la langue (unités morphologiques) et domaines de savoir auxquels ils sont fréquemment associés. La prise en compte de la cooccurrence de ces mots permet de délimiter les seuls domaines de savoirs concernés , ce qui équivaut, implicitement, à la désambiguation des éventuelles polysémies. Par exemple, si le mot polysémique ´vol' est entouré de mots comme «battements d'ailes ' , ´vent' , etc. , autrement dit de mots liés au déplacement dans l'air et non à un acte délictueux consistant à dérober des biens, alors le savoir lié à ce dernier domaine (qui n'est pas associé aux autres mots de la phrase) peut être éliminé du jeu, ce qui lève de ce fait l'ambiguïté de ´vol' . Il est à noter que de telles polysémies peuvent être résolues au moyen d'un traitement purement formel , que ce soit en exploitant certaines règles morpho-syntaxiques du français ou en se fondant sur le fait que, statistiquement, l' ensemble des mots qui co-occurrent dans un contexte donné ne cooccurrent pas dans un autre contexte. Ce procédé de résolution des polysémies a d'ailleurs été implémenté sur ordinateur (cf. Andreewsky et al., 1987) . Nous avons par ailleurs exploré une démarche analogue pour la résolution automatique des anaphores (Rosenthal & de Fornel, 1985) .

La délimitation des domaines de savoirs concernés amorce de fait une pré-compréhension . Cette pré-compréhension peut dans certaines conditions limites n'être suivie d'aucun autre traitement; elle peut d'ailleurs être mise en évidence sur le plan comportemental. On peut notamment montrer l'effet de ces conditions limites chez certains sujets aphasiques (capables, par exemple, d'apparier des mots ´sémantiquement proches' qu'ils ne peuvent ni lire ni «comprendre' ) ou chez des sujets normaux au moyen d'expériences de présentation subliminale de mots (cf. Marcel, 1983) .

Nous avons appelé l'ensemble des domaines de savoirs ainsi délimités ´ l'espace de travail ' des processus d'interprétation d'un énoncé. C'est dans cet espace qu'il s'agissait de définir les interactions entre la structure linguistique de l'énoncé et les différents savoirs liés à cet énoncé. Cet espace de travail ne pouvait pas cependant être seulement fonction des domaines de connaissances liés à l'énoncé traité et du contexte pragmatique de l'acte d'énonciation. Étant donnée la continuité, sauf exception, du fonctionnement cognitif il ne peut pas y avoir de rupture entre les espaces de travail successifs, les espaces immédiatement précédents fournissant la base aux anticipations thématiques de l'instant t .

La délimitation de l'espace de travail ne permet pas pour autant de déterminer la nature des étapes opératoires qui doivent être franchies pour parvenir à l'interprétation. Tout d'abord, se pose un double problème : comment mettre en úuvre les seules interactions utiles, alors que le nombre d'interactions possibles entre les différents savoirs potentiellement concernés peut être astronomique et que le sens de l'énoncé reste à déterminer? Cette question exprime de fait le problème de 1'interactivité : comment sortir du cercle vicieux d'un très grand nombre d'interactions, en principe toutes possibles, sans recourir à une espèce de ´pilotage par le haut ' – ce qui ne fait que déplacer le problème.

Au premier abord, il semble impossible d'éviter l'explosion combinatoire des interactions entre les divers savoirs potentiellement concernés (et dont le nombre est quasiment infini). Ce problème est évoqué par Fodor (1983) et lui sert d'argument principal pour soutenir la thèse de l'impossibilité d'une science cognitive. Toutes nos connaissances, dit Fodor, peuvent potentiellement s'articuler entre elles (c'est le principe de l'interconnectivité infinie des connaissances) et toute interprétation, bien qu'apparemment liée à un domaine limité, peut faire appel à n'importe quel domaine de connaissances, même à des domaines qui semblent a priori sans aucun rapport avec les énoncés traités (c'est le principe de l'isotropie de l'interprétation).

Le problème se pose en fait à deux niveaux. D'une part, il s'agit de savoir comment ne choisir que les domaines du savoir concernés? La notion d'espace de travail peut constituer une réponse à cette question. Mais, d'autre part, qu'est-ce qui fait que l'interprétation ne bascule pas dans l'isotropie?

Trois raisons principales expliquent pourquoi l'isotropie n'est pas inévitable (voir aussi Rosenthal, 1988) . Premièrement, la continuité du fonctionnement du système : la structure de l'espace de travail, à l'instant t-1 conditionne en partie celle à l'instant t .

Deuxièmement, la propension au conservatisme qui consiste à privilégier les relations habituelles (ou, si l'on veut, les plus fréquentes ). Cette disposition est illustrée par des ´erreurs' de compréhension qui révèlent une «contamination' par le savoir de ce qui se passe habituellement. Sans cette dernière on ne peut interpréter le fait que, par exemple, la phrase «Le ballon a frappé la fenêtre' est très souvent comprise comme «Le ballon a brisé la vitre' ? On trouvera dans l'ouvrage de Lakoff (1987) plusieurs exemples de métonymie qui s'expliquent par ce même conservatisme cognitif.

Enfin, troisièmement, l'exploitation de certains aspects formels des énoncés (autres que ceux qui permettent de délimiter l'espace de travail) joue un rôle considérable dans l'émergence de l'interprétation.

Par «aspects formels' il faut entendre principalement les indices liés à la structure référentielle et thématique du discours. Les interactions visant à structurer l'espace de travail sont ainsi liées à la fois à la continuité du fonctionnement cognitif, aux anticipations thématiques, à la tendance à privilégier les associations habituelles entre différents types de savoir et à l'exploitation des indices formels. Ces indices permettent de privilégier certaines interactions et d'orienter certaines relations pour structurer l'espace de travail et constituer un espace référentiel . Le concept d'espace référentiel s'attache à un autre problème inhérent aux tâches de compréhension du langage, celui du traitement de la référence interne à un espace de travail. Sans ce concept, on ne peut guère expliquer la production et l'interprétation des termes référentiels dans le discours (en ce qui concerne, par exemple, la référence anaphorique), en particulier le problème de l'identification référentielle qui sera examinée plus bas. Ce concept est également indispensable pour expliquer la structuration thématique du discours, le choix lexical et les différences dans l'interprétation des alternatives verbales formellement équivalentes. C'est aussi à travers cette notion que l'on peut prendre en compte la richesse du langage, alors que classiquement les théories psycholinguistiques de la compréhension du langage tendaient à considérer que les différentes paraphrases d'un énoncé ont un statut cognitif identique.

les descriptions définies- l'ouvreuse, la salle et le film- référent à des entités non-mentionnées antérieurement dans le discours. Ce fait n'est guère explicable sans la notion d'espace référentiel. La structure de ce dernier mobilise en partie notre savoir sur l'art et la manière d'aller au cinéma mais elle comporte également des éléments nouveaux [41] . On notera que l'espace référentiel a peu de rapports avec les concepts classiques de ´scripts' ou de «frames' qui avaient pour but, du moins en partie, de traiter ces mêmes phénomènes (Minsky, 1975; Schank, 1975) . En effet, l'espace référentiel correspond à une structure implicite qui n'est ni préexistante, ni même distincte de l'espace de travail.

Le concept d'espace référentiel permet aussi d'engager une réflexion sur l'occurrence de certaines ´erreurs' comme, par exemple, certains lapsus ou aveux involontaires. Considérons l'exemple suivant, extrait d'un roman policier :

Il s'agit, bien entendu, d'un aveu involontaire. En anglais, Midge est soit un sobriquet qui désigne un homme soit un diminutif qui réfère à une femme. Nesbitt tombe dans le piège, aussi vieux que le monde, consistant à faire parler le suspect de ce dont il nie avoir connaissance. S'il disait la vérité, Nesbitt ne devrait pas connaître le référent de Midge et ne devrait donc pas y associer un domaine de connaissance spécifique. En identifiant Midge à une femme, il montre qu'il ment et que ce domaine «fait partie' de son espace référentiel. Cet espace devient alors un véritable piège, car il est extrêmement difficile d'éviter, par un effort conscient, une mention (dans cet exemple, en utilisant le féminin) ´révélatrice' de ses connaissances concernant les entités et leurs relations dans cet espace.

Regardons de plus près ce dialogue entre les deux policiers et leur suspect. Le nom de Midge est introduit à deux reprises (par les policiers) dans la conversation. Une première fois, dans une question partielle (où est Midge?) qui permet d'´introduire' une entité nouvelle dans l'espace de travail de leur interlocuteur, une seconde fois, sous la forme d'une spéculation (nous pensons que Big Anthony et Midge sont ensemble) permettant d'introduire certains éléments qui vont jouer un rôle central dans la structuration de son espace référentiel. Dans cette deuxième phrase, le syntagme nominal 'Big Anthony et Midge' est en position de thème (se référant à des entités déjà introduites), le prédicat 'sont ensemble' est en position de comment (entité ou relation nouvelle). Le rôle de ce dernier est particulièrement important dans la structuration de l'espace référentiel. En effet, la suite de la conversation (et surtout la réaction du suspect) montre que ce comment et ce thème , apparemment tout à fait bénins, ont entraîné un remarquable travail cognitif chez Nesbitt (en structurant son espace de travail), en créant un espace référentiel dont certains éléments clés (par exemple le fait que Midge est une femme et qu'elle pourrait avoir une relation amoureuse avec Big Anthony), non mentionnés par les interlocuteurs, constituent le piège dont il était question plus haut . Pour expliquer cet exemple , on ne peut s'en tenir à une simple représentation du contenu de cette phrase (d'ailleurs, qu'est-ce que ce contenu?) ou, purement et simplement, à l'évocation d'un domaine de savoir préexistant. L'aveu involontaire de Nesbitt oblige à envisager l'existence d'une structure référentielle ad hoc , certes composée en partie d'un savoir préexistant (le fait qu'il sache que Big Anthony ait une petite amie et, en particulier, qu'il connaisse Midge) mais aussi d'éléments nouveaux (notamment ceux liés à la possibilité que Big Anthony et Midge puissent avoir une relation amoureuse) qui interviennent d'ailleurs dans son «aveu' .

L'importance de ces éléments nouveaux apparaît aussi clairement si l'on considère les exemples de métonymie à la Nunberg (1978) , comme le suivant :

où l'on cherchera en vain une case adéquate pour ´omelette au jambon' dans une structure préexistante comme le script de restaurant de Schank. La possibilité de multiplier à l'infini les divers usages métonymiques rend de tels scripts inopérants pour traiter ce genre d'expressions. Des tels usages illustrent d'ailleurs le potentiel créatif et novateur du langage qu'interdisent les théories psycholinguistiques qui prennent les significations lexicales pour des unités de sens fixes résidant dans un lexique mental et servant de base (au moyen d'une combinatoire) à l'interprétation du langage [42] .

L'utilisation des connaissances du sujet et l'émergence de motifs thématiques nouveaux dans la structuration référentielle de l'interprétation ont été étudiées dans le cadre d'une recherche conduite à l'Université de Padoue avec des patients aphasiques, des patients atteints de lésions traumatiques du cerveau (sans trouble du langage), des sujets âgés et des étudiants (Rosenthal & Bisiacchi, 1997) . Dans cette recherche nous avons eu recours au paradigme expérimental de mise en évidence dans l'interprétation des phrases des ´elaborative effects' , paradigme initialement utilisé par Bransford et ses collègues (Bransford & Franks, 1971; Johnson, Bransford, & Solomon, 1973) . Dans la version classique de ce type d'expérience on lit aux sujets (ou on leur fait lire) des phrases dites à implication pragmatique, par exemple : le ballon frappe la fenêtre , et on procède à une épreuve de reconnaissance en leur fournissant parmi les choix alternatifs l'implication pragmatique de la phrase test: le ballon casse la fenêtre . Ces travaux ont montré que les sujets font un grand nombre d'erreurs de reconnaissance en choisissant les implications pragmatiques des phrases test (Johnson et al., 1973) . Il faut souligner que ce sont nos connaissances des matériaux (verre, ballon) et des situations typiques qui se produisent lorsqu'un ballon frappe une fenêtre qui permettent de thématiser le motif nouveau (casser la vitre). Ce ne sont en aucun cas les propriétés sémantiques du verbe frapper qui induisent une telle interprétation; pour s'en apercevoir il suffit d'essayer la phrase : le ballon frappe le mur que nul n'interprétera comme indiquant qu'un ballon a cassé un mur. Pour ma part, j'ai montré dans une expérience antérieure que ce phénomène de thématisation au moyen d'intégration tacite d'implications pragmatiques n'est pas lié au fait que l'on crée des ´pièges' parmi les choix proposés en reconnaissance : les sujets font les mêmes ´erreurs pragmatiques' dans une épreuve de rappel non indicé (Rosenthal, 1981) .

Dans la recherche menée à Padoue la principale expérience ne reposait pas sur une épreuve de mémoire mais sur une épreuve d'appariement de phrases et d'images. Ce choix répondait pour une part à des impératifs pratiques de l'expérimentation avec des sujets aphasiques, mais il répondait également à la critique que l'on pouvait adresser aux travaux sur les ´elaborative effects' au moyen d'épreuves de mémoire, à savoir que rien ne permet de savoir si ces effets d'intégration d'implications pragmatiques se produisent au cours de l'interprétation ou s'ils correspondent à des transformations qui interviennent postérieurement en mémoire. On pouvait en effet considérer qu'une épreuve d'appariement phrase- image sonde d'une façon plus directe l'utilisation des connaissances du sujet et l'émergence de motifs thématiques nouveaux induits par lesdites ´implications pragmatiques' .

Le tableau ci-dessous présente le matériel expérimental utilisé dans toutes les expériences de cette étude.

TABLEAU 1 : Les phrases (TI) ont des implications pragmatiques et les phrases (C) correspondent à la condition de contrôle

1. La bambina compera un gelato . 1. Il passegero monta sull'autobus .
La petite fille achète une glace. Le passager monte dans le bus.

2. La volpe afferra la gallina . 2. Il professore scrive sulla lavagna .
Le renard attrape la poule . Le professeur écrit sur le tableau.

3. La palla arriva contro la finestra . 3. Il poliziotto ferma l'automobile .
Le ballon frappe la fenêtre . Le policier arrête la voiture.

4. L'uomo prende una sigaretta . 4. L' uomo lava l'automobile.
L'homme prend une cigarette . L'homme lave la voiture.

5. Il cacciatore spara al cinghiale . 5. La ragazza si alza dal letto .
Le chasseur tire sur le sanglier . La fille se lève du lit.

6. Il campione di karatè colpisce il mattone . 6. Lo sciatore discende da una pista .
Le champion de karaté frappe la brique . Le skieur descend la piste.

7. Il violinista afferra il suo strumento . 7. Il medico visita il malato .
Le violoniste saisit son instrument . Le médecin examine le patient.

8. L'uomo fa cadere il vaso . 8. Il calzolaio ripara la scarpa.
L'homme fait tomber le vase . Le cordonnier répare la chaussure.

9. La donna scivola sulle scale . 9. Il gatto beve il latte.
La femme glisse dans l'escalier. Le chat boit du lait.

10. La nave si scaglia contro le rocce . 10. L'uomo va in bicicletta .
Le bateau fonce sur les rochers . L'homme monte sur la bicyclette.

A chaque phrase correspondaient trois images en couleur. Pour les phrases TI, qui ont des implications pragmatiques, le choix consistait en une image représentant l'événement décrit ( image correcte ), une image représentant l'implication pragmatique probable de cet événement ( image TI ) et une image mettant en scène les mêmes acteurs ou objets mais dans une action différente ( image distracteur ). Pour les phrases C (contrôle) le choix consistait en une image correcte et deux images distracteurs .

Quatre groupes de sujets ont participé à l'épreuve d'appariement phrases- images.

(a) 14 aphasiques (âge moyen 68,4) dont 7 aphasiques de Broca, 1 aphasique de Conduction, 4 aphasiques de Wernicke et 2 aphasiques anomiques.

(b) 14 patients (âge moyen 28,4) qui ont été victimes d'une lésion traumatique du cerveau (il s'agissait pour la plupart d'un accident de circulation) dont 5 lésions bilatérales, 5 lésions de l'hémisphère droit et 4 lésions de l'hémisphère gauche. Aucun de ces patients ne présentait de troubles du langage ou de la reconnaissance d'images.

Le tableau ci-dessous résume les résultats (la condition TI est marquée en italique gras).

	Tacit Implication Sentences			Control Sentences
Picture Choice	Correct	TI	Distractor	Correct	Distractor


Aphasics (14)	41.4	*54.3*	4.3	95.7	4.3
Elderly (19)	72.1	*25.3*	2.6	98.4	1.6
Head injury (14)	82.2	*15.7*	2.1	96.4	3.6
Students (10)	91	9	0	100	0

Plusieurs éléments marquants apparaissent à la lecture de ces résultats. Tout d'abord on constate que tous les sujets font des erreurs de type TI en thématisant une implication pragmatique probable de la phrase test. Il ne peut pas s'agir là de réponses au hasard puisque les résultats montrent que les erreurs consistant à choisir un distracteur ont été marginales. On note une sorte de gradation dans la thématisation de l'implication pragmatique, les aphasiques le font une fois sur deux, les sujets âgés une fois sur quatre, les patients cérébrolésés (jeunes et sans troubles du langage) une fois sur six, alors que les étudiants, une fois sur dix.

Le fait que même de jeunes étudiants fassent ce type d'´erreurs' est frappant. Lorsqu'il s'agissait d'expériences de rappel ou de reconnaissance on pouvait toujours contester l'idée que ces «elaborative effects' interviennent lors de l'interprétation des phrases et que les épreuves de mémoire favorisent la confusion entre l'interprétation initiale et la réflexion ultérieure, voire qu'elles induisent de tels effets par l'utilisation des items de reconnaissance faciles à confondre avec la cible. Or, dans le cas présent, le sujet avait sous les yeux la phrase test et les images à apparier et il disposait de tout son temps pour faire son choix. De plus, la consigne insistait sur la désignation de l'image représentant exactement ce que dit la phrase. Ainsi, le fait que même les étudiants thématisent de cette façon les implications pragmatiques probables de phrases indique que ce résultat ne peut pas être expliqué par la «défaillancedu système' due à la lésion du cerveau ou au vieillissement. Ce résultat ne peut pas davantage s'expliquer, en ce qui concerne les aphasiques, par la difficulté syntaxique des phrases tests dans la mesure où il s'agit dans tous les cas de phrases déclaratives simples dont la structure est la même dans les conditions TI et C.

Ces résultats illustrent ainsi la façon dont les sujets thématisent les motifs nouveaux (ici conséquences probables d'un événement) au cours de l'interprétation en se fondant sur leur savoir expérientiel. Cette thématisation est même susceptible de prévaloir sur les indices référentiels : l'existence des taux significatifs des réponses TI dans tous les groupes de sujets indique une tendance générale à se fier à l'expérience (ou au savoir expérientiel) et d'interpréter les énoncés en conformité avec des anticipations expérientielles, le cas échéant au détriment d'indices référentiels ici et maintenant . Cette tendance, comme le montre le Tableau 2, croît avec l'âge : les choix TI semblent être plus en rapport direct avec l'âge du sujet qu'avec le fait d'avoir été victime d'une lésion du cerveau. Les aphasiques font certes plus de choix TI que les sujets non-aphasiques d'âge comparable. Dans le cas présent, cela ne semble que confirmer le caractère référentiel des troubles aphasiques ou, du moins, indiquer qu'en cas de difficulté ´à démêler tous les fils référentiels' on privilégie ce que l'on sait d'expérience.

D'un autre côté, l'observation que les résultats des aphasiques ne sont que quantitativement différents de ceux des autres sujets renforce l'idée que la pathologie agit dans ce cas comme un miroir grossissant qui met en évidence un phénomène normal dont l'existence nous aurait échappé si nous nous étions contentés du miroir usuel. L'un des principaux avantages du miroir usuel est qu'il nous renvoie une image flatteuse. Il nous fait oublier que l'interprétation des énoncés n'agit pas en fonction d'un procédé mécanique dont le résultat est prédéterminé. Comme le montrent notamment ces résultats, l'interprétation est un processus faillible même chez les sujets jeunes en pleine possession de leurs moyens, car elle émerge aux termes d'une négociation dont l'issue demeure incertaine. Cela n'empêche pas d'observer les mêmes ressorts référentiels chez différents groupes de sujets, du moins tant qu'il s'agit du même contexte interprétatif. Ainsi, lorsqu'on compare les différentes phrases TI on constate une très forte corrélation dans les choix TI des différents groupes : ce sont, comme le montre le Tableau 3, les mêmes phrases qui donnent lieu au plus grand nombre de réponses TI, et inversement, les mêmes phrases qui obtiennent le plus faible nombre de réponses TI de la part de tous les groupes de sujets.


Phrases TI	Aphasics	Elderly	Head Inj.	Students


1. La petite fille achète une glace.	14.3	0	7.2	0
2. Le renard attrape la poule.	28.6	10	14.3	0
3. Le ballon frappe la fenêtre.	78.6	30	14.3	0
4. L'homme prend une cigarette.	35.7	10	7.2	0
5. Le chasseur tire sur le sanglier.	14.3	0	0	0
6. Le champion de karaté frappe la brique.	92.8	60	28.6	40
7. Le violoniste saisit son instrument.	50	0	7.2	0
8. L'homme fait tomber le vase.	42.8	0	21.4	0
9. La femme glisse dans l'escalier.	92.8	80	35.7	30
10. Le bateau fonce sur les rochers.	92.8	60	21.4	20

Cette forte corrélation montre l'existence des mêmes régularités ou plutôt des mêmes ressorts référentiels chez tous les sujets dans le présent contexte interprétatif. On aurait pu objecter ici qu'il est inutile de recourir à la théorie de la structuration référentielle pour expliquer ces similarités : la corrélation entre les réponses TI des différents sujets indiquant tout simplement que les mêmes propriétés sémantiques conduisent à la même interprétation des phrases.

Dans le cadre de cette même étude, nous avons conduit deux expériences complémentaires avec des étudiants de l'Université de Padoue. Les mêmes phrases TI ont été utilisées dans une épreuve de jugement [43] et dans une épreuve de reconnaissance à 3 items (phrase cible, son implication pragmatique, mêmes acteurs/objets dans une action différente), l'objectif étant d'évaluer l'effet du contexte interprétatif sur l'interprétation des mêmes phrases. Les résultats ont montré un pattern différent de réponses TI pour chaque épreuve : ce ne sont jamais les mêmes phrases qui produisent le plus (ou le moins) de réponses TI. La figure ci-dessoux illustre ces tendances. Les Expériences 1, 2 et 3 correspondent, dans l'ordre, aux épreuves : d'appariement phrase- image, de jugement et de reconnaissance.

FIGURE 1. Pourcentages des réponses TI pour les phrases TI dans les Expériences 1, 2, et 3.

Ainsi nous avons mis en évidence la dépendance de la thématisation des motifs nouveaux du contexte interprétatif dans lequel se trouve le sujet. Si l'on change un tant soit peu ce contexte, de nouvelles anticipations thématiques, le cas échéant contradictoires avec les précédents, apparaissent et entraînent une interprétation nouvelle. On conviendra certes que les contextes explorés dans cette étude sont tout à fait artificiels et fort éloignés de la cohérence naturelle des situations de la vie dans lesquels nous sommes normalement immergés, avec leurs réseaux d'anticipations thématiques, leur environnement perceptif, ainsi que les ajustements intersubjectifs et les tactiques de communication qui jouent tous un rôle dans l'interprétation. On s'imagine difficilement quelqu'un surgir dans mon bureau pour annoncer que Jacques a glissé dans l'escalier dans le seul but de m'informer de la survenue de cet événement. Cela pourrait se produire si le locuteur voulait m'expliquer pourquoi Jacques a été hospitalisé ou pour confirmer ce que nous disions tous, à savoir que le produit lustrant utilisé dans notre bâtiment rend l'escalier dangereux pour les savants vieillissants, dangereux car glissant. Et l'on peut imaginer d'autres contextes dans lesquels une telle phrase (Jacques a glissé dans l'escalier) aurait réellement un sens. On notera également que l'action thématisée variera selon ces contextes, se rattachant selon le cas à une chute, au fait de renverser des produits dangereux, à une glissade, etc. Or, le fait que même des changements de contexte aussi microscopiques et insignifiants que ceux de notre étude entraînent une thématisation différente montre le caractère sémantiquement sous-déterminé des énoncés et le rôle de l' entourage sensible (perceptif, social, culturel, biologique,..) [44] dans la structuration référentielle.

[32] Ces patients étaient néanmoins traditionnellement décrits comme capables d'une assez bonne compréhension.

[33] Le sujet devait apparier une phrase à des images (présentées en choix multiple) ou mimer l'événement décrit par la phrase avec un ensemble de poupées et jouets.

[34] Par exemple : as , vis , est , bus , rations , portions .

[35] J'insiste sur le caractère interne de ces relations pour bien différencier le concept de structure référentielle de celui classique de la référence qui concerne le rapport entre objets, événements et phénomènes d'un côté et énoncés linguistiques de l'autre. Le concept de la référence présuppose un rapport objectif entre les énoncés et le monde extérieur, celui de la structure référentielle ne fait pas une telle hypothèse, mais pose qu'un énoncé comporte des traces tangibles et déterminables de ce que le locuteur voulait dire.

[36] Ce terme est utilisé ici pour désigner un ensemble de règles, tactiques, ruses ou développements qui semblent concourir au même objectif structurel.

[37] Les processus référentiels se prêtent aisément à l'expérimentation car ils sont fragiles, ce sont eux qui sont atteints en premier dans l'aphasie (d'une façon sélective et variée) et au cours du vieillissement, et il est d'ailleurs facile de créer des conditions expérimentales dans lesquelles des sujets normaux éprouvent quelque difficulté à démêler tous les fils référentiels (cf. Rosenthal & Bisiacchi, 1997) .

[38] Dans cet exemple l' enfant et Pierre sont des co-spécificateurs du même actant.

[39] Le concept d'espace référentiel s'inspirait en partie des travaux de Fauconnier (1984) .

[40] Il ne s'agit pas d'une représentation encyclopédique des connaissances générales mais d'un savoir personnel ettacite dont l'implication dans l'interprétation du langage peut être mise en évidence de manière implicite.

[41] On notera que si des principes pragmatiques autorisent l'utilisation d'articles définis pour des entités non mentionnées antérieurement dans le discours mais relevant du domaine de connaissances impliqué dans le traitement, elles ne rendent pas pour autant cette utilisation obligatoire. L'emploi d'articles définis devant 'ouvreuse', 'salle' et 'film' relève d'un choix thématique et référentiel qui a donc nécessairement des conséquences sur la structure de l'espace référentiel.

[42] Johnson-Laird (1987) a écrit par exemple : "Lexical meanings are the ingredients from which the sense of an utterance is made up, and its syntactic structure is the recipe by which they are combined. Listeners must put together the meanings of the words they recognize according to the grammatical relations that they perceive between them". (p. 189). Johnson-Laird reconnaît certes qu'il ne suffit pas de combiner les sens des mots pour obtenir le sens de la phrase, il insiste néanmoins sur l'idée que le sens des mots est représenté dans un lexique mental et que l'accès aux entrées sémantiques ainsi représentées constitue la principale opération de la compréhension du langage.

[43] Dire si, oui ou non, la phrase donnée invite fortement le sujet à considérer qu'elle implique X- X étant l'implication pragmatique de cette phrase.

[44] Ce concept d'entourage sensible peut être rapproché de celui d'entourage de comportement de Koffka (1935) ou de celui d' Umwelt du biologiste Jacob von Uexküll (1965) . Voir Rosenthal et Visetti (1999) pour une discussion.