SdT volume 5 numéro 4

________________________________________________________________________________

 

 

                                                                                             LA CITATION DU MOIS

                                                     ________________________________________________

 

                                                     "La question est encore ouverte de savoir

                                                     jusqu'à quel point on peut considérer comme

                                                     naturelle la faculté du langage."

 

                                                                                Ferdinand de Saussure,

                                                                                troisième cours de linguistique

                                                                                générale, 1910-1911.

                                                     ________________________________________________

 

                          

 

                                                     SOMMAIRE

 

1- Coordonnees

             - Bienvenue a Julien Nioche et Marie-Anne Chabin.

             - Changements d'adresse pour Kathrine Ravn-Joergensen et Frederic

             Pierron.

 

2- Carnet

             - Nominations recentes : Louis Hebert, Pascal Michelucci, Sylvie

             Normand.

             - Premiers echos du Colloque inaugural de l'Institut F. de Saussure.

             - Improvisation sur Figure et concours de recrutement.

             - Un generateur automatique de these.

             - Nouvelles du site Texto!

             - Programme du cours de Simon Bouquet, Paris X.

 

3- Dialogue

             - Informatisation de la semantique interpretative

               I. Kanellos, B. Pincemin, F. Rastier

 

4- Bibliographie

             - Lettres Numeriques : une nouvelle collection chez Champion.

             - Appel a contributions : Numéro special de Document numérique

             sur le theme "Documents anciens".

             - Atelier "Corpus et Traitements Automatiques des Langues", qui

             s'est tenu mi-juillet a Cargese.

 

5- Colloques

             - Appel à contributions : Colloque en ligne "Frontières de la fiction"

             (decembre 1999).

 

 

11111111111111111111111111111111111111111111111111111111111111111111111111111111

Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees

11111111111111111111111111111111111111111111111111111111111111111111111111111111

 

NOUVEAUX ABONNES

[information réservée aux abonnés]

22222222222222222222222222222222222222222222222222222222222222222222222222222222

Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet

22222222222222222222222222222222222222222222222222222222222222222222222222222222

{FR, 10/07/1999}

 

* Louis Hebert, membre de l'equipe depuis 1994, vient d'etre nomme professeur

au departement de lettres de l'Universite du Quebec a Rimouski (UQAR).

Ses recherches touchent la semiotique (texuelle et visuelle), la semantique et

l'onomastique. Il a dirige les numeros Semiotique et interpretation de Protee

(26-1), Le referent de Semiotique appliquee

(http://www.epas.utoronto.ca:8080/french/as-sa/ASSA-No2)

et publie plusieurs articles, en particulier dans Le texte et le nom (XYZ

editeurs), Protee (23-2, 22-3) et Semiotica (120-1/2). Il co-dirige egalement

la revue Debats semiotiques publiee par la Societe de semiotique du Quebec,

dont il est president. Enfin, il a produit une Introduction a la semantique

des textes (a paraitre chez Champion). Courriel:

             Louis_Hebert@uqar.uquebec.ca

 

* Pascal Michelucci est nommé à l'Université de Toronto (Campus Erindale).

 

* Sylvie Normand est nommée à l'IUFM de Créteil (Nouvelles technologies).

 

22222222222222222222222222222222222222222222222222222222222222222222222222222222

{FR, 10/07/1999}

 

LE COLLOQUE INAUGURAL DE L'INSTITUT FERDINAND DE SAUSSURE

 

Les angoisses des organisateurs sont à présent apaisées. Un participant leur

écrit :

"Intellectuellement, socialement et matériellement, c'était une réussite.

De telles rencontres sont extrêment profitables et motivantes. On ne peut

qu'en profiter".

C'est trop ! Nous publierons dans notre prochain numéro des réactions sans

doute plus rassises.

 

22222222222222222222222222222222222222222222222222222222222222222222222222222222

{FR, 10/07/1999}

 

LE LANGAGE FIGURÉ DU CANDIDAT À UN CONCOURS DE RECRUTEMENT

 

Le figurant figure, il est figurant. C'est le tracé de sa figure qui intéresse.

Il est en préparation. Il fait bonne ou mauvaise figure. Son rôle lui est

soumis. Il est là pour la vedette-spectre de lumière, figurant ou ex-figurant

aussi, sorti/sortant de l'ombre.

 

(La rédaction préserve l'anonymat de l'auteur).

 

22222222222222222222222222222222222222222222222222222222222222222222222222222222

{FR, 10/07/1999}

 

SPÉCIAL TECHNOSCIENCE : COMMENT SE FAIRE ÉCRIRE UNE THÈSE POST-MODERNE

 

De Pascal Michelucci : Après la génératrice automatique de sujets de thèse

- la technologie est déjà allé plus loin dans la faribolite, et vous écrit

la thèse au complet. C'est parfois désopilant.

 

The Postmodernism Generator

http://www.csse.monash.edu.au/other/postmodern.html

 

22222222222222222222222222222222222222222222222222222222222222222222222222222222

{FR, 10/07/1999}

 

TEXTO! NOUVEAUTÉS :  http://www.msh-paris.fr/texto/

 

Théodore Thlivitis, après deux ans passés à l'entretien du site, a passé le

relai à François Legras :

             francois.legras@enst-bretagne.fr

 

Sont parus ce semestre :

 

* François Rastier       "Défigements sémantiques en contexte"

 

* Yannick Prié                          "Contribution à une clarification des rapports

                                          entre Sémantique Interprétative et informatique"

 

* Sémir Badir               "Immanence et cognitivisme - Un débat épistémologique

                                          autour de la sémantique cognitive"

 

* Evelyne Bourion      "Lire autrement Le Père Goriot"

 

Consultez, critiquez, proposez !

 

22222222222222222222222222222222222222222222222222222222222222222222222222222222

{FR, 10/07/1999}

 

             PROGRAMME DE COURS DE SIMON BOUQUET, UNIVERSITÉ PARIS X, 1999-2000

 

La grammaire de texte est née du projet d'étendre l'analyse linguistique

-notamment une analyse s'inspirant de la syntaxe formelle- au delà des bornes

de la phrase. Qu'implique cette perspective quant à la définition du concept

de « texte » et quant à la délimitation de l'unité empirique considérée ?

Qu'implique-t-elle au regard des formalismes de l'analyse textuelle eux-mêmes ?

En quoi la linguistique de l'énonciation ou la pragmatique offrent-elles des

outils pour ce franchissement des bornes de la phrase ? Quelles sont les

conséquences de ce franchissement au plan des représentations sémantiques ?

C'est à partir de telles questions que le cours proposera une introduction à

l'étude du sens textuel, tout en examinant des problèmes théoriques

particuliers de grammaire du texte sur la base de corpus oraux et écrits

(littéraires et non-littéraires).

 

Bibliographie : J.-M. Adam Les textes, types et prototypes ; S. Bouquet

<Toulouse> ; J.- F. Jeandillou L'analyse textuelle ; F. Rastier, A. Abeillé,

M. Cavazza, Sémantique pour l'analyse ; T. Van Dijk, 1972, Some Aspects of

Text Grammars, The Hague, Mouton ; T. Van Dijk (ed.), 1985, Handbook of

Discourse Analysis, London, Academic Press, (4 vol.)

 

 

F4 362  PRAGMATIQUE DU TEXTE LITTERAIRE

(UE « Linguistique textuelle »)

 

Le cours aura pour objet d'introduire à une pragmatique -s'entendant ici comme

une théorie des actes de langage-  appliquée aux textes littéraires. On décrira

le sens d'un texte littéraire comme la composition de « traits » relevant de

divers niveaux d'analyse linguistique -phonologique, morphosyntaxique,

sémantique, énonciatif- dans une « matrice pragmatique » qui les organise et

confère à ce texte son (ses) interprétation(s). Une telle pragmatique textuelle

reprend à son compte une caractéristique déterminante des rhétoriques et des

herméneutiques traditionnelles (ainsi que des théories des genres et des

stylistiques), et permet de réarticuler le point de vue de ces dernières au

point de vue logico-grammatical qui a dominé les développements de linguistique

contemporaine et engendré ses avancées.

Les textes étudiés seront pris dans l'oeuvre de René Char.

 

Bibliographie : J.-M. Adam & A. Petitjean, Le texte descriptif. Poétique

historique et linguistique textuelle, Paris, Nathan, 1989 ; S.Bouquet

« Linguistique textuelle, jeux de langage et sémantique du genre », Langages

N° 129, mars 1998 ; F. Douay-Soublin, 1994, « Les figures de rhétorique :

actualité, reconstruction, remploi », Langue française, N° 101 ;  F. Rastier,

Sens et textualité, Paris, Hachette ; F. Rastier, « Le problème du style pour

la sémantique du texte » in Molinié G. et Cahné P. (éds.), Qu'est-ce que le

style ?, Paris, P.U.F., 1994 ; F. Rastier, « Herméneutique matérielle et

sémantique des textes », in Salanskis et al. éds., Herméneutique, textes,

sciences, Paris, P.U.F., 1997 ; P. Szondi, Herméneutique littéraire Paris, Cerf.

 

 

F4 363  SEMANTIQUE INTERPRETATIVE

(UE « Linguistique textuelle »)

 

La description formelle du sens, dès lors que celui-ci est envisagé au palier

textuel -autrement dit, dans le cadre d'une suite linguistique réellement

produite- implique une dichotomie initiale. D'une part, elle concerne ce qui

ressortit à une compositionalité interne (détermination du sens global de

l'unité textuelle par ses constituants locaux). D'autre part, elle concerne ce

qui ressortit à une compositionalité externe (détermination de traits des

constituants locaux par la globalité de l'unité textuelle). Le versant interne

-context free- comprend des faits linguistiques décrits par la syntaxe, par la

sémantique « compositionnelle » et par la linguistique de l'énonciation. Le

versant externe -context sensitive- est celui de normes, tout aussi

linguistiques, commandant ce que F. Rastier appelle un « parcours

interprétatif ». La prise en compte de ces deux versants de la description du

sens textuel permet de les unifier dans une « sémantique interprétative ».

C'est à cette approche qu'introduira le cours. Elle y sera confrontée à divers

types de textes : oraux, écrits, littéraires et non-littéraires.

 

Bibliographie : J.-M. Adam, Eléments de linguistique textuelle, Paris, Mardaga,

1990 ; M. Bakhtine, « Les genres du discours » in Esthétique de la création

verbale, Paris, Gallimard, [1952-53] 1984 ; Culioli, « La linguistique : de

l'empirique au formel » in Pour une sémantique de l'énonciation, Paris, Ophrys,

1990 ; J.-C. Milner, Introduction à une science du langage, Paris, Seuil, 1989 ;

F. Rastier, Sémantique interprétative, P.U.F.; F. Rastier, « Pour une sémantique

des textes », in M. Mahmoudian (éd.), Fondements de la recherche linguistique.

Perspectives épistémologiques, Cahiers de l'ILSL, n° 6, Université de Lausanne,

1995.

 

 

F4 376  PHILOSOPHIE DU LANGAGE ET SCIENCES DU LANGAGE

(UE « Philosophie du langage, histoire et épistémologie »)

 

Le domaine des théories du langage -et plus particulièrement des théories du

sens- est probablement, en sciences humaines, celui qui offre les illustrations

les plus frappantes des transferts conceptuels se produisant entre étude

empirique et spéculation philosophique. L'objet du cours sera une lecture

parallèle de l'oeuvre de deux penseurs majeurs du XX° siècle -Ferdinand de

Saussure et Ludwig Wittgenstein-, envisagée dans la perspective de ces

transferts.

 

Bibliographie : F de Saussure, Cours de linguistique générale, Paris, Payot,

[1916] 1995 ; L. Wittgenstein, Tractatus logico-philosophicus suivi de

Investigations Philosophiques (tr. fr. Klossowski), Paris, Gallimard, 1961 ;

L. Wittgenstein, Philosophische Untersuchungen / Philosophical investigations

(tr. angl. Anscombe), Blackwell [1953] 1997 ; L. Wittgenstein, Remarques sur la

philosophie de la psychologie (édition bilingue all./fr, tr. fr. Granel), T. 1

et 2, Mauzevin, Trans-Europ-Repress, 1994 ; L. Wittgenstein, Le Cahier Bleu et

le Cahier Brun (tr. fr. Durand), Paris, Gallimard, 1965 ; L. Wittgenstein, De

la certitude (tr. fr. Fauve), Paris, Gallimard, 1976.

Bibliographie complémentaire : S. Bouquet, Introduction à la lecture de

Saussure, Paris, Payot, 1997

 

 

F4 391  HISTOIRE ET EPISTEMOLOGIE DES SCIENCES DU LANGAGE

(UE « Philosophie du langage, histoire et épistémologie »)

 

Ce cours d'épistémologie historique, qui vise à replacer les avancées des

sciences du langage dans le courant de l'histoire des idées, prendra pour objet

la pensée de F. de Saussure. Il se proposera d'éclairer des concepts cardinaux

du Cours de linguistique générale par les textes originaux que cet ouvrage

recouvre comme un palimpseste : les notes d'étudiants des trois séries de

leçons de linguistique générale données à Genève entre 1907 et 1911 et les

textes autographes (1891-1912) de la « philosophie de la linguistique » de

Saussure. L'objectif est bien de faire apparaître une pensée passablement

différente de celle que la tradition nous a transmise, notamment quant à deux

aspects importants d'une conception générale des sciences du langage : les

principes unificateurs de ces sciences ; leur multidisciplinarité.

 

Bibliographie : F. de Saussure, Cours de linguistique générale, Paris, Payot,

[1916] 1995 ; F. Gadet, Saussure une science de la langue, P.U.F. ; S. Bouquet,

Introduction à la lecture de Saussure, Paris, Payot, 1997.

 

33333333333333333333333333333333333333333333333333333333333333333333333333333333

Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue

33333333333333333333333333333333333333333333333333333333333333333333333333333333

{FR, 10/07/1999}

 

Informatisation de la sémantique interprétative

________________________________________________________________________________

 

Trilogue sur l'informatisation de la sémantique interprétative, à partir de

la thèse de Bénédicte Bommier-Pincemin (cf. le résumé dans le précédent numéro

de ce bulletin).

 

- Ioannis Kanellos, professeur à l'École Normale Supérieure des

  Télécommunications (Brest)

- Bénédicte Pincemin, Division Recherche et Développement

  (Electricité de France)

- François Rastier, Directeur de recherche, CNRS.

 

IK - J' exprime mon accord global avec la thématique et le mode de gestion des

ressources intellectuelles et techniques de la thèse. Je souhaite résumer son

parcours comme une sorte de paradigme de ce qui devrait, de nos jours, être la

correcte utilisation d'une théorie qui porte sur la rationalisation des

structures et des dynamiques de sens à l'intérieur d'un domaine contraint par

le calcul.

 

Tu exposes, de manière fort convaincante et subtile, la Sémantique

Interprétative et sa tradition critique et épistémologique. C'est un moment

crucial, puisque, on le sait ou on le comprend, une telle théorie a tout pour

ne pas se conformer aux impératifs du calcul.

 

Tu es lucide sur cette question : tu sais qu'il est impossible de concilier

tradition herméneutique et calcul. Cette lucidité est, d'ailleurs, parfaitement

synthétisée dans la conclusion, qui guide retrospectivement le développement,

à partir du chapitre V. Tu ne cherches pas à réaliser l'impossible. Tu ne

cherches pas non plus à dissimuler ce caractère inconciliable par un discours

ambigu. Tu adoptes une attitude saine, qui consiste à inverser simplement la

grille épistémologique. D'habitude, on construit des modèles pour valider,

voire pour éprouver une théorie. Parfois même pour l'améliorer, pour la

modifier. Mais alors, il faut que les domaines convoqués le permettent. Ce luxe

n'est pas disponible dans ton travail, précisément à cause de ce hiatus entre

l'activité de l'interprétation et les structures logiques du formalisme requis

pour parvenir à un outil opérationnel. Ainsi, la Sémantique Interprétative ne

te sert point comme théorie mais comme modèle. En tant que modèle déjà

constitué, générique. Donc, comme support pour une interprétation, contrainte

mais réelle, comme support, aussi, d'inspiration. De manière très honnête, tu

nous l'avais déjà dit dès le début, aux premières lignes de ton travail.

 

Ce faisant, ton discours sera désormais orienté par la volonté de "récupérer"

les éléments de la Sémantique Interprétative relevant de la textualité mais

encore possibles à utiliser dans le cadre du calcul. Certes, on n'aura pas une

véritable textualité, sans doute le manque des conditions herméneutiques et

l'absence de lecture authentique conduiront trop loin. On ne peut servir deux

maîtres à la fois, et le calcul impose un régime non négociable. Cependant, par

ce biais inspiré, dont les fondements remontent probablement à l'aube de la

pensée scientifique, tu arrives à la formulation d'un ensemble de propositions

qui étendent la norme du paradigme lexical en matière de traitement du langage

naturel. Un exemple ne serait pas ici inutile :

 

Dans la définition des "communautés", des "relations", des "voisinages", etc.,

tu effectues un déplacement magistral à partir du thème de l'isotopie pour

arriver à ce qui seul pourrait être envisageable dans le cadre d'un calcul :

une structure basée certes sur le paradigme lexical, mais internalisant

beaucoup de l'idée de l'isotopie. Cet exemple, central d'ailleurs dans ton

travail, est parfaitement généralisable. On aurait tort de croire que ton projet

est de réécrire le logiciel de diffusion ciblée (DECID) sous la théorie de la

Sémantique Interprétative. Il projet est de l'améliorer précisément en fonction

du modèle textuel que cette théorie met en avant.

 

Ainsi, ta thèse devient-elle probablement l'affirmation la plus palpable et

assurée de l'utilisation d'une théorie de la textualité non pas comme recette

mais comme palette. Et elle n'a été point triviale : le parcours nécessité

présentait des risques et demandait une grande maturité.

 

 

BP - Peut-être faudrait-il encore davantage accentuer ce point auquel tu tiens,

de non prise en charge par le calcul d'une interprétation, de la construction

d'un sens textuel. L'ordinateur ne fait que différer l'appropriation d'un texte,

d'un corpus, par un "utilisateur". Il n'y a aucunement à regretter que

l'ordinateur ne soit pas ce qu'il n'est pas : un sujet, voire un acolyte qui

penserait (lirait) pour moi, comme moi. Les atouts de la machine (mémoire,

rapidité de calcul) sont mis au service d'une reformulation suggestive des

données. Tout l'enjeu réside dans le fait de définir des modes de réécriture,

interprétables et propres à faire sens dans l'expérience de chacun.

 

FR - Par exemple, un système qui propose des sous-corpus à pertinence enrichie

peut très aisément permettre de d'invalider des hypothèses interprétatives, mais

aussi d'en formuler d'autres, car certaines régularités, dispersées dans le

corpus, semblent "s'imposer d'elles-mêmes" si les documents sont bien présentés.

Ou encore, le fait, simplement, de surligner les mots qui dépassent un seuil

d'écart réduit, si le corpus de référence est soigneusement constitué, permet à

certains d'entre eux de "frapper à la porte". Les petits instruments mis au

point par Evelyne Bourion et Jacques Maucourt se sont ainsi révélés extrêmement

utiles.

 

BP - J'ai clairement pris des libertés par rapport à la théorie de la sémantique

interprétative telle qu'elle est exposée dans votre ouvrage de 1987 par exemple.

Il est vrai que mon objectif n'était pas l'étude de cette théorie - à la

différence du superbe travail de thèse de Ludovic Tanguy. Votre réflexion m'a

servi de référence, de point de vue linguistique, pour moi qui vient du monde

de l'ingénieur. Référence à laquelle confronter les traitements envisageables,

référence à la lumière de laquelle comprendre les succès ou échecs de telle ou

telle heuristique. Je me suis fiée à cette théorie notamment parce qu'elle part

de textes attestés, non de phrases calibrées ou d'un lexique hors du texte et

fatalement en décalage par rapport à celui-ci.

 

Comme pour Yannick Prié et toi, Ioannis, conjuguer la sémantique interprétative

et les traitements automatiques m'a semblé passer par la reconnaissance d'une

"trame conceptuelle résistante" : à savoir, quelles sont les lignes de force à

préserver dans une réinterprétation plus calculatoire et formelle. Ma définition

des Communautés vise ainsi une représentation de l'isotopie qui parte bien de sa

manifestation globale plutôt que de la conjonction de sèmes singuliers.

 

FR - Je ne me sens pas particulièrement qualifié pour aborder le problème de

l'utilisation de la sémantique interprétative, même si j'ai risqué - c'était

un voeu - la notion de sémantique applicable. Plus exactement, je crois que le

couple théorie/application est plus infernal encore qu'il n'y paraît. Au moins

dans les sciences de la culture, les théories sont des rationalisations

temporaires et a posteriori : elles se définissent aussi parce qu'elles ne

permettent pas de voir, par une préconception de leur réel, par les questions

qu'elles récusent (par exemple, la polysémie, la référence) ou qu'elles

refusent de tenir pour centrales. Je crois que les théories trop puissantes,

qui s'appliquent partout, ne rendent compte que d'un petit nombre de faits

triviaux.

 

Les formations intellectuelles que l'on nomme théories ont des statuts très

divers : notation partielle (théorie X barre), théorie de ensembles, théories

de l'énonciation, etc. On peut distinguer divers plans :

 

- Un plan de préconception du réel, en termes de grandes catégories, comme :

dynamisme, statisme ; temporalisation, spatialisation ; subjectivisme,

objectivisme ; et qui au demeurant sont souvent corrélées entre elles.

 

- Un plan gnoséologique, ou théorie implicite de la connaissance et de son

élaboration. Le more geometrico par exemple.

 

- Un plan épistémologique : une théorie de la science ou des sciences, dont

l'image implicite se traduit souvent dans les modes d'exposition.

 

- Un plan méthodologique.

 

- Un plan descriptif : on peut se servir des descriptions lexicales proposées

en sémantique interprétative pour recomposer une ontologie avec une caution

linguistique (plusieurs sociétés d'informatique, comme Arisem, procèdent ainsi).

On ne prend alors qu'une partie de la théorie, sans se préoccuper de son centre

organisateur, le problème du texte. On constitue une sorte d'ontologie

différentielle. On réintroduit une compositionnalité, etc.

 

- Un plan discursif : modes d'argumentation, terminologie, modes de citation,

rhétorique.

 

- D'autres réutilisations sont possibles : les modules chez Adam (qui

rebaptisent les composantes textuelles), la typologie des traits chez

Pustejovsky, dont la collaboratrice, Pierrette Bouillon, a fait un mémoire

sur l'isotopie).

 

La contradiction relevée par Ioannis oppose le traitement informatique -

qui en tant qu'il est formel, suspend l'interprétation - et le caractère

interprétatif de la théorie, qui d'ailleurs n'est pas formelle, mais se veut

simplement rationnelle. Cette contradiction est sans doute plutôt une

incompatibilité de fait qu'une opposition théorique : par exemple des systèmes

probabilistes utilisant l'écart réduit peuvent permettre de formuler ou de

tester des hypothèses ; des systèmes connexionnistes, qui sont hautement

sensibles aux contextes, peuvent modéliser les propagations de traits (ainsi de

l'application actuellement développée par Dominique Béroule et Norbert Rimoux).

 

On a emprunté deux voies principales :

 

- La simulation de l'interprétation : le système propose des interprétations

(en particulier des éléments d'isotopie) que le lecteur valide -  c'est la voie

suivie par Ludovic Tanguy dans sa thèse. Cette voie suppose une étape

d'identification de sèmes, et elle est difficile à étendre à des corpus.

Elle va du local vers le global.

 

- L'autre voie principale est celle de la sélection de corpus pertinents en

fonction d'une requête : le système ne "représente" pas l'interprétation,

n'implémente pas la notion de sème. En quelque sorte, il s'agit de contourner

la sémantique pour la mettre en oeuvre. Elle convient aux corpus importants,

va du global vers le local, et produit des systèmes facilement réutilisables.

 

La thèse de Théodore Thlivitis (voir sur le site Texto!) peut d'ailleurs être

considérée comme un essai réussi de synthèse entre ces deux approches.

 

La "bonne" utilisation d'une théorie, ce n'est pas uniquement de l'appliquer,

par exemple en transposant la méthode d'analyse d'un texte sur un autre texte.

Ce n'est peut-être qu'une étape dans l'appropriation. L'étape principale, c'est

d'en faire autre chose, de la faire évoluer, et non de s'en inspirer : de

l'inspirer. Je crois au rôle heuristique du détournement...

 

BP - D'accord sur les réserves à propos d'une "contradiction" entre calcul

et interprétation : si le calcul ne fait pas l'interprétation, il peut

l'accompagner.

 

Les pratiques statistiques d'Analyse des données, entre autres, invitent

explicitement à plusieurs étapes interprétatives :

 

- en amont du calcul : choix des données, définition de leur codage,

détermination d'une méthode ;

 

- en aval : lecture et exploitation des résultats, utilisation des indicateurs,

corrections pour un affinement itératif de l'étude, etc.

 

Ce sont d'ailleurs sans doute les statisticiens les plus "durs" qui seront les

plus attentifs et scrupuleux quant à l'importance de ces étapes, -les novices

pouvant rester impressionnés par les chiffres et les graphiques et s'en tenir à

leur pouvoir évocateur.

 

Quant à la deuxième des deux "voies principales" d'introduction d'une approche

interprétative dans le cadre de traitements automatiques, faut-il la désigner

comme "sélection de corpus" ? Plutôt peut-être sélection EN corpus, quoique

encore il y ait des procédures qui sont de véritables reconfigurations et

recontruction et vont bien au-delà d'un travail de filtrage adaptatif :

regroupements structurés d'unités du corpus, représentations graphiques et

"spatialisation" traduisant telle ou telle propriété d'ensemble, etc.

 

FR - En effet, toute sélection est une recontextualisation, avec les extraits

voisins : on met ensemble des extraits séparés dans le texte : c'est là une

exploitation à grande échelle de l'antique technique herméneutique des passages

parallèles.

 

BP - Un certain nombre d'initiatives récentes montrent l'appropriation de la

sémantique interprétative dans diverses pratiques de traitement automatique.

Un panorama de ces travaux recueillerait un riche éventail de lectures et de

traductions opératoires de multiples aspects de la théorie.

Des rencontres-ateliers seraient des occasions de discussion, d'échange et de

croisement d'idées sur des points de choix concrets. L'histoire des

implémentations prenant appui sur la sémantique interprétative n'en est qu'à

ses débuts : laissons-la nous surprendre... et nous inspirer !

 

FR - Comme tout cela nous échappe, faut-il vraiment feindre d'en d'être les

organisateurs ?

 

44444444444444444444444444444444444444444444444444444444444444444444444444444444

Bibliographie Bibliographie Bibliographie Bibliographie Bibliographie Biblio

44444444444444444444444444444444444444444444444444444444444444444444444444444444

{FR, 10/07/1999}

 

UNE NOUVELLE COLLECTION AUX EDITIONS CHAMPION

 

Lettres Numériques

 

Après le rouleau et le codex, le calame et l'imprimerie, les textes numérisés

ouvrent une nouvelle époque de l'écrit. Elle intéresse au premier chef les

sciences du langage et l'ensemble des études littéraires.

 

L'établissement et le codage des éditions numériques suscite un renouveau de

la philologie. L'essor de la linguistique de corpus peut permettre de discerner

rigoureusement les variations selon les époques, les discours, les genres et

les textes. Enfin, l'accès aux banques textuelles autorise la convocation

immédiate de corpus de travail et renouvelle les parcours de lecture.

 

De nouvelles applications, documentaires, pédagogiques, critiques,

apparaissent : aide à l'interprétation, création de sous-corpus à pertinence

enrichie, diffusion ciblée, etc.

 

Prenant la suite des Travaux de linguistique quantitative, la collection

Lettres numériques entend, sans pruderie technique ni frilosités esthétiques,

témoigner de cet essor en s'ouvrant à toutes les problématiques qui prennent

pour objet les textes numérisés.

 

                           Directeurs de collection : Étienne Brunet, François Rastier.

 

44444444444444444444444444444444444444444444444444444444444444444444444444444444

{FR, 10/07/1999}

 

APPEL A CONTRIBUTIONS

 

               Numéro spécial de Document numérique sur le thème

               « Documents anciens »

 

Très tôt, historiens, littéraires, paléographes, etc. se sont intéressés à

l'informatique. Toutefois, ils s'en sont surtout servis pour des tâches

d'édition ou de statistique. Mais depuis quelques années, les  notions de

document structuré, d'hypertextes, de numérisation, de CD-ROM, de Web, etc.

ont redonné un nouvel essor à l'informatique appliquée aux documents

historiques.

 

Mais les techniques informatiques sont loin d'être maîtrisées dans ce contexte

des sciences humaines et historiques, notamment en ce qui concerne la notion

même de document. Doit-on considérer un document ancien (que ce soit une stèle

égyptienne, un sarcophage paléochrétien, un cartulairedu Moyen Âge, une lettre

de rémission, un acte notarié du XIX° siècle, un manuscrit de Baudelaire ou de

Perec, etc.) comme une image ou comme un texte et, si on veut les deux, comment

faire les liens d'une vue à l'autre ? Comment montrer les sept versions d'un

chansonnier de Troubadours ? Sait-on bien scanner un document de façon à en

conserver et sa texture (couleurs, brillance, ors, etc.) et sa structure logique

et sa mise en page, etc. ? Ne confond-on pas édition, sur le Web, (diplomatique

ou académique) d'un document et l'outil permettant de travailler sur ce

document, c'est-à-dire qu'elle est la réusabilité des documents mis sur le Web ?

 

Tous ces constats nous conduisent à consacrer un numéro spécial de la revue

Document numérique aux documents anciens numérisés (Document numérique est une

revue française dédiée aux documents électroniques qui s'adresse aussi bien aux

chercheurs qu'aux milieux professionnels de l'édition et de leurs emplois sur le

Web ! (Voir http://www.hermes-science.com). Le but est  de faire le point sur

les techniques les plus récentes et leurs incidences organisationnelles, pour

les professionnels, historiens, paléographes, généticiens, etc. mais aussi pour

les éditeurs et les étudiants.

 

Notre ambition est de réaliser un numéro de référence où se conjuguent technique

informatique et ergonomie des utilisateurs historiens et de dégager des axes

pour le futur.

 

Sont donc particulièrement recherchés des articles de synthèse (sur les notions

de corpus ou de document numérique et leurs implications dans le cadre des

sciences humaines et notamment historiques, bibliologiques, etc.), des études

de cas (descriptions de corpus, de structures, hyper-textuelles ou non, de

documents en en montrant la généralité), etc.

 

 

Thèmes (liste non exhaustive)

- numérisation des documents anciens (pour étude, pour conservation, pour

  diffusion, etc.) ;

- traitement des abréviations et signes non-typographiques (reconnaissance,

  catalogage, saisie , indexation, etc.) ;

- reconnaissance des structures (textes, images) ;

- traitement de la topographie des manuscrits ;

- recherche ou indexation dans le cadre de documents imagés ou structurés ;

- Text Encoding Initiative (TEI) ou XML pour les  manuscrits anciens,

  méta-données (RDF) ;

- etc.

 

Pour tout contact

- Jacques André

             tél. +33 2 99 84 73 50, fax. +33 2 99 84 71 71

             jandre@irisa.fr

- Marie-Anne Chabin

             tél. +33 1 49 83 24 07, fax +33 1 49 83 33 94

             chabin@ina.fr, chabin17@club-internet.fr

 

44444444444444444444444444444444444444444444444444444444444444444444444444444444

{BP, 27/07/1999}

 

CORPUS ET TAL

 

Un atelier sur ce theme vient de se tenir lors de la Conférence TALN'99

(Cargèse, 12-17 juillet 1999) (http://talana.linguist.jussieu.fr/taln99/).

 

Nous reprenons ci-après l'argument de l'Atelier.

 

                                        ______________________________

 

                           Corpus et Traitements Automatiques des Langues :

                                        pour un réflexion méthodologique

 

 

Le recours aux corpus, alimenté par des ressources linguistiques et logicielles

toujours plus nombreuses, devient de plus en plus fréquent dans les recherches

et les applications en TAL. Cette évolution doit s'accompagner d'une réflexion

de nature méthodologique. Les corpus sont généralement perçus comme des stocks

de données permettant d'acquérir automatiquement des informations linguistiques,

mais leur rôle reste à évaluer clairement.

 

Il existe différentes façons d'envisager les corpus. On peut distinguer

quelques unes de ces pratiques. Les corpus sont considérés :

* le plus souvent, comme des données attestées permettant de rendre compte du

  fonctionnement de "la langue". Le corpus facilite la construction de modèles,

  et constitue en particulier une alternative à l'établissement de données

  lexicales par introspection. Il peut être également utilisé pour valider des

  modèles existants.

* comme des données spécifiques, à partir desquelles on tire des conclusions

   propres au seul corpus, dans le cadre d'une application donnée (par exemple,

  l'acquisition de terminologie dans un domaine spécifique),

* comme des données expérimentales dont on peut contrôler les variables (écrit

  vs oral, domaine couvert, visée discursive, etc.) pour les rendre

  représentatives d'usages spécifiques de la langue et permettre une

  généralisation des résultats aux sous-systèmes délimités par ces variables,

  voire au système général de la langue (par exemple, pour la constitution

  d'analyseurs syntaxiques généraux). Pour garantir cette représentativité,

  l'accent est souvent mis sur la taille des corpus.

 

Ces perspectives, de natures très différentes, doivent être explicitées afin

que l'on puisse évaluer les résultats obtenus sur corpus, tant sur le plan de

la validité que sur celui de la réutilisabilité. Nous souhaitons que cet

atelier soit l'occasion de confronter ces différents points de vue et de les

éclaircir.

 

Dans ce but, nous nous intéresserons aux travaux qui développent une réflexion

sur l'utilisation des corpus pour le TAL et/ou la linguistique. Les domaines

abordés par les articles ainsi que les méthodes employées pourront couvrir

l'ensemble des thèmes de la conférence TALN. Nous encourageons les propositions

de contribution qui problématisent le recours aux corpus et posent nettement

certaines des questions suivantes :

* pourquoi recourt-on aux corpus dans le travail décrit ?

* selon quels critères constituer le corpus ? Ou, si un corpus est d'emblée

  disponible pour l'application visée, comment le caractériser pour pouvoir

  évaluer la portée des résultats de son utilisation ? Comment remplit-on le

  cas échéant des objectifs de représentativité ?

* les résultats obtenus sont-ils liés à ce corpus, sont-ils généralisables ?

* comment choisit-on les outils à mettre en oeuvre ? Quelles sont les

  conséquences sur le plan méthodologique ?

 

COMITE D'ORGANISATION

Anne Condamines, Cécile Fabre, Marie-Paule Péry-Woodley

ERSS (Equipe de Recherche en Syntaxe et Sémantique), Toulouse

(acondami,cfabre,pery)@univ-tlse2.fr

 

55555555555555555555555555555555555555555555555555555555555555555555555555555555

Colloques Colloques Colloques Colloques Colloques Colloques Colloques Colloques

55555555555555555555555555555555555555555555555555555555555555555555555555555555

{FR, 10/07/1999}

 

COLLOQUE EN LIGNE

 

Le groupe de recherche Fabula lance un appel à contributions pour un colloque

en ligne qui aura lieu au mois de décembre 1999 avec comme thème "Frontières

de la fiction".

 

Appel à contributions : colloque en ligne "Frontières de la fiction"

(décembre 1999)

 

Vous pouvez retrouver le texte de l'appel à contributions :

- au format html

             http://www.fabula.org/colloque99.htm

- au format Adobe PDF, format universel de diffusion

             http://www.fabula.org/appel.pdf

- au format RTF, lisible par les traitements de texte

             http://www.fabula.org/appel.rtf

 

Pour tout renseignement : colloque@fabula.org

 

55555555555555555555555555555555555555555555555555555555555555555555555555555555

 

////////////////////////////////////////////////////////////////////////