SdT volume 5 numéro 4
________________________________________________________________________________
LA CITATION DU MOIS
________________________________________________
"La question est encore ouverte de savoir
jusqu'à quel point on peut considérer comme
naturelle la faculté du langage."
Ferdinand de Saussure,
troisième cours de linguistique
générale, 1910-1911.
________________________________________________
SOMMAIRE
1- Coordonnees
- Bienvenue a Julien Nioche et Marie-Anne Chabin.
- Changements d'adresse pour Kathrine Ravn-Joergensen et Frederic
Pierron.
2- Carnet
- Nominations recentes : Louis Hebert, Pascal Michelucci, Sylvie
Normand.
- Premiers echos du Colloque inaugural de l'Institut F. de Saussure.
- Improvisation sur Figure et concours de recrutement.
- Un generateur automatique de these.
- Nouvelles du site Texto!
- Programme du cours de Simon Bouquet, Paris X.
3- Dialogue
- Informatisation de la semantique interpretative
I. Kanellos, B. Pincemin, F. Rastier
4- Bibliographie
- Lettres Numeriques : une nouvelle collection chez Champion.
- Appel a contributions : Numéro special de Document numérique
sur le theme "Documents anciens".
- Atelier "Corpus et Traitements Automatiques des Langues", qui
s'est tenu mi-juillet a Cargese.
5- Colloques
- Appel à contributions : Colloque en ligne "Frontières de la fiction"
(decembre 1999).
11111111111111111111111111111111111111111111111111111111111111111111111111111111
Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees
11111111111111111111111111111111111111111111111111111111111111111111111111111111
NOUVEAUX ABONNES
[information réservée aux abonnés]
22222222222222222222222222222222222222222222222222222222222222222222222222222222
Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet
22222222222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/07/1999}
* Louis Hebert, membre de l'equipe depuis 1994, vient d'etre nomme professeur
au departement de lettres de l'Universite du Quebec a Rimouski (UQAR).
Ses recherches touchent la semiotique (texuelle et visuelle), la semantique et
l'onomastique. Il a dirige les numeros Semiotique et interpretation de Protee
(26-1), Le referent de Semiotique appliquee
(http://www.epas.utoronto.ca:8080/french/as-sa/ASSA-No2)
et publie plusieurs articles, en particulier dans Le texte et le nom (XYZ
editeurs), Protee (23-2, 22-3) et Semiotica (120-1/2). Il co-dirige egalement
la revue Debats semiotiques publiee par la Societe de semiotique du Quebec,
dont il est president. Enfin, il a produit une Introduction a la semantique
des textes (a paraitre chez Champion). Courriel:
Louis_Hebert@uqar.uquebec.ca
* Pascal Michelucci est nommé à l'Université de Toronto (Campus Erindale).
* Sylvie Normand est nommée à l'IUFM de Créteil (Nouvelles technologies).
22222222222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/07/1999}
LE COLLOQUE INAUGURAL DE L'INSTITUT FERDINAND DE SAUSSURE
Les angoisses des organisateurs sont à présent apaisées. Un participant leur
écrit :
"Intellectuellement, socialement et matériellement, c'était une réussite.
De telles rencontres sont extrêment profitables et motivantes. On ne peut
qu'en profiter".
C'est trop ! Nous publierons dans notre prochain numéro des réactions sans
doute plus rassises.
22222222222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/07/1999}
LE LANGAGE FIGURÉ DU CANDIDAT À UN CONCOURS DE RECRUTEMENT
Le figurant figure, il est figurant. C'est le tracé de sa figure qui intéresse.
Il est en préparation. Il fait bonne ou mauvaise figure. Son rôle lui est
soumis. Il est là pour la vedette-spectre de lumière, figurant ou ex-figurant
aussi, sorti/sortant de l'ombre.
(La rédaction préserve l'anonymat de l'auteur).
22222222222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/07/1999}
SPÉCIAL TECHNOSCIENCE : COMMENT SE FAIRE ÉCRIRE UNE THÈSE POST-MODERNE
De Pascal Michelucci : Après la génératrice automatique de sujets de thèse
- la technologie est déjà allé plus loin dans la faribolite, et vous écrit
la thèse au complet. C'est parfois désopilant.
The Postmodernism Generator
http://www.csse.monash.edu.au/other/postmodern.html
22222222222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/07/1999}
TEXTO! NOUVEAUTÉS : http://www.msh-paris.fr/texto/
Théodore Thlivitis, après deux ans passés à l'entretien du site, a passé le
relai à François Legras :
francois.legras@enst-bretagne.fr
Sont parus ce semestre :
* François Rastier "Défigements sémantiques en contexte"
* Yannick Prié "Contribution à une clarification des rapports
entre Sémantique Interprétative et informatique"
* Sémir Badir "Immanence et cognitivisme - Un débat épistémologique
autour de la sémantique cognitive"
* Evelyne Bourion "Lire autrement Le Père Goriot"
Consultez, critiquez, proposez !
22222222222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/07/1999}
PROGRAMME DE COURS DE SIMON BOUQUET, UNIVERSITÉ PARIS X, 1999-2000
La grammaire de texte est née du projet d'étendre l'analyse linguistique
-notamment une analyse s'inspirant de la syntaxe formelle- au delà des bornes
de la phrase. Qu'implique cette perspective quant à la définition du concept
de « texte » et quant à la délimitation de l'unité empirique considérée ?
Qu'implique-t-elle au regard des formalismes de l'analyse textuelle eux-mêmes ?
En quoi la linguistique de l'énonciation ou la pragmatique offrent-elles des
outils pour ce franchissement des bornes de la phrase ? Quelles sont les
conséquences de ce franchissement au plan des représentations sémantiques ?
C'est à partir de telles questions que le cours proposera une introduction à
l'étude du sens textuel, tout en examinant des problèmes théoriques
particuliers de grammaire du texte sur la base de corpus oraux et écrits
(littéraires et non-littéraires).
Bibliographie : J.-M. Adam Les textes, types et prototypes ; S. Bouquet
<Toulouse> ; J.- F. Jeandillou L'analyse textuelle ; F. Rastier, A. Abeillé,
M. Cavazza, Sémantique pour l'analyse ; T. Van Dijk, 1972, Some Aspects of
Text Grammars, The Hague, Mouton ; T. Van Dijk (ed.), 1985, Handbook of
Discourse Analysis, London, Academic Press, (4 vol.)
F4 362 PRAGMATIQUE DU TEXTE LITTERAIRE
(UE « Linguistique textuelle »)
Le cours aura pour objet d'introduire à une pragmatique -s'entendant ici comme
une théorie des actes de langage- appliquée aux textes littéraires. On décrira
le sens d'un texte littéraire comme la composition de « traits » relevant de
divers niveaux d'analyse linguistique -phonologique, morphosyntaxique,
sémantique, énonciatif- dans une « matrice pragmatique » qui les organise et
confère à ce texte son (ses) interprétation(s). Une telle pragmatique textuelle
reprend à son compte une caractéristique déterminante des rhétoriques et des
herméneutiques traditionnelles (ainsi que des théories des genres et des
stylistiques), et permet de réarticuler le point de vue de ces dernières au
point de vue logico-grammatical qui a dominé les développements de linguistique
contemporaine et engendré ses avancées.
Les textes étudiés seront pris dans l'oeuvre de René Char.
Bibliographie : J.-M. Adam & A. Petitjean, Le texte descriptif. Poétique
historique et linguistique textuelle, Paris, Nathan, 1989 ; S.Bouquet
« Linguistique textuelle, jeux de langage et sémantique du genre », Langages
N° 129, mars 1998 ; F. Douay-Soublin, 1994, « Les figures de rhétorique :
actualité, reconstruction, remploi », Langue française, N° 101 ; F. Rastier,
Sens et textualité, Paris, Hachette ; F. Rastier, « Le problème du style pour
la sémantique du texte » in Molinié G. et Cahné P. (éds.), Qu'est-ce que le
style ?, Paris, P.U.F., 1994 ; F. Rastier, « Herméneutique matérielle et
sémantique des textes », in Salanskis et al. éds., Herméneutique, textes,
sciences, Paris, P.U.F., 1997 ; P. Szondi, Herméneutique littéraire Paris, Cerf.
F4 363 SEMANTIQUE INTERPRETATIVE
(UE « Linguistique textuelle »)
La description formelle du sens, dès lors que celui-ci est envisagé au palier
textuel -autrement dit, dans le cadre d'une suite linguistique réellement
produite- implique une dichotomie initiale. D'une part, elle concerne ce qui
ressortit à une compositionalité interne (détermination du sens global de
l'unité textuelle par ses constituants locaux). D'autre part, elle concerne ce
qui ressortit à une compositionalité externe (détermination de traits des
constituants locaux par la globalité de l'unité textuelle). Le versant interne
-context free- comprend des faits linguistiques décrits par la syntaxe, par la
sémantique « compositionnelle » et par la linguistique de l'énonciation. Le
versant externe -context sensitive- est celui de normes, tout aussi
linguistiques, commandant ce que F. Rastier appelle un « parcours
interprétatif ». La prise en compte de ces deux versants de la description du
sens textuel permet de les unifier dans une « sémantique interprétative ».
C'est à cette approche qu'introduira le cours. Elle y sera confrontée à divers
types de textes : oraux, écrits, littéraires et non-littéraires.
Bibliographie : J.-M. Adam, Eléments de linguistique textuelle, Paris, Mardaga,
1990 ; M. Bakhtine, « Les genres du discours » in Esthétique de la création
verbale, Paris, Gallimard, [1952-53] 1984 ; Culioli, « La linguistique : de
l'empirique au formel » in Pour une sémantique de l'énonciation, Paris, Ophrys,
1990 ; J.-C. Milner, Introduction à une science du langage, Paris, Seuil, 1989 ;
F. Rastier, Sémantique interprétative, P.U.F.; F. Rastier, « Pour une sémantique
des textes », in M. Mahmoudian (éd.), Fondements de la recherche linguistique.
Perspectives épistémologiques, Cahiers de l'ILSL, n° 6, Université de Lausanne,
1995.
F4 376 PHILOSOPHIE DU LANGAGE ET SCIENCES DU LANGAGE
(UE « Philosophie du langage, histoire et épistémologie »)
Le domaine des théories du langage -et plus particulièrement des théories du
sens- est probablement, en sciences humaines, celui qui offre les illustrations
les plus frappantes des transferts conceptuels se produisant entre étude
empirique et spéculation philosophique. L'objet du cours sera une lecture
parallèle de l'oeuvre de deux penseurs majeurs du XX° siècle -Ferdinand de
Saussure et Ludwig Wittgenstein-, envisagée dans la perspective de ces
transferts.
Bibliographie : F de Saussure, Cours de linguistique générale, Paris, Payot,
[1916] 1995 ; L. Wittgenstein, Tractatus logico-philosophicus suivi de
Investigations Philosophiques (tr. fr. Klossowski), Paris, Gallimard, 1961 ;
L. Wittgenstein, Philosophische Untersuchungen / Philosophical investigations
(tr. angl. Anscombe), Blackwell [1953] 1997 ; L. Wittgenstein, Remarques sur la
philosophie de la psychologie (édition bilingue all./fr, tr. fr. Granel), T. 1
et 2, Mauzevin, Trans-Europ-Repress, 1994 ; L. Wittgenstein, Le Cahier Bleu et
le Cahier Brun (tr. fr. Durand), Paris, Gallimard, 1965 ; L. Wittgenstein, De
la certitude (tr. fr. Fauve), Paris, Gallimard, 1976.
Bibliographie complémentaire : S. Bouquet, Introduction à la lecture de
Saussure, Paris, Payot, 1997
F4 391 HISTOIRE ET EPISTEMOLOGIE DES SCIENCES DU LANGAGE
(UE « Philosophie du langage, histoire et épistémologie »)
Ce cours d'épistémologie historique, qui vise à replacer les avancées des
sciences du langage dans le courant de l'histoire des idées, prendra pour objet
la pensée de F. de Saussure. Il se proposera d'éclairer des concepts cardinaux
du Cours de linguistique générale par les textes originaux que cet ouvrage
recouvre comme un palimpseste : les notes d'étudiants des trois séries de
leçons de linguistique générale données à Genève entre 1907 et 1911 et les
textes autographes (1891-1912) de la « philosophie de la linguistique » de
Saussure. L'objectif est bien de faire apparaître une pensée passablement
différente de celle que la tradition nous a transmise, notamment quant à deux
aspects importants d'une conception générale des sciences du langage : les
principes unificateurs de ces sciences ; leur multidisciplinarité.
Bibliographie : F. de Saussure, Cours de linguistique générale, Paris, Payot,
[1916] 1995 ; F. Gadet, Saussure une science de la langue, P.U.F. ; S. Bouquet,
Introduction à la lecture de Saussure, Paris, Payot, 1997.
33333333333333333333333333333333333333333333333333333333333333333333333333333333
Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue
33333333333333333333333333333333333333333333333333333333333333333333333333333333
{FR, 10/07/1999}
Informatisation de la sémantique interprétative
________________________________________________________________________________
Trilogue sur l'informatisation de la sémantique interprétative, à partir de
la thèse de Bénédicte Bommier-Pincemin (cf. le résumé dans le précédent numéro
de ce bulletin).
- Ioannis Kanellos, professeur à l'École Normale Supérieure des
Télécommunications (Brest)
- Bénédicte Pincemin, Division Recherche et Développement
(Electricité de France)
- François Rastier, Directeur de recherche, CNRS.
IK - J' exprime mon accord global avec la thématique et le mode de gestion des
ressources intellectuelles et techniques de la thèse. Je souhaite résumer son
parcours comme une sorte de paradigme de ce qui devrait, de nos jours, être la
correcte utilisation d'une théorie qui porte sur la rationalisation des
structures et des dynamiques de sens à l'intérieur d'un domaine contraint par
le calcul.
Tu exposes, de manière fort convaincante et subtile, la Sémantique
Interprétative et sa tradition critique et épistémologique. C'est un moment
crucial, puisque, on le sait ou on le comprend, une telle théorie a tout pour
ne pas se conformer aux impératifs du calcul.
Tu es lucide sur cette question : tu sais qu'il est impossible de concilier
tradition herméneutique et calcul. Cette lucidité est, d'ailleurs, parfaitement
synthétisée dans la conclusion, qui guide retrospectivement le développement,
à partir du chapitre V. Tu ne cherches pas à réaliser l'impossible. Tu ne
cherches pas non plus à dissimuler ce caractère inconciliable par un discours
ambigu. Tu adoptes une attitude saine, qui consiste à inverser simplement la
grille épistémologique. D'habitude, on construit des modèles pour valider,
voire pour éprouver une théorie. Parfois même pour l'améliorer, pour la
modifier. Mais alors, il faut que les domaines convoqués le permettent. Ce luxe
n'est pas disponible dans ton travail, précisément à cause de ce hiatus entre
l'activité de l'interprétation et les structures logiques du formalisme requis
pour parvenir à un outil opérationnel. Ainsi, la Sémantique Interprétative ne
te sert point comme théorie mais comme modèle. En tant que modèle déjà
constitué, générique. Donc, comme support pour une interprétation, contrainte
mais réelle, comme support, aussi, d'inspiration. De manière très honnête, tu
nous l'avais déjà dit dès le début, aux premières lignes de ton travail.
Ce faisant, ton discours sera désormais orienté par la volonté de "récupérer"
les éléments de la Sémantique Interprétative relevant de la textualité mais
encore possibles à utiliser dans le cadre du calcul. Certes, on n'aura pas une
véritable textualité, sans doute le manque des conditions herméneutiques et
l'absence de lecture authentique conduiront trop loin. On ne peut servir deux
maîtres à la fois, et le calcul impose un régime non négociable. Cependant, par
ce biais inspiré, dont les fondements remontent probablement à l'aube de la
pensée scientifique, tu arrives à la formulation d'un ensemble de propositions
qui étendent la norme du paradigme lexical en matière de traitement du langage
naturel. Un exemple ne serait pas ici inutile :
Dans la définition des "communautés", des "relations", des "voisinages", etc.,
tu effectues un déplacement magistral à partir du thème de l'isotopie pour
arriver à ce qui seul pourrait être envisageable dans le cadre d'un calcul :
une structure basée certes sur le paradigme lexical, mais internalisant
beaucoup de l'idée de l'isotopie. Cet exemple, central d'ailleurs dans ton
travail, est parfaitement généralisable. On aurait tort de croire que ton projet
est de réécrire le logiciel de diffusion ciblée (DECID) sous la théorie de la
Sémantique Interprétative. Il projet est de l'améliorer précisément en fonction
du modèle textuel que cette théorie met en avant.
Ainsi, ta thèse devient-elle probablement l'affirmation la plus palpable et
assurée de l'utilisation d'une théorie de la textualité non pas comme recette
mais comme palette. Et elle n'a été point triviale : le parcours nécessité
présentait des risques et demandait une grande maturité.
BP - Peut-être faudrait-il encore davantage accentuer ce point auquel tu tiens,
de non prise en charge par le calcul d'une interprétation, de la construction
d'un sens textuel. L'ordinateur ne fait que différer l'appropriation d'un texte,
d'un corpus, par un "utilisateur". Il n'y a aucunement à regretter que
l'ordinateur ne soit pas ce qu'il n'est pas : un sujet, voire un acolyte qui
penserait (lirait) pour moi, comme moi. Les atouts de la machine (mémoire,
rapidité de calcul) sont mis au service d'une reformulation suggestive des
données. Tout l'enjeu réside dans le fait de définir des modes de réécriture,
interprétables et propres à faire sens dans l'expérience de chacun.
FR - Par exemple, un système qui propose des sous-corpus à pertinence enrichie
peut très aisément permettre de d'invalider des hypothèses interprétatives, mais
aussi d'en formuler d'autres, car certaines régularités, dispersées dans le
corpus, semblent "s'imposer d'elles-mêmes" si les documents sont bien présentés.
Ou encore, le fait, simplement, de surligner les mots qui dépassent un seuil
d'écart réduit, si le corpus de référence est soigneusement constitué, permet à
certains d'entre eux de "frapper à la porte". Les petits instruments mis au
point par Evelyne Bourion et Jacques Maucourt se sont ainsi révélés extrêmement
utiles.
BP - J'ai clairement pris des libertés par rapport à la théorie de la sémantique
interprétative telle qu'elle est exposée dans votre ouvrage de 1987 par exemple.
Il est vrai que mon objectif n'était pas l'étude de cette théorie - à la
différence du superbe travail de thèse de Ludovic Tanguy. Votre réflexion m'a
servi de référence, de point de vue linguistique, pour moi qui vient du monde
de l'ingénieur. Référence à laquelle confronter les traitements envisageables,
référence à la lumière de laquelle comprendre les succès ou échecs de telle ou
telle heuristique. Je me suis fiée à cette théorie notamment parce qu'elle part
de textes attestés, non de phrases calibrées ou d'un lexique hors du texte et
fatalement en décalage par rapport à celui-ci.
Comme pour Yannick Prié et toi, Ioannis, conjuguer la sémantique interprétative
et les traitements automatiques m'a semblé passer par la reconnaissance d'une
"trame conceptuelle résistante" : à savoir, quelles sont les lignes de force à
préserver dans une réinterprétation plus calculatoire et formelle. Ma définition
des Communautés vise ainsi une représentation de l'isotopie qui parte bien de sa
manifestation globale plutôt que de la conjonction de sèmes singuliers.
FR - Je ne me sens pas particulièrement qualifié pour aborder le problème de
l'utilisation de la sémantique interprétative, même si j'ai risqué - c'était
un voeu - la notion de sémantique applicable. Plus exactement, je crois que le
couple théorie/application est plus infernal encore qu'il n'y paraît. Au moins
dans les sciences de la culture, les théories sont des rationalisations
temporaires et a posteriori : elles se définissent aussi parce qu'elles ne
permettent pas de voir, par une préconception de leur réel, par les questions
qu'elles récusent (par exemple, la polysémie, la référence) ou qu'elles
refusent de tenir pour centrales. Je crois que les théories trop puissantes,
qui s'appliquent partout, ne rendent compte que d'un petit nombre de faits
triviaux.
Les formations intellectuelles que l'on nomme théories ont des statuts très
divers : notation partielle (théorie X barre), théorie de ensembles, théories
de l'énonciation, etc. On peut distinguer divers plans :
- Un plan de préconception du réel, en termes de grandes catégories, comme :
dynamisme, statisme ; temporalisation, spatialisation ; subjectivisme,
objectivisme ; et qui au demeurant sont souvent corrélées entre elles.
- Un plan gnoséologique, ou théorie implicite de la connaissance et de son
élaboration. Le more geometrico par exemple.
- Un plan épistémologique : une théorie de la science ou des sciences, dont
l'image implicite se traduit souvent dans les modes d'exposition.
- Un plan méthodologique.
- Un plan descriptif : on peut se servir des descriptions lexicales proposées
en sémantique interprétative pour recomposer une ontologie avec une caution
linguistique (plusieurs sociétés d'informatique, comme Arisem, procèdent ainsi).
On ne prend alors qu'une partie de la théorie, sans se préoccuper de son centre
organisateur, le problème du texte. On constitue une sorte d'ontologie
différentielle. On réintroduit une compositionnalité, etc.
- Un plan discursif : modes d'argumentation, terminologie, modes de citation,
rhétorique.
- D'autres réutilisations sont possibles : les modules chez Adam (qui
rebaptisent les composantes textuelles), la typologie des traits chez
Pustejovsky, dont la collaboratrice, Pierrette Bouillon, a fait un mémoire
sur l'isotopie).
La contradiction relevée par Ioannis oppose le traitement informatique -
qui en tant qu'il est formel, suspend l'interprétation - et le caractère
interprétatif de la théorie, qui d'ailleurs n'est pas formelle, mais se veut
simplement rationnelle. Cette contradiction est sans doute plutôt une
incompatibilité de fait qu'une opposition théorique : par exemple des systèmes
probabilistes utilisant l'écart réduit peuvent permettre de formuler ou de
tester des hypothèses ; des systèmes connexionnistes, qui sont hautement
sensibles aux contextes, peuvent modéliser les propagations de traits (ainsi de
l'application actuellement développée par Dominique Béroule et Norbert Rimoux).
On a emprunté deux voies principales :
- La simulation de l'interprétation : le système propose des interprétations
(en particulier des éléments d'isotopie) que le lecteur valide - c'est la voie
suivie par Ludovic Tanguy dans sa thèse. Cette voie suppose une étape
d'identification de sèmes, et elle est difficile à étendre à des corpus.
Elle va du local vers le global.
- L'autre voie principale est celle de la sélection de corpus pertinents en
fonction d'une requête : le système ne "représente" pas l'interprétation,
n'implémente pas la notion de sème. En quelque sorte, il s'agit de contourner
la sémantique pour la mettre en oeuvre. Elle convient aux corpus importants,
va du global vers le local, et produit des systèmes facilement réutilisables.
La thèse de Théodore Thlivitis (voir sur le site Texto!) peut d'ailleurs être
considérée comme un essai réussi de synthèse entre ces deux approches.
La "bonne" utilisation d'une théorie, ce n'est pas uniquement de l'appliquer,
par exemple en transposant la méthode d'analyse d'un texte sur un autre texte.
Ce n'est peut-être qu'une étape dans l'appropriation. L'étape principale, c'est
d'en faire autre chose, de la faire évoluer, et non de s'en inspirer : de
l'inspirer. Je crois au rôle heuristique du détournement...
BP - D'accord sur les réserves à propos d'une "contradiction" entre calcul
et interprétation : si le calcul ne fait pas l'interprétation, il peut
l'accompagner.
Les pratiques statistiques d'Analyse des données, entre autres, invitent
explicitement à plusieurs étapes interprétatives :
- en amont du calcul : choix des données, définition de leur codage,
détermination d'une méthode ;
- en aval : lecture et exploitation des résultats, utilisation des indicateurs,
corrections pour un affinement itératif de l'étude, etc.
Ce sont d'ailleurs sans doute les statisticiens les plus "durs" qui seront les
plus attentifs et scrupuleux quant à l'importance de ces étapes, -les novices
pouvant rester impressionnés par les chiffres et les graphiques et s'en tenir à
leur pouvoir évocateur.
Quant à la deuxième des deux "voies principales" d'introduction d'une approche
interprétative dans le cadre de traitements automatiques, faut-il la désigner
comme "sélection de corpus" ? Plutôt peut-être sélection EN corpus, quoique
encore il y ait des procédures qui sont de véritables reconfigurations et
recontruction et vont bien au-delà d'un travail de filtrage adaptatif :
regroupements structurés d'unités du corpus, représentations graphiques et
"spatialisation" traduisant telle ou telle propriété d'ensemble, etc.
FR - En effet, toute sélection est une recontextualisation, avec les extraits
voisins : on met ensemble des extraits séparés dans le texte : c'est là une
exploitation à grande échelle de l'antique technique herméneutique des passages
parallèles.
BP - Un certain nombre d'initiatives récentes montrent l'appropriation de la
sémantique interprétative dans diverses pratiques de traitement automatique.
Un panorama de ces travaux recueillerait un riche éventail de lectures et de
traductions opératoires de multiples aspects de la théorie.
Des rencontres-ateliers seraient des occasions de discussion, d'échange et de
croisement d'idées sur des points de choix concrets. L'histoire des
implémentations prenant appui sur la sémantique interprétative n'en est qu'à
ses débuts : laissons-la nous surprendre... et nous inspirer !
FR - Comme tout cela nous échappe, faut-il vraiment feindre d'en d'être les
organisateurs ?
44444444444444444444444444444444444444444444444444444444444444444444444444444444
Bibliographie Bibliographie Bibliographie Bibliographie Bibliographie Biblio
44444444444444444444444444444444444444444444444444444444444444444444444444444444
{FR, 10/07/1999}
UNE NOUVELLE COLLECTION AUX EDITIONS CHAMPION
Lettres Numériques
Après le rouleau et le codex, le calame et l'imprimerie, les textes numérisés
ouvrent une nouvelle époque de l'écrit. Elle intéresse au premier chef les
sciences du langage et l'ensemble des études littéraires.
L'établissement et le codage des éditions numériques suscite un renouveau de
la philologie. L'essor de la linguistique de corpus peut permettre de discerner
rigoureusement les variations selon les époques, les discours, les genres et
les textes. Enfin, l'accès aux banques textuelles autorise la convocation
immédiate de corpus de travail et renouvelle les parcours de lecture.
De nouvelles applications, documentaires, pédagogiques, critiques,
apparaissent : aide à l'interprétation, création de sous-corpus à pertinence
enrichie, diffusion ciblée, etc.
Prenant la suite des Travaux de linguistique quantitative, la collection
Lettres numériques entend, sans pruderie technique ni frilosités esthétiques,
témoigner de cet essor en s'ouvrant à toutes les problématiques qui prennent
pour objet les textes numérisés.
Directeurs de collection : Étienne Brunet, François Rastier.
44444444444444444444444444444444444444444444444444444444444444444444444444444444
{FR, 10/07/1999}
APPEL A CONTRIBUTIONS
Numéro spécial de Document numérique sur le thème
« Documents anciens »
Très tôt, historiens, littéraires, paléographes, etc. se sont intéressés à
l'informatique. Toutefois, ils s'en sont surtout servis pour des tâches
d'édition ou de statistique. Mais depuis quelques années, les notions de
document structuré, d'hypertextes, de numérisation, de CD-ROM, de Web, etc.
ont redonné un nouvel essor à l'informatique appliquée aux documents
historiques.
Mais les techniques informatiques sont loin d'être maîtrisées dans ce contexte
des sciences humaines et historiques, notamment en ce qui concerne la notion
même de document. Doit-on considérer un document ancien (que ce soit une stèle
égyptienne, un sarcophage paléochrétien, un cartulairedu Moyen Âge, une lettre
de rémission, un acte notarié du XIX° siècle, un manuscrit de Baudelaire ou de
Perec, etc.) comme une image ou comme un texte et, si on veut les deux, comment
faire les liens d'une vue à l'autre ? Comment montrer les sept versions d'un
chansonnier de Troubadours ? Sait-on bien scanner un document de façon à en
conserver et sa texture (couleurs, brillance, ors, etc.) et sa structure logique
et sa mise en page, etc. ? Ne confond-on pas édition, sur le Web, (diplomatique
ou académique) d'un document et l'outil permettant de travailler sur ce
document, c'est-à-dire qu'elle est la réusabilité des documents mis sur le Web ?
Tous ces constats nous conduisent à consacrer un numéro spécial de la revue
Document numérique aux documents anciens numérisés (Document numérique est une
revue française dédiée aux documents électroniques qui s'adresse aussi bien aux
chercheurs qu'aux milieux professionnels de l'édition et de leurs emplois sur le
Web ! (Voir http://www.hermes-science.com). Le but est de faire le point sur
les techniques les plus récentes et leurs incidences organisationnelles, pour
les professionnels, historiens, paléographes, généticiens, etc. mais aussi pour
les éditeurs et les étudiants.
Notre ambition est de réaliser un numéro de référence où se conjuguent technique
informatique et ergonomie des utilisateurs historiens et de dégager des axes
pour le futur.
Sont donc particulièrement recherchés des articles de synthèse (sur les notions
de corpus ou de document numérique et leurs implications dans le cadre des
sciences humaines et notamment historiques, bibliologiques, etc.), des études
de cas (descriptions de corpus, de structures, hyper-textuelles ou non, de
documents en en montrant la généralité), etc.
Thèmes (liste non exhaustive)
- numérisation des documents anciens (pour étude, pour conservation, pour
diffusion, etc.) ;
- traitement des abréviations et signes non-typographiques (reconnaissance,
catalogage, saisie , indexation, etc.) ;
- reconnaissance des structures (textes, images) ;
- traitement de la topographie des manuscrits ;
- recherche ou indexation dans le cadre de documents imagés ou structurés ;
- Text Encoding Initiative (TEI) ou XML pour les manuscrits anciens,
méta-données (RDF) ;
- etc.
Pour tout contact
- Jacques André
tél. +33 2 99 84 73 50, fax. +33 2 99 84 71 71
jandre@irisa.fr
- Marie-Anne Chabin
tél. +33 1 49 83 24 07, fax +33 1 49 83 33 94
chabin@ina.fr, chabin17@club-internet.fr
44444444444444444444444444444444444444444444444444444444444444444444444444444444
{BP, 27/07/1999}
CORPUS ET TAL
Un atelier sur ce theme vient de se tenir lors de la Conférence TALN'99
(Cargèse, 12-17 juillet 1999) (http://talana.linguist.jussieu.fr/taln99/).
Nous reprenons ci-après l'argument de l'Atelier.
______________________________
Corpus et Traitements Automatiques des Langues :
pour un réflexion méthodologique
Le recours aux corpus, alimenté par des ressources linguistiques et logicielles
toujours plus nombreuses, devient de plus en plus fréquent dans les recherches
et les applications en TAL. Cette évolution doit s'accompagner d'une réflexion
de nature méthodologique. Les corpus sont généralement perçus comme des stocks
de données permettant d'acquérir automatiquement des informations linguistiques,
mais leur rôle reste à évaluer clairement.
Il existe différentes façons d'envisager les corpus. On peut distinguer
quelques unes de ces pratiques. Les corpus sont considérés :
* le plus souvent, comme des données attestées permettant de rendre compte du
fonctionnement de "la langue". Le corpus facilite la construction de modèles,
et constitue en particulier une alternative à l'établissement de données
lexicales par introspection. Il peut être également utilisé pour valider des
modèles existants.
* comme des données spécifiques, à partir desquelles on tire des conclusions
propres au seul corpus, dans le cadre d'une application donnée (par exemple,
l'acquisition de terminologie dans un domaine spécifique),
* comme des données expérimentales dont on peut contrôler les variables (écrit
vs oral, domaine couvert, visée discursive, etc.) pour les rendre
représentatives d'usages spécifiques de la langue et permettre une
généralisation des résultats aux sous-systèmes délimités par ces variables,
voire au système général de la langue (par exemple, pour la constitution
d'analyseurs syntaxiques généraux). Pour garantir cette représentativité,
l'accent est souvent mis sur la taille des corpus.
Ces perspectives, de natures très différentes, doivent être explicitées afin
que l'on puisse évaluer les résultats obtenus sur corpus, tant sur le plan de
la validité que sur celui de la réutilisabilité. Nous souhaitons que cet
atelier soit l'occasion de confronter ces différents points de vue et de les
éclaircir.
Dans ce but, nous nous intéresserons aux travaux qui développent une réflexion
sur l'utilisation des corpus pour le TAL et/ou la linguistique. Les domaines
abordés par les articles ainsi que les méthodes employées pourront couvrir
l'ensemble des thèmes de la conférence TALN. Nous encourageons les propositions
de contribution qui problématisent le recours aux corpus et posent nettement
certaines des questions suivantes :
* pourquoi recourt-on aux corpus dans le travail décrit ?
* selon quels critères constituer le corpus ? Ou, si un corpus est d'emblée
disponible pour l'application visée, comment le caractériser pour pouvoir
évaluer la portée des résultats de son utilisation ? Comment remplit-on le
cas échéant des objectifs de représentativité ?
* les résultats obtenus sont-ils liés à ce corpus, sont-ils généralisables ?
* comment choisit-on les outils à mettre en oeuvre ? Quelles sont les
conséquences sur le plan méthodologique ?
COMITE D'ORGANISATION
Anne Condamines, Cécile Fabre, Marie-Paule Péry-Woodley
ERSS (Equipe de Recherche en Syntaxe et Sémantique), Toulouse
(acondami,cfabre,pery)@univ-tlse2.fr
55555555555555555555555555555555555555555555555555555555555555555555555555555555
Colloques Colloques Colloques Colloques Colloques Colloques Colloques Colloques
55555555555555555555555555555555555555555555555555555555555555555555555555555555
{FR, 10/07/1999}
COLLOQUE EN LIGNE
Le groupe de recherche Fabula lance un appel à contributions pour un colloque
en ligne qui aura lieu au mois de décembre 1999 avec comme thème "Frontières
de la fiction".
Appel à contributions : colloque en ligne "Frontières de la fiction"
(décembre 1999)
Vous pouvez retrouver le texte de l'appel à contributions :
- au format html
http://www.fabula.org/colloque99.htm
- au format Adobe PDF, format universel de diffusion
http://www.fabula.org/appel.pdf
- au format RTF, lisible par les traitements de texte
http://www.fabula.org/appel.rtf
Pour tout renseignement : colloque@fabula.org
55555555555555555555555555555555555555555555555555555555555555555555555555555555
////////////////////////////////////////////////////////////////////////