2005_10_18
________________________________________________________________________
SdT volume 11, numero 5.
LES CITATIONS DU MOIS
________________________________________________
La narration est possible là où l'éternité
attire et surélève le temps, non là où elle
l'abolit.
Ricoeur, Temps et Récit, I, p. 61.
A Balbec, un jour où la princesse de Luxembourg
m'avait dit qu'elle n'avait pas emporté de
livre, j' allais lui prêter pêcheur d'Islande
et Tartarin de Tarascon, quand je compris
ce qu'elle avait voulu dire : non qu'elle
passerait le temps moins agréablement,
mais que je pourrais plus difficilement
mettre mon nom chez elle.
M. Proust, La prisonnière, t.1.,
Paris:Gallimard, 249.
________________________________________________
SOMMAIRE
1- Coordonnees
- Bienvenue a Emmanuelle TRICOIRE, Sheila VIEIRA DE CAMARGO
GRILLO, Thanh Tuyen NGUYEN THI, Romeo GALASSI, Charlotte
DILKS, Magda DARGENTAS, Catherine GOUTTAS.
- Changements d'adresse : Marie-Christine LALA, Andrea ROCCI,
Driss EL KHATTAB.
2- Carnet
- Au commencement, il y avait le service de presse...
- Programme du Seminaire de Francois Rastier, 2005-2006.
3- Textes electroniques
- Textometrie avec Lexico
- Site et revue EspacesTemps
- Internet litteraire en langues romanes : actes de colloque
4- Publications
- Cahiers de praxematique 43 (2004) : Aspect du dialogisme
- Texto! : nouveautes de la derniere edition (septembre 2005)
5- Dialogues
- Diction du poeme contemporain : dialogue entre
Michel Favriaud et Francois Rastier.
6- Appels : Colloques et revues
- L'analyse secondaire en recherche qualitative. Utopie ou
perspectives nouvelles ?, Grenoble, 3-4 novembre 2005.
- Langage et violence, Paris, 30 novembre 2005.
- Traces, Enigmes, Problemes : Emergence et construction du sens
Rochebrune, Megeve, 22-27 janvier 2006.
- Historiography of Linguistics in the 21th Century : Challenges
and Perspectives (SGdS2006), Leiden, 28-30 June 2006.
- Colloque de l'Association for Linguistic and Literary
Computing, Paris, 5-8 juillet 2006.
- Corpus en Lettres et Sciences sociales -Des documents
numeriques a l'interpretation, Albi, 10-14 juillet 2006.
- Integrating perspectives and methodologies in the study of
language (LCM 2), Paris, 17-20 July 2006.
- Semantique des textes theoriques, Paris, 2 decembre 2005
(programme avec les resumes des communications).
111111111111111111111111111111111111111111111111111111111111111111111111
Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees
111111111111111111111111111111111111111111111111111111111111111111111111
BIENVENUE AUX NOUVEAUX ABONNÉS
[information réservée aux abonnés]
222222222222222222222222222222222222222222222222222222222222222222222222
Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet
222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/10/2005}
RENTRÉE LITTÉRAIRE
"Au commencement, il y avait le service de presse, et quelqu'un le
reçut, envoyé par l'éditeur. Alors il rédigea un compte rendu. Puis il
écrivit un livre, que l'éditeur accepta et qu'il transmit comme service
de presse. Celui qui le reçut fit de même. Et c'est ainsi que se
constitua la littérature contemporaine."
Karl Kraus, Troisième nuit de Walpurgis. Agone, 2005.
222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/10/2005}
SEMINAIRE
Séminaire Sémantique des textes, année 2005-2006
François RASTIER, Directeur de recherche
Sémiotique des cultures (II.)
Les thèmes suivants seront abordés :
- Le sens : référence ou références ? Ontologie et déontologie.
- Pour une sémantique des textes scientifiques.
- Sémiotique des discours identitaires.
- Plurilinguisme et traduction.
- Les spécificités de l'objet culturel.
- Objectivation et interprétation dans les sciences de la culture.
Les programmes de naturalisation et leurs enjeux.
Institut national des langues et civilisations orientales, Centre de
Recherches en Ingéniérie Multilingue, 2 rue de Lille, 75007 Paris -
Salons de l'Inalco, escalier C, deuxième étage, salle 223.
Métro : Saint-Germain, Musée d'Orsay ou Palais-Royal.
Les jeudis 5, 12, 19 et 26 janvier ; 2 et 23 février ; 2 mars.
Horaire : de 17h30 à 19h15.
Contact: Lpe2@ext.jussieu.fr
Site du séminaire virtuel : http://www.revue-texto.net
Parmi les lectures possibles :
Cassirer, E., Logique des sciences de la culture, Paris, Cerf, 1991.
Descola, P. Par-delà Nature et Culture, Paris, Gallimard, 2005.
Rastier, F. et Bouquet, S. (dir.) Une introduction aux sciences de la
culture, Paris, Puf, 2002.
Rickert, H., Sciences de la culture et sciences de la nature, Paris,
Gallimard, 1997.
333333333333333333333333333333333333333333333333333333333333333333333333
Textes electroniques Textes electroniques Textes electroniques Textes
333333333333333333333333333333333333333333333333333333333333333333333333
{FR 10/10/2005, Valette 06/09/2005}
NOTES DE DEGUSTATION
* Un site consacré aux explorations textométriques avec Lexico3 qui
devrait devenir un recueil d'expériences couvrant des domaines très
différents. Il s'agit de compte rendus d'expériences, en cours ou
achevées, signées par leurs auteurs, lesquels auront ensuite le loisir
de les remettre à jour si besoin. Les premières contributions sont
disponibles ici :
http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/
navigations-tdm.html
* EspacesTemps
Un site et une revue des sciences sociales.
La revue : http://EspacesTemps.net
L'adresse : Redaction@EspacesTemps.net
333333333333333333333333333333333333333333333333333333333333333333333333
{FR, 10/10/2005}
INTERNET LITTERAIRE
Les actes d'un colloque de 2003, consacré à l'Internet littéraire dans
les langues romanes (en grande partie le domaine francophone), sont
publiés dans la revue en ligne Philologie im Netz (www.phin.de). On
trouvera les articles dans le second supplément / Beiheft, à partir
de la barre de menu horizontale supérieure :
Jörg Dünne / Dietrich Scholler / Thomas Stöber (Hg.) (2004) : Internet
und digitale Medien in der Romanistik : Theorie - Ästhetik - Praxis
444444444444444444444444444444444444444444444444444444444444444444444444
Publications Publications Publications Publications Publications
444444444444444444444444444444444444444444444444444444444444444444444444
{Bonnet, 08/07/2005}
VIENT DE PARAÎTRE
Le N° 43 des Cahiers de Praxématique vient de paraître :
Cahiers de praxématique 43 -- 2004
"Aspect du dialogisme"
Numéro coordonné par Aleksandra Nowakowska.
444444444444444444444444444444444444444444444444444444444444444444444444
{FR, 10/10/2005}
TEXTO ! http://www.revue-texto.net
Les nouveautés de la dernière édition (septembre 2005)
Dans la rubrique DITS ET INÉDITS :
Alinei, Mario
The Paleolithic Continuity Theory on Indo-european Origins :
An Introduction (2004). [Coédition : article extrait du PCT]
The author discusses the theories on the origins of Indo-Europeans and
proposes a new synthesis : the Paleolithic Continuity Theory.
Brandist, Craig
Mikhail Bakhtine and the early Soviet Sociolinguistics (2003)
Dumesnil, Pierre
Pour une économie sémiotique (2005)
L'article suggère qu'une réévaluation des disciplines éducatives et
culturelles sans finalité professionnelle, couplées avec "l'usinage du
signe" via l'ordinateur en réseau, pourrait contribuer à l'émergence
d'une économie soutenable car très massivement sémiotique.
Labbe, Hélène & Marcoccia, Michel
Communication numérique et continuité des genres :
l'exemple du courrier électronique (2005)
L'article traite de la question des genres numériques et montre,
à partir d'une étude de cas, l'influence des genres pré-numériques et la
continuité de ces genres. L'étude de cas porte sur l'analyse comparative
du billet et du courrier électronique.
Rastier, François
Mésosémantique et syntaxe (2005)
Ce texte présente la mésosémantique, qui opère aux paliers du syntagme
(syntagmes pourvus d'une fonction syntaxique) et de la période.
De la sémantique cognitive à la sémantique diachronique :
les valeurs et évolutions des classes lexicales (2000)
Cette étude des inégalités qualitatives en diachronie montre comment
l'évolution sociale des normes de valorisation remanie la structure des
classes lexicales élémentaires (taxèmes) ; elle prend pour exemple
l'histoire des dénominations du visage en français depuis le XVe siècle.
Rousseaux, Francis & Thomas Bouaziz
L'invention des connaissances par les informaticiens (2005)
L'analyse de systèmes d'aide à l'interprétation de documents numériques
met en évidence une déconstruction de la notion de "connaissances" telle
qu'elle a été proposée aux informaticiens par Allen Newell en 1982 ;
parallèlement, on assiste à l'émergence prometteuse de la notion de
"collection".
Sériot, Patrick
Oxymore ou malentendu ? Le relativisme universaliste de la
métalangue sémantique naturelle universelle d'Anna Wierzbicka
(2004)
Analyse des fondements épistémologiques des primitives sémantiques
universelles d'Anna Wierzbicka dans le cadre d'une perspective plus
générale de mise en évidence des présupposés scientifiques et
idéologiques du discours sur la langue en Europe orientale.
Dans la rubrique DIALOGUES ET DÉBATS :
- Les sciences cognitives (2005)
Entretien entre François Rastier et Philippe Lacour sur les sciences
cognitives et le programme de naturalisation.
François Rastier discute le programme cognitiviste denaturalisation des
sciences sociales et sa version néo-darwinienne, qui privilégie les
sciences de la vie et la métaphore du gène. En rupture avec ce
programme, Rastier explique les raisons qui l'ont conduit à développer
les bases d'un programme fédérateur pour les sciences de la culture.
Dans la rubrique FERDINAND DE SAUSSURE :
Saussure, Ferdinand de
Nouveaux item (1996)
Transcription diplomatique établie par Rudolf Engler d'après les notes
manuscrites déposées à la Bibliothèque de Genève.
Choi, Yong-Ho & Hyun-Kwon Kim
Saussurism in Korea [Coédition : article extrait de SemiotiX,
2004, Volume 1, Issue 1]
Saussure as the very first western linguist who influenced Korean
linguistics.
Dans la rubrique LA LETTRE ET L'INTERPRÈTE :
Wögerbauer, Werner
L'engagement de Paul Celan (2000)
On a parfois reproché à la poésie de Paul Celan son absence de message
social. Mais ses interventions politiques se sont produites dans la
matière même des poèmes, comme autant de prises de position formulées à
partir d'un repli à la fois personnel et poétique.
Utaker, Arild
Babel et la diversité des langues (2004)
Lorsque la traduction sert de levier critique contre certaines thèses
communes aux théories philosophiques du langage.
Dans la rubrique REPÈRES :
Thèmes :
Dossier "Rhétorique" :
Carine Duteil-Mougel
Introduction à la rhétorique (2005)
Étude de l'évolution de la Rhétorique à travers les conceptions des
principaux auteurs Anciens : Aristote, l'auteur de la Rhétorique à
Hérennius, Cicéron et Quintilien.
Dossier "Textes et discours" :
Rossitza Kyheng
Hjelmslev et le concept de texte en linguistique (2005)
Le début des conceptualisations du terme « texte » en linguistique et
les deux concepts de texte chez Hjelmslev.
Dans la rubrique CORPUS :
Vaillant, Pascal
La classification automatique des textes (2005)
La classification automatique de textes et l'attribution des catégories.
Dans la rubrique PARUTIONS ET TRÉSORS :
Hébert, Louis
Une sémantique différentielle unifiée (1996)
Louis Hébert réalise le compte rendu critique de Sémantique pour
l'analyse. Il présente les différentes sections de cet ouvrage collectif
en dégageant les principaux concepts de la Sémantique interprétative.
Brague, Rémi
Le Coran, sortir du cercle ? (2003) [Coédition : article extrait
de Phronesis.org : Ancients & Moderns Philosophy]
Compte rendu de : LUXENBERG, Christoph. Die syro-aramâische Lesart des
Koran. Ein Beitrag zur Entschlûsselung der Koransprache. Berlin : Das
Arabische Buch, 2000 ; PRÉMARE, Alfred-Louis de. Les Fondations de
l'Islam. Entre écriture et histoire. Paris : Le Seuil, 2000.
TRADUCTIONS :
En español :
Wögerbauer, Werner
El compromiso de Celan
(Traducción de Arnau Pons)
555555555555555555555555555555555555555555555555555555555555555555555555
Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue
555555555555555555555555555555555555555555555555555555555555555555555555
{FR, 10/10/2005}
DICTION DU POEME CONTEMPORAIN
Dialogue entre Michel Favriaud et François Rastier.
MF> On a quelquefois brocardé la diction des poètes déclamant leur
propre texte -celle d'Apollinaire par exemple, alors que
l'enregistrement technique et l'historicité de cette diction doivent
être pris en compte. On peut être surpris au contraire de l'intérêt de
la diction de James Sacré, Gherasim Luca, André du Bouchet, sans compter
celle des sonores comme Bernard Heidsieck ou (l'est-il, sonore ?)
Jean-Luc Parant, ou à contre pied celle de Philippe Jaccottet, qui,
quoique profonde et mesurée, s'inscrit néanmoins dans une tradition de
"déclamation" classique ; toutes sont émouvantes, font quelque chose de
plus que celles des comédiens, comme si elles nous transformaient.
Partagez-vous cet avis et comment expliquez-vous ce phénomène ?
FR> L'auteur n'est point par nature le meilleur de ses interprètes ;
qu'il s'agisse de dire ou de donner sens, son interprétation n'est
qu'une parmi d'autres. Elle ferme le texte sur ses intentions, alors
qu'en tant qu'oeuvre, il les dépasse.
Apollinaire garde une diction d'avant quatorze, alors que l'esthétique
vocale était dominée par Rosine Bernard -dite Sarah Bernhardt sans doute
pour plus d'emphase. Rien ne vieillit plus vite que les normes de
diction. Celles (pathétiques !) du romantisme tardif sont par bonheur
devenues insupportables. Mais Du Bouchet a vieilli plus vite que ses
textes, mais nous ne nous en apercevions pas, car nous sommes ses
contemporains.
MF> Alors vient la question corollaire : pourquoi la diction des
comédiens est-elle si décevante, même de ceux qui s'y appliquent. Pour
ma part je ferai une distinction entre diction de comédien et diction de
récitant. La question importe en réception : le lecteur est trompé sur
la force d'authenticité de la poésie ; et aussi en formation : d'adulte
et d'élève. Avez-vous cette même frustration d'auditeur et comment
l'expliquez-vous ?
FR> En effet, la diction des comédiens reste souvent décevante, sans
doute parce qu'elle s'adresse au public d'un spectacle. Or, non
seulement la poésie contemporaine a perdu ses genres auliques (elle se
fait dans un lit, dit Breton), mais elle semble écrite pour le langage
intérieur, voire en langage intérieur -d'où la ponctuation blanche, car
les blancs rappellent les inhibitions propres à la conscience
attentionnelle.
De plus, la diction est un art de la présence, alors qu'une bonne part
de la poésie contemporaine creuse le problème de l'absence, elle aussi
figurée dans les blancs.
À cela s'ajoute spécifiquement la censure du poétique en France
cartésienne et jacobine. Les réussites demeurent plutôt dans l'ordre de
la prose : par exemple, "La Princesse de Clèves" lue par Michèle Morgan,
dont la diction déjà un peu désuète rend à merveille la distance
estompée entre le temps des Valois où se déroule le roman et celui où
Madame de La Fayette le rédige. Ce texte ne me semble pouvoir être lu à
haute voix que par une femme de sa trempe.
MF> Pour ma part, en tant qu'auditeur et formateur, je me pose aussi la
question de l'espace de diction. Si dire de la poésie, c'est autre chose
que de porter sur scène un personnage fictionnel, ou encore que de lire
un texte philosophique, c'est peut-être parce qu'il y a un autre rapport
entre le récitant et l'auditeur-spectateur (singulier ou collectif ?).
Comment se construit cet espace ? Il y a du corps, des yeux-regards.
Est-ce un lieu seulement sonore, un lieu-hors, imaginaire, ou est-ce un
espace que l'on peut décrire ? Dire un texte à plusieurs permettrait-il
de déployer la polyphonie du texte poétique et de construire cet
espace ?
FR> A la différence de l'espace théâtral ou chorégraphique, l'espace de
diction n'est pas socialement défini. Les lectures qui se sont
multipliées dans les festivals de théâtre ont plutôt rabattu la diction
poétique sur la diction théâtrale. La lecture publique a presque
disparu, sauf dans certains rituels d'ailleurs passablement désertés.
Le rhapsode -a fortiori l'aède- et leur public sont devenus
inimaginables. On improvise donc un éthos de lecteur, entre diseur et
récitant. La lecture dépend de fait de la pratique sociale où elle
s'insère.
L'espace de formation, la classe ou l'amphi, lèvent à leur manière
certaines indécisions : mais pour sortir de l'assommoir pédagogique, je
pense qu'il faut susciter des joutes implicites entre les jeunes qui
vont lire pour s'accomplir.
On ne peut s'appuyer que sur le régime herméneutique du texte, dans la
mesure où toute diction est une lecture dans tous les sens du terme.
MF> La diction du poème traduit relève-t-elle de la même problématique
ou s'y adjoint-il de nouveaux éléments, réellement nouveaux ou seulement
révélés à cette occasion ? Il me semble qu'on tient compte autrement du
public, qui connaît quelque chose ou rien de l'oeuvre ou de la culture
étrangère présentées, et qu'on ne peut "défendre" le texte traduit avec
la même assurance que l'oeuvre source. Il y aurait comme une modération,
une réserve qui affecteraient le timbre...
FR> Peut-être par lassitude hexagonale, je dois dire que les
interprétations les plus convaincantes pour moi l'ont été dans des
langues étrangères : Shakespeare, Dante, Attâr...
Tout comme on ne traduit pas de langue à langue, mais de genre à genre
(ou du moins d'un genre à un "genre prochain") on devrait sans doute, en
disant la traduction d'un poème étranger partir d'un genre analogue pour
innover. Aussi le changement de genre me semble catastrophique. Quand
Gougaud traduit un poème mystique de Attâr comme une fable de La
Fontaine, il impose par sa ponctuation comme par son lexique une diction
primesautière qui transforme la leçon mystique en apologue plaisant, et
cette erreur de genre fausse définitivement la diction et le sens tout
ensemble.
Vous avez mis en évidence que là où Garcin de Tassy traduisait : "Un
autre papillon alla passer auprès de la lumière et s'en approcha. Il
toucha de ses ailes la flamme, la bougie fut victorieuse et il fut
vaincu. Il revint lui aussi, et il révéla quelque chose du mystère en
question. Il expliqua en quoi consistait l'union avec la bougie ; mais
le sage papillon lui dit [...] ", Gougaud ose traduire : "On envoya un
autre expert. Celui-là franchit le rideau, effleura la flamme, poussa un
cri de papillon, revint en hâte à ses compères et révéla, tout
essoufflé, qu'il s'était quelque peu brûlé ".
Les octosyllabes typiques de la fable et plus généralement de la poésie
légère sont bien là (8858888), tout comme l'anthropomorphisme social
(expert, président), les termes hérités du fabliau (compère) et
l'entrain convenu (cri de papillon, en hâte, tout essoufflé).
L'intensité de l'ardeur est travestie en médiocrité (quelque peu),
l'humour de la sagesse transcendante en allégresse comique.
Le choix que vous avez fait d'un alexandrin méditatif me semble pouvoir
éviter, voire réparer, ces dommages bien de chez nous.
Comme la traduction ne s'apprécie véritablement qu'en édition bilingue,
il faudrait imaginer une diction bilingue pour rendre sensible
l'altérité et l'émulation des univers expressifs.
Une amie étrangère me demandait un jour où sont en France les écoles de
traduction poétique. Cette question demeura sans réponse. On traduit en
prose. Au mieux, on fait parler Héraclite dans l'idiome de Saint John
Perse.
L'universalité de la langue française, de sa prose, cache mal un mépris
souverain : Gallimard, par exemple, a traduit tout Mishima de l'anglais,
mais peu importe dès lors qu'il a la chance d'être mis en français.
MF> Le timbre, n'est-ce pas la grande affaire, que ne régulent vraiment
ni la ponctuation, ni la métrique, ni cette syntaxe plurielle
caractéristique du poème ? Le cadre de réception non plus ne saurait à
lui seul le constituer ! Alors, comment le définir, à quel point de
l'interprétation ?
FR> Le timbre me semble porter l'essentiel du fond émotionnel du texte,
sur lequel se détachent les formes prosodiques -et, indirectement, les
formes sémantiques.
MF> Vous avez aussi une expérience d'écriture et de poète. Peut-on
parler d'une diction intérieure, d'une diction intérieure qui
accompagne, précède ou suit l'écriture. Quel serait le rapport entre
cette voix du dedans plus ou moins aboutie et l'écriture ?
FR> Je ne peux répondre en lieu et place d'un pseudonyme naturellement
plus autorisé. Les programmes moteurs, les gestes énonciatifs qui les
réalisent ont besoin de rythmes pour s'actualiser : le rythme permet
tout à la fois l'anticipation et la rétrospection, pour sortir de
l'instant aveugle et oublieux et construire le temps accompli de
l'action. Je parle ici des rythmes expressifs comme des rythmes
sémantiques. L'écriture littéraire expérimente et réfléchit de manière
parfois inouïe ces conditions générales de l'action énonciative.
MF> On pourrait conclure par un très bon souvenir -ou un très mauvais-
de diction entendue, vécue. Vous pourriez en évoquer le contexte et
l'effet durable en vous...
FR> Dans ses rares moments de repos, le commandant Massoud lisait et
écrivait des poèmes dans la grande tradition. Je pense souvent à ce bref
poème qu'il a dit lui-même dans un film de Christophe de Ponfilly. Le
rapport de la culture persane (Massoud était tadjik) à sa poésie est
immensément confiant et respectueux -alors que dans la France
contemporaine la poésie reste tout à la fois exaltée et méprisée, deux
manières complémentaires de ne pas lui rendre justice.
666666666666666666666666666666666666666666666666666666666666666666666666
Appels Appels Appels Appels Appels Appels Appels Appels Appels Appels
666666666666666666666666666666666666666666666666666666666666666666666666
{Le Roux, 20/07/2005}
JOURNEES D'ETUDE
« L'analyse secondaire en recherche qualitative.
Utopie ou perspectives nouvelles ? »
Maison des Sciences de l'Homme - Alpes, Grenoble, 3-4 novembre 2005.
Les équipes de recherche PACTE-CIDSP (Cnrs / Univ. Grenoble) et GRETS
(Edf R&D) organisent deux journées d'étude internationales intitulées :
« L'analyse secondaire en recherche qualitative. Utopie ou perspectives
nouvelles ? ». Ces journées ont pour ambition de contribuer à la
réflexion sur le statut de l'analyse secondaire des entretiens dans les
sciences humaines et sociales d'un point de vue méthodologique et
épistémologique. Il s'agira notamment de faire connaître et de discuter
des expériences européennes de capitalisation et de ré-utilisation des
entretiens de recherche.
Le programme de ces journées traitera :
- d'une réflexion générale sur les usages du qualitatif, à travers un
état des lieux de ces pratiques en sciences humaines et sociales ;
- des expériences de capitalisation et d'analyse secondaire ;
- des conditions de leur réalisation en examinant les aspects
déontologiques, juridiques ainsi que les logiciels d'analyse ;
- de la synthèse de ces questions et des développements futurs de
l'analyse secondaire des matériaux qualitatifs.
666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}
COLLOQUE
Centre de coopération franco-norvégienne
en sciences sociales et humaines
MAISON DES SCIENCES DE L'HOMME
54, Boulevard Raspail - 75270 Paris Cedex 06
Tél.: 01 49 54 22 16 Fax: 01 49 54 21 95
Web: http://www.uv.uio.no/paris
LANGAGE ET VIOLENCE
Colloque franco-norvégien le 30 novembre 2005
La Maison des Sciences de l'Homme, Salle 215
Matin
Modérateur : Arild Utaker
10.00 - 11.00 François Rastier (CNRS) : Pathos et extermination
11.00 - 12.00 Philippe Mesnard (ISTI, Bruxelles) :
Rationalité, témoignage et littérature
12.00 - 12.30 Discussion
Après-midi
Modérateur : François Rastier
14.30 - 15.30 Olivier Remaud (EHESS) :
Le point de vue du langage ordinaire
15.30 - 16.30 Arild Utaker (Université de Bergen) :
Langage et expérience ; quelle critique du langage ?
16.30 - 17.00 Discussion
666666666666666666666666666666666666666666666666666666666666666666666666
{Beust, 09/09/2005}
COLLOQUE
13eme Journées de Rochebrune
Rencontres interdisciplinaires sur les
systèmes complexes naturels et artificiels
Traces, Enigmes, Problèmes :
Emergence et construction du sens
Du 22/1/06 au 27/1/06,
Rochebrune, Megève, France
L'énigme, suppose que, partant de données a priori obscures, celui qui
s'y trouve confronté peut la résoudre au terme d'une série d'opérations
destinées à "donner, construire, faire émerger" un sens.
[...] Ainsi, toutes les disciplines visant à faire émerger, ou à
construire une interprétation à partir d'un ensemble de données
incomplètes ou dégradées sont concernées par la problématique de
l'énigme et de la trace.
Informations :
http://rochebrune.iutc3.unicaen.fr/Rochebrune2006
666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}
CALL FOR PAPERS
18th International Colloquium of the
Studienkreis Geschichte der Sprachwissenschaft (SGdS2006)
Historiography of Linguistics in the 21th Century :
Challenges and Perspectives
28-30 June 2006, Leiden University (Leiden, The Netherlands)
The XVIIIth International Colloquium of the 'Studienkreis Geschichte der
Sprachwissenschaft (SGdS)' will take place at the University of Leiden
from 28 to 30 June 2006 and will be organized by Els Elffers
(Amsterdam), Jan Noordegraaf (Amsterdam), Peter Schmitter (Seoul /
Muenster), and Marijke van der Wal (Leiden).
Papers on "Historiography of Linguistics in the 21th Century :
Challenges and Perspectives", the main subject of our conference, are
particulary welcome, but contributions focussing on other topics within
the framework of the history of linguistics are also much appreciated.
Presentations will last 30 minutes, followed by 15 minutes of
discussion.
The conference languages are English and German. The conference fee will
be 30 Euro, payable during the conference.
Participants who would like to give a paper are kindly asked to submit
an abstract of 250-350 words by 15 January 2006, using the template
below which can be copied and returned as a Word- or rtf-file to
dr. Marijke van der Wal (m.j.van.der.wal@let.leidenuniv.nl) as well as
to professor Peter Schmitter (schmipe@uni-muenster.de).
For further informations, please contact the local organizer
Marijke van der Wal
Universiteit Leiden - Department of Dutch/LUCL
P.N. van Eyckhof 1 - Postbus 9515 - NL-2300 RA Leiden - The Netherlands
m.j.van.der.wal@let.leidenuniv.nl
or
Peter Schmitter
Graduate School of Interpretation and Translation
Hankuk University of Foreign Studies
270 Imun-2-dong, Dongdaemun-gu - Seoul, 130-791 Korea (South)
schmipe@uni-muenster.de
666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}
COLLOQUE ALLC-ACH
Du 5 au 8 juillet 2006 à Paris-IV, le grand colloque annuel de
l'Association for Linguistic and Literary Computing
http://www.allc-ach2006.colloques.paris-sorbonne.fr/
666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}
COLLOQUE - ECOLE D'ETE
Colloque international et école d'été
Albi, 10-14 juillet 2006
Organisé dans le cadre des
Colloques d'Albi Langages et signification (CALS)
Corpus en Lettres et Sciences sociales
-Des documents numériques à l'interprétation
Deuxième circulaire
La constitution et l'analyse de corpus est en train de modifier les
pratiques voire les théories en lettres et sciences sociales. Comme ces
disciplines ont maintenant de plus en plus affaire à des documents
numériques, cela engage pour elles un nouveau rapport à l'empirique. En
outre, la numérisation des textes scientifiques eux-mêmes permet un
retour réflexif sur leur élaboration et leurs parcours d'interprétation.
Les nouveaux modes d'accès aux documents engagent-ils de nouvelles
formes d'élaboration des connaissances ?
Les nouvelles initiatives prises au plan national (création du Centre
d'édition numérique scientifique du CNRS) et international (TGE Adonis -
Accès unique aux données et documents numériques des Lettres et sciences
humaines) peuvent devenir l'occasion et donner les moyens d'un projet
fédérateur pour les lettres et les sciences sociales. De nombreuses
collectivités sont de longue date engagées dans une réflexion sur la
numérisation et l'analyse assistée des documents : outre bien entendu
les sciences de l'information, il faut mentionner l'histoire, la
sociologie, la linguistique, l'archéologie, les études littéraires -
énumération évidemment non limitative...
Aussi ce colloque ouvert entend-il renforcer des liens et favoriser de
nouvelles rencontres d'enseignants et chercheurs de ces disciplines avec
ceux des collectivités de la linguistique de corpus et du document
numérique. Sans trop d'égard pour l'objectivisme ordinaire, il traitera
des problèmes philologiques et herméneutiques que pose le travail sur
des corpus numériques, en fonction des tâches et des disciplines. Il
s'attachera par exemple à la typologie des genres et discours, à la
description de formes et de fonds sémantiques, au repérage de thèmes, à
la caractérisation et à l'évolution de concepts, à l'étude des
corrélations contenu/expression.
Au plan pratique, on abordera sous une forme didactique les questions
que posent le recueil, l'établissement, le codage, l'étiquetage, le
traitement des corpus et leur édition électronique. Des démonstrations
de logiciels seront assurées, ainsi que des initiations aux
problématiques propres aux différentes disciplines concernées.
* Calendrier
- Propositions de communications : un résumé d'une page comprenant
références bibliographique et mots-clés. Du 1er septembre 2005 au 31
décembre 2005. À soumettre en fichier attaché aux deux adresses
suivantes : LPE2@ext.jussieu.fr et beatrixmarillaud.cals@wanadoo.fr
- Réponse du comité scientifique : 1er février 2006.
- Remise des textes définitifs des communications (la page du résumé
accepté, suivie de 4 à 10 pages de développement) : 1er juin 2006.
Elles seront mises en ligne avant le colloque à l'intention des
participants. Les textes (résumés et communications) doivent parvenir
en pdf de préférence, dans la feuille de style accessible à
l'adresse :
http://www.revue-texto.net/Redaction/Normes/Consignes.html
Autres informations :
rubrique Agenda, site Texto ! : http://www.revue-texto.net
Et : http://www.univ-tlse2.fr/gril/
* Organisation
Comité d'initiative : François Rastier, Michel Ballabriga, Pierre
Marillaud.
Comité scientifique : Etienne Brunet (Université de Nice), Michel
Ballabriga (Université de Toulouse le Mirail), Kjersti Floettum
(Université de Bergen), Andrea Iacovella (CNRS, Cens et TGE Adonis),
Ioannis Kanellos (ENST, Brest), Pierre Marillaud (Cals), Bénédicte
Pincemin (LLI-CNRS, Villetanneuse), François Rastier (CNRS, Paris),
André Salem (Université Paris III), Monique Slodzian (INALCO), Mathieu
Valette (Atilf-CNRS, Nancy), Geoffrey Williams (Université de Bretagne
Sud - Lorient).
Comité d'organisation : Carine Duteil (Atilf-Cnrs), Baptiste Foulquié
(Université de Toulouse le Mirail), Robert Gauthier (Université de
Toulouse le Mirail), Béatrix Marillaud (Cals), Céline Poudat (Université
d'Orléans).
* Conditions d'accueil
Informations et préinscriptions :
CALS : beatrixmarillaud.cals@wanadoo.fr
Droits d'inscription : 50 euros ; étudiants : 30 euros.
Lieu du colloque : Centre Saint Amarand, 16, rue de la République,
81000, Albi.
Logement sur place (nombre de places limité) : Chambre simple (avec
lavabo) : 20 euros, double : 29 euros (petits déjeuners compris). Repas
sur place : 11 euros (boissons comprises).
Autres hébergements : Office de Tourisme : accueil@albitourisme.com
- www.albi-tourisme.fr
Dates : du lundi 10 au vendredi 14 juillet (cinq jours complets).
Avec le soutien de l'UPS TGE Adonis, du CPST (Université de Toulouse le
Mirail) et de l'Institut Ferdinand de Saussure (France).
666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 15/10/2005}
LANGUAGE CULTURE AND MIND CONFERENCE (LCM 2)
Integrating perspectives and methodologies
in the study of language
Paris, 17-20 July 2006
The second 'Language Culture and Mind' Conference (LCM 2) will be held
in Paris in July 2006, following the successful first LCM conference in
Portsmouth in 2004. The goals of LCM conferences are to contribute to
situating the study of language in a contemporary interdisciplinary
dialogue, and to promote a better integration of cognitive and cultural
perspectives in empirical and theoretical studies of language.
Human natural languages are biologically based, cognitively motivated,
affectively rich, socially shared, grammatically organized symbolic
systems. They provide the principal semiotic means for the complexity
and diversity of human cultural life. As has long been recognized, no
single discipline or methodology is sufficient to capture all the
dimensions of this complex and multifaceted phenomenon, which lies at
the heart of what it is to be human.
In the recent past, perception and cognition have been the basis of
general unifying models of language and language activity. However, a
genuine integrative perspective should also involve such essential
modalities of human action as : empathy, mimesis, intersubjectivity,
normativity, agentivity and narrativity. Significant theoretical,
methodological and empirical advancements in the relevant disciplines
now provide a realistic basis for such a broadened perspective.
This conference will articulate and discuss approaches to human natural
language and to diverse genres of language activity which aim to
integrate its cultural, social, cognitive and bodily foundations. We
call for contributions from scholars and scientists in anthropology,
biology, linguistics, philosophy, psychology, semiotics, semantics,
discourse analysis, cognitive and neuroscience, who wish both to impart
their insights and findings, and learn from other disciplines.
Preference will be given to submissions which emphasize
interdisciplinarity, the interaction between culture, mind and language,
and/or multi-methodological approaches in language sciences.
Topics include but are not limited to the relation between language
and :
- biological and cultural co-evolution
- comparative study of communication systems, whether animal or
artificial
- cognitive and cultural schematization
- emergence in ontogeny and phylogeny
- multi-modal communication
- normativity
- thought, emotion and consciousness
- perception and categorization
- empathy and intersubjectivity
- imitation and mimesis
- symbolic activity
- discourse genres in language evolution and ontogeny
- sign, text and literacy
* Organizing committee
Caroline David (Université de Montpellier)
Jean-Louis Dessalles (École Nationale Supérieure des Télécommunications,
Paris)
Jean Lassègue (CNRS, Paris)
Victor Rosenthal (Inserm-EHESS, Paris)
Chris Sinha (University of Portsmouth)
Yves-Marie Visetti (CNRS, Paris)
Joerg Zinken (University of Portsmouth)
Jordan Zlatev (Lund University)
* Submissions
Submissions are solicited for oral presentations and poster sessions.
Oral presentations should last 20 minutes (plus 10 minutes discussion).
All submissions should follow the abstract guidelines below.
Submissions should be in English. Abstracts should not exceed 1200 words
(about two A4 pages), single-spaced, font size 12 pt or larger, with
2.5 cm margins on all sides. Any diagrams and references must fit on
this two page submission. Head material (at the top of the first page) :
- Title of the paper,
- Author name(s),
- Author affiliation(s) in brief (1 line),
- Email address of principal author
- Type of submission (oral presentation, poster)
Abstracts should be emailed to submission@lcm2006.net as an ATTACHMENT
(i.e. not included in the message) preferably as a MS Word document, but
in PDF or postscript format if it is necessary to include a diagram or
figure.
Please do not send abstracts before December 1st 2005. Abstracts should
be submitted by January 8, 2006. Notification of acceptance by March 30,
2006.
All abstracts will be reviewed by members of the International
Scientific Committee.
Further information about LCM 2 will be presented at
http://www.lcm2006.net
666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}
Association Conscila
Confrontations en sciences du langage
Sémantique des textes théoriques
Le vendredi 2 décembre 2005
Institut d'Anglais de l'Université Paris VII - Salle A31,
10, rue Charles V - 75004 PARIS
M° Sully-Morland (ligne 7), Saint-Paul (ligne 1) ou Bastille (lignes 1,
8,10)
Journée d'études organisée par François Rastier
PROGRAMME
9h30 F. Rastier
Introduction : Sémantique des textes théoriques
9h45 - 10h30 Driss Ablali (Université de Besançon)
Sémantique du discours critique. -Autour de la forme "Texte".
Pause
10h45 - 11h30 Sylvain Loiseau (Université Paris X)
Thématique et impression référentielle dans le discours philosophique
-description sur corpus
11h30 - 12h15 Dominic Forest (UQAM, Montréal)
Identification automatique de thèmes et analyse thématique de documents
textuels assistée par ordinateur : enjeux et techniques
Pause
14h - 14h45 Smaïl Djaoud (Université Paris X)
"La sociologie de l'Algérie" (Bourdieu) et les avatars de
l'épistémologie coloniale
14h45 - 15h30 Mathieu Valette (Atilf-Cnrs, Nancy)
Eléments d'une sémantique textuelle des concepts
Pause
15h45 - 16h30 Céline Poudat (Université d'Orléans)
Les concepts en linguistique et leur représentation
16h30 - 17h15 François Rastier (CNRS-Inalco)
Pour une typologie des discours théoriques.
____________________
Driss Ablali (Université de Besançon)
Sémantique du discours critique.
Autour de la forme "Texte".
Le discours universitaire à travers le genre de la critique littéraire
est un objet sous-représenté dans les études qui traitent des textes
avec les méthodes de la sémantique interprétative et des outils de la
lexicométrie. La mise en oeuvre des moyens d'investigation et de
représentation du corpus montre que les résultats et les procédures
statistiques peuvent constituer, dans un cadre sémantique et
interprétatif, une aide à l'interprétation en permettant de renouveler
les hypothèses comme de guider l'interprétation.
La question de la construction des concepts de critique littéraire reste
à faire, non pas dans une optique historique et taxinomique, centrée sur
leur l'évolution, mais dans une optique proprement textuelle, car les
textes scientifiques ont leur propre textualité qui n'a rien à envier
aux discours littéraire ou politique, par exemple. Et un tel travail a
un double intérêt : d'une part il permet de voir comment s'est constitué
le métalangage propre de la critique littéraire, comment a-t-elle forgé
les concepts nécessaires à son approche des textes, comment ses concepts
se sont détachés de l'univers des significations communes. D'autre part,
c'est la question du progrès de la discipline elle-même qui est visé
ici, de l'évolution des concepts dans le temps dont il est question dans
une approche épistémologique de la théorie. Sur quoi se base-t-on pour
critiquer les textes ? C'est sans doute ce qui pourrait expliquer non
seulement la construction de la textualité du discours mais aussi son
incidence sur la théorisation de la vulgate critique, sur les
changements de caps et les révisions inévitables qui ont marqué
l'itinéraire.
A partir d'un corpus électronique, constitué de revues universitaires,
nous voudrions au moyen des outils lexicométriques relever les formes
saillantes de notre corpus afin de voir comment elles concourent ou pas
à la lexicalisation, car comme le dit F. Rastier, "une forme n'est pas
une unité discrète, stable, identique à elle-même : les formes (que l'on
opposait faussement à des substances) ne sont que des figures, qui
contrastent sur des fonds". L'étude des concepts de notre corpus
comporte l'observation des formes et l'analyse des rapports que ces
formes tissent entre elles. L'accent sera mis sur la forme qui domine
toutes les autres, texte. On en dénombre plus de 6000 occurrences. A
quoi tient cette haute fréquence du texte dans le corpus ? De quoi
parle-t-on en critique lorsqu'on évoque la question du texte ? Y a-t-il
un travail de conceptualisation derrière l'utilisation de cette forme ?
Quel est l'écart entre les revendications de la critique qui se veut
textuelle et le reflet qu'en donnent les bases de données ? Le trousseau
habituel des formes comme interpréter, analyser, critiquer, sens,
signification, textualité, fiction, roman, style, littérature, oeuvre,
genre, ouvre t-il une porte qui explique cette abondance ? Y t-il un
"fond sémantique" derrière cette forme ?
La présente communication a pour but de répondre à ce type de questions
par une étude sémantique des formes. Ainsi, il s'agit de montrer que les
formes dans les discours scientifique, ici le discours universitaire,
peuvent être appréhendées comme les thèmes dans le discours littéraire :
texte a une textualité comme l'a le thème du mouvement chez Bonnefoy ou
la répétition chez Robbe-Grillet. Et comme les formes ne prennent leur
sens que dans un environnement contextuel en s'opérant de façon située
dans un contexte donné, on s'attachera à voir la distribution de cette
forme en tenant compte de son entourage lexical et morphosyntaxique pour
souligner combien est arbitraire la frontière du mot et combien
indispensable une typologie des contextes dans le cadre de la sémantique
des concepts.
Le corpus :
Notre corpus électronique avoisine les 4 198 432 mots. Il comprend des
articles de revues françaises et francophones, toutes universitaires.
Tous les textes de notre corpus sont assez homogènes au niveau de la
taille, à part RITM qui domine tous les autres. Mais ces différences de
taille n'ont aucune influence sur le traitement de notre corpus, dans la
mesure où l'accent sera moins mis sur la distance lexicale que sur la
construction des concepts scientifiques dans le discours critique.
____________________
Sylvain Loiseau (Université Paris X)
Thématique et impression référentielle dans le
discours philosophique -description sur corpus
La description thématique du discours philosophique met à jour des
propriétés originales, qui échappent en partie aux catégories
descriptives élaborées pour les discours ayant particulièrement fait
l'objet de descriptions comme les genres littéraires, les discours
politiques ou scientifiques. Il semble au premier abord manifester des
propriétés contradictoires, où coexistent une activité terminologique et
des procédés décrits dans le discours littéraire, comme des thèmes
poly-isotopique.
La description thématique consistera donc ici à explorer la diversité de
ces propriétés thématiques : la structure sémique des thèmes, leur
lexicalisation par des figements ou des lexies complexes, les
expressions néologiques, enfin les degrés de stabilité thématique des
formes. On essayera également de décrire l'importance de la composante
axiologique de ces thèmes. L'hypothèse qui nous guidera est que cette
rigidité terminologique permet de définir un mode particulier
d'impression référentielle propre au discours philosophique.
Le corpus est constitué des six essais de Deleuze compris entre 1968 et
1993, ainsi que de deux essais de Derrida (L'écriture et la différence,
1979) et Lyotard (Le différend, 1983). Ce corpus est richement annoté :
propriétés typographiques, lemmatisation, annotation morphosyntaxique,
étiquetage des variations d'emplois et d'acceptions. Il est
échantillonné pour être représentatif d'une configuration historique et
académique particulière : celle de l'après guerre d'Algérie et des
bouleversements culturels des années 60 et 70. Il offre plusieurs axes
de variations -stylistique, diachronique, et générique. Nous essayerons
d'explorer la contribution à la construction thématique de l'ensemble
des dimensions de l'annotation : lexique, morphosyntaxe, ponctuation,
mais aussi position et distribution.
Références bibliographiques
Angenot M. (1982) La parole pamphlétaire -typologie des discours
modernes, Payot, Paris
Loiseau S. (à paraître) "L'emprunt du discours philosophique au discours
politique dans Capitalisme et schizophrénie de Gilles Deleuze et
Félix Guattari", Mots, ENS Editions, Lyon.
Rastier F. (2001), Arts et sciences du texte, PUF, Paris
Rastier F. (2001), "L'Être naquit dans le langage. Un aspect de la
mimésis philosophique ", Méthodos, Presse universitaire du
Septentrion, Lille.
____________________
Dominic Forest (UQAM, Montréal)
Identification automatique de thèmes et analyse thématique
de documents textuels assistée par ordinateur :
enjeux et techniques
Mots-clés : Analyse thématique assistée par ordinateur, identification
automatique de thèmes, catégorisation, classification, taxinomie
Depuis les dix dernières années, on observe une hausse considérable du
nombre d'initiatives visant à numériser et à diffuser, en divers formats
numériques, le patrimoine informationnel des organisations et des
différentes disciplines académiques. Les conséquences découlant de ces
initiatives sont nombreuses et très importantes : développement de
normes d'encodage (XML, TEI, Dublin Core), de moyens de diffusion de
l'information (portails, content management systems), de reposoirs de
données textuelles, etc. Ces impacts sont, de plus, observables à
plusieurs niveaux. À cet égard, on note, de manière générale, une
transformation radicale dans la pratique des individus devant manipuler,
d'une manière ou d'une autre, l'information textuelle.
Par ailleurs, l'accroissement de la quantité d'informations disponibles
en format numérique a fortement motivé plusieurs recherches dans les
domaines de l'analyse de contenu, du Traitement Automatique du Langage
(TAL) et de la Lecture et de l'Analyse de textes assistées par
ordinateur (LATAO). Ainsi, ces domaines ont généré de nombreuses
applications visant à informatiser le traitement des données textuelles.
Parmi ces applications figurent les outils d'assistance au développement
et à la mise à jour de taxinomies et de thésaurus à partir de données
textuelles (Jackson et Moulinier, 2002), les techniques d'assistance à
la création d'ontologies fondée sur l'analyse des documents propres à un
domaine (Staab et Studer, 2004), les méthodes d'indexation (Moens, 2000)
et de résumé automatiques (Mani et Maybury, 1999), etc. En outre, les
méthodes informatiques employées pour assister la réalisation de ces
tâches sont, elles aussi, très nombreuses. Ainsi, certaines applications
sont fondées sur des algorithmes d'apprentissage automatique de nature
symbolique (Sebastiani, 2002; Manning et Schütze, 1999), alors que
d'autres reposent plutôt sur différentes méthodes connexionnistes
(Kohonen, 2001; Ruiz et Srinivasan, 1998) ou requièrent un codage
linguistique des données (Jacquemin, 2001).
Malgré la diversité des différentes applications d'analyse automatique
des données textuelles, on constate qu'un axe de recherche partagé par
l'ensemble des disciplines sensibles à l'analyse de textes par
ordinateur vise à automatiser l'identification du contenu thématique des
données textuelles (Louwerse et van Peer, 2002). Cet axe de recherche se
situe au carrefour de plusieurs disciplines. En effet, il fait appel à
des concepts et des techniques provenant tant de la littérature, des
sciences du langage et des sciences cognitives que de l'informatique et
des sciences de l'information.
Notre présentation portera précisément sur les problèmes reliés à
l'identification des thèmes et à l'analyse thématique assistée par
ordinateur. Elle consistera, dans un premier temps, à identifier les
principaux enjeux soulevés par ces problématiques. Nous verrons, à cet
égard, que l'identification automatique des thèmes et l'analyse
thématique de corpus textuels sont des opérations techniques et
complexes impliquant, entre autres, plusieurs enjeux, relevant tant des
propriétés du discours que de phénomènes linguistiques et
terminologiques. Par ailleurs, on constate que toute entreprise visant à
assister l'analyse thématique des données textuelles doit, en dernière
instance, être fondée sur une conception relativement précise des
concepts de "thème" et d' "analyse thématique". À ce chapitre, notre
objectif ne sera pas de présenter les principales conceptions classiques
de ces concepts, pas plus qu'il ne s'agira d'en proposer de nouvelles.
Nous verrons plutôt comment les principaux travaux dans ces domaines
reposent sur des conceptions bien spécifiques de ces concepts,
lesquelles sont à la base même de l'opérationnalisation des processus
d'identification des thèmes et d'analyse thématique.
La seconde partie de notre exposé sera consacrée à la présentation et à
la comparaison de deux approches permettant d'informatiser les processus
d'identification des thèmes et l'analyse thématique. Plusieurs projets
ont tenté d'automatiser, avec plus ou moins de succès, ces processus
(Kastberg Sjöblom et Brunet, 2000; Rossignol et Sébillot, 2002; Roy et
Beust, 2004). Nous croyons, cependant, qu'une méthode des plus fécondes
pour l'assistance à l'analyse thématique des données textuelles repose
sur l'utilisation du modèle vectoriel et des processus de classification
et de catégorisation automatiques (dans leur application au traitement
automatique des documents). Dans cette perspective, l'analyse thématique
des données textuelles peut être assistée en employant une architecture
informatique composée de sept étapes
La première étape est l'identification des unités d'information
pertinentes. Cette étape vise à extraire du corpus les unités
d'information, c'est-à-dire les unités linguistiques servant d'ancrage à
l'analyse. Traditionnellement, ces unités sont des mots, mais elles
peuvent tout aussi bien être composées de chaînes de caractères
(n-grammes) (Cavnar et Trenkle, 1994). À cette étape sont aussi extraits
les domaines d'information (paragraphes, chapitres, etc.) qui seront
analysés ultérieurement dans la chaîne de traitement. Certaines
opérations linguistiques (suppression des mots fonctionnels,
lemmatisation, étiquetage morphologique et sémantique) ou statistiques
sont aussi appliquées au lexique extrait.
La seconde étape réside dans la vectorisation des données textuelles.
Suite au découpage du corpus en unités d'information et en domaines
d'information, le texte est traduit en une matrice de vecteurs (modèle
vectoriel) (Salton, 1989; Manning et Schütze, 1999) qui représente alors
chaque domaine d'information par la présence ou l'absence (binaire ou
floue) des unités d'information.
Dans la troisième étape, les domaines d'information sont classés. Afin
de réaliser cette tâche, des classifieurs numériques sont appliqués sur
la matrice. Par classifieurs numériques, nous entendons les stratégies
mathématiques qui permettent la production de classes d'équivalence sur
des segments. Plusieurs techniques numériques ont déjà été explorées sur
le texte. Malgré certaines limites, ces approches ont présenté des
résultats très positifs et se comparent avantageusement aux approches
exclusivement linguistiques (Salton, 1989). Elles permettent, de plus,
une immense économie de temps dans le parcours exploratoire d'un corpus.
Technologiquement, ces approches sont incontournables lorsqu'elles sont
confrontées à de vastes corpus textuels.
Les classifieurs produisent des regroupements (classes) de segments en
raison de propriétés similaires. De ces classes, on extrait alors le
lexique. Par des opérations ensemblistes simples (intersection, union,
etc.), sont différenciés, dans la quatrième étape, divers types de
sous-classes spécifiques.
La cinquième étape réside dans la catégorisation thématique des données.
L'hypothèse est que certaines techniques de catégorisation automatiques
peuvent être utilisées afin d'identifier l'organisation thématique des
documents. Sur les sous-classes lexicales différenciées (étape 4)
peuvent être appliquées diverses techniques de catégorisation.
Traditionnellement (Sebastiani, 1999, 2003; Jackson et Moulinier, 2002),
la catégorisation consiste à attribuer une catégorie aux domaines
d'information à partir d'un ensemble prédéfini de catégories. Cette
catégorisation associe une étiquette catégorielle à chaque sous-classe
lexicale différenciée. Ce prédicat peut soit résumer le contenu
signifiant (catégorie descriptive), soit en définir la fonction
(catégories fonctionnelles). Cette technique de catégorisation requiert
de prendre le vecteur représentant chaque classe et de le comparer à un
gabarit (l'ensemble des catégories prédéfinies). Ceci peut se faire de
trois manières. Une première méthode est manuelle : c'est l'analyste
qui, en fonction de son répertoire propre, attribue la catégorie à
assigner. La catégorisation manuelle est un technique classique dans le
domaine de l'analyse de contenu. Une seconde est automatique : les
vecteurs des sous-groupes sont comparés (par un calcul de similarité) à
une définition (en extension) d'une liste catégorielle ou d'un plan de
classification, c'est-à-dire un ensemble de catégories prédéfinies. Une
troisième approche procède par apprentissage : l'analyste assigne des
catégories sur des échantillons de textes et le système les redistribue
sur les items lexicaux ayant des contextes similaires. Dans cette
présentation, nous présenterons les avantages et les inconvénients de la
catégorisation manuelle et de la catégorisation par apprentissage. Nous
présenterons aussi une technique de catégorisation thématique fondée sur
l'extraction automatique des catégories à partir des documents traités,
car, comme l'ont souligné entre autres Louwerse et van Peer (2002, p.4),
les index thématiques (catégories thématiques prédéfinies) posent
plusieurs problèmes : "The index was conceived to be a practical
reference, but trying to classify tales in the [...] index proved
problematic." Afin de dépasser les limites de la catégorisation manuelle
et automatique effectuée à partir d'ensembles de catégories thématiques
prédéfinies, nous exploitons certains outils statistiques permettant de
faire émerger les catégories thématiques à partir des documents
analysés. Cette méthode consiste à appliquer certains critères
statistiques utilisés dans les domaines du repérage de l'information
(pondération distribuée, tf·idf, taux d'information, entropie, etc.)
(Salton, 1989) à chacune des sous-classes lexicales différenciées afin
d'identifier au sein de chacune de ces sous-classes les termes les plus
significatifs pouvant (suite à une évaluation de l'utilisateur) servir
d'étiquette thématique pour la découverte des principaux thèmes d'un
corpus.
La sixième étape réside dans la projection des catégories thématiques
sur le texte. Une fois la catégorisation thématique effectuée, chaque
domaine d'information peut se voir étiquetée automatiquement avec les
étiquettes thématiques. Le texte est alors soumis à des analyses
classiques soit qualitatives (regroupements, listes, arbres, graphes,
etc.) soit quantitatives (statistiques, etc.), mais, cette fois, ce sont
les catégories thématiques qui en sont l'objet.
La septième étape réside dans la découverte, la navigation et la
visualisation des thèmes identifiés. Pour assister l'analyse et
l'interprétation des résultats, il est de plus en plus utile d'offrir
aux analystes des moyens de visualiser de manière ergonomique ces
classes et les relations entre les thèmes. Ce sont, comme le dit Barry
(1998), des "mind mapping tools" ou des cartographies cognitives du
contenu thématique des textes. Diverses technologies commencent à
apparaître pour assister ce type d'analyse (Spence, 2000; Fayyad,
Grinstein et Wierse, 2001). Cette dimension ergonomique de
représentation est un atout précieux dans le soutien de l'activité
interprétative du chercheur. À cet égard, nous verrons comment des
méthodes de représentation simples basées sur la norme d'encodage XML
permettent de représenter graphiquement les résultats obtenus à des fins
de navigation thématique.
Comme nous l'avons mentionné, nous présenterons donc deux méthodes
informatiques inspirées de l'architecture présentées précédemment. La