2005_10_18 ________________________________________________________________________ SdT volume 11, numero 5. LES CITATIONS DU MOIS ________________________________________________ La narration est possible là où l'éternité attire et surélève le temps, non là où elle l'abolit. Ricoeur, Temps et Récit, I, p. 61. A Balbec, un jour où la princesse de Luxembourg m'avait dit qu'elle n'avait pas emporté de livre, j' allais lui prêter pêcheur d'Islande et Tartarin de Tarascon, quand je compris ce qu'elle avait voulu dire : non qu'elle passerait le temps moins agréablement, mais que je pourrais plus difficilement mettre mon nom chez elle. M. Proust, La prisonnière, t.1., Paris:Gallimard, 249. ________________________________________________ SOMMAIRE 1- Coordonnees - Bienvenue a Emmanuelle TRICOIRE, Sheila VIEIRA DE CAMARGO GRILLO, Thanh Tuyen NGUYEN THI, Romeo GALASSI, Charlotte DILKS, Magda DARGENTAS, Catherine GOUTTAS. - Changements d'adresse : Marie-Christine LALA, Andrea ROCCI, Driss EL KHATTAB. 2- Carnet - Au commencement, il y avait le service de presse... - Programme du Seminaire de Francois Rastier, 2005-2006. 3- Textes electroniques - Textometrie avec Lexico - Site et revue EspacesTemps - Internet litteraire en langues romanes : actes de colloque 4- Publications - Cahiers de praxematique 43 (2004) : Aspect du dialogisme - Texto! : nouveautes de la derniere edition (septembre 2005) 5- Dialogues - Diction du poeme contemporain : dialogue entre Michel Favriaud et Francois Rastier. 6- Appels : Colloques et revues - L'analyse secondaire en recherche qualitative. Utopie ou perspectives nouvelles ?, Grenoble, 3-4 novembre 2005. - Langage et violence, Paris, 30 novembre 2005. - Traces, Enigmes, Problemes : Emergence et construction du sens Rochebrune, Megeve, 22-27 janvier 2006. - Historiography of Linguistics in the 21th Century : Challenges and Perspectives (SGdS2006), Leiden, 28-30 June 2006. - Colloque de l'Association for Linguistic and Literary Computing, Paris, 5-8 juillet 2006. - Corpus en Lettres et Sciences sociales -Des documents numeriques a l'interpretation, Albi, 10-14 juillet 2006. - Integrating perspectives and methodologies in the study of language (LCM 2), Paris, 17-20 July 2006. - Semantique des textes theoriques, Paris, 2 decembre 2005 (programme avec les resumes des communications). 111111111111111111111111111111111111111111111111111111111111111111111111 Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees 111111111111111111111111111111111111111111111111111111111111111111111111 BIENVENUE AUX NOUVEAUX ABONNÉS [information réservée aux abonnés] 222222222222222222222222222222222222222222222222222222222222222222222222 Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet 222222222222222222222222222222222222222222222222222222222222222222222222 {FR, 10/10/2005} RENTRÉE LITTÉRAIRE "Au commencement, il y avait le service de presse, et quelqu'un le reçut, envoyé par l'éditeur. Alors il rédigea un compte rendu. Puis il écrivit un livre, que l'éditeur accepta et qu'il transmit comme service de presse. Celui qui le reçut fit de même. Et c'est ainsi que se constitua la littérature contemporaine." Karl Kraus, Troisième nuit de Walpurgis. Agone, 2005. 222222222222222222222222222222222222222222222222222222222222222222222222 {FR, 10/10/2005} SEMINAIRE Séminaire Sémantique des textes, année 2005-2006 François RASTIER, Directeur de recherche Sémiotique des cultures (II.) Les thèmes suivants seront abordés : - Le sens : référence ou références ? Ontologie et déontologie. - Pour une sémantique des textes scientifiques. - Sémiotique des discours identitaires. - Plurilinguisme et traduction. - Les spécificités de l'objet culturel. - Objectivation et interprétation dans les sciences de la culture. Les programmes de naturalisation et leurs enjeux. Institut national des langues et civilisations orientales, Centre de Recherches en Ingéniérie Multilingue, 2 rue de Lille, 75007 Paris - Salons de l'Inalco, escalier C, deuxième étage, salle 223. Métro : Saint-Germain, Musée d'Orsay ou Palais-Royal. Les jeudis 5, 12, 19 et 26 janvier ; 2 et 23 février ; 2 mars. Horaire : de 17h30 à 19h15. Contact: Lpe2@ext.jussieu.fr Site du séminaire virtuel : http://www.revue-texto.net Parmi les lectures possibles : Cassirer, E., Logique des sciences de la culture, Paris, Cerf, 1991. Descola, P. Par-delà Nature et Culture, Paris, Gallimard, 2005. Rastier, F. et Bouquet, S. (dir.) Une introduction aux sciences de la culture, Paris, Puf, 2002. Rickert, H., Sciences de la culture et sciences de la nature, Paris, Gallimard, 1997. 333333333333333333333333333333333333333333333333333333333333333333333333 Textes electroniques Textes electroniques Textes electroniques Textes 333333333333333333333333333333333333333333333333333333333333333333333333 {FR 10/10/2005, Valette 06/09/2005} NOTES DE DEGUSTATION * Un site consacré aux explorations textométriques avec Lexico3 qui devrait devenir un recueil d'expériences couvrant des domaines très différents. Il s'agit de compte rendus d'expériences, en cours ou achevées, signées par leurs auteurs, lesquels auront ensuite le loisir de les remettre à jour si besoin. Les premières contributions sont disponibles ici : http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/ navigations-tdm.html * EspacesTemps Un site et une revue des sciences sociales. La revue : http://EspacesTemps.net L'adresse : Redaction@EspacesTemps.net 333333333333333333333333333333333333333333333333333333333333333333333333 {FR, 10/10/2005} INTERNET LITTERAIRE Les actes d'un colloque de 2003, consacré à l'Internet littéraire dans les langues romanes (en grande partie le domaine francophone), sont publiés dans la revue en ligne Philologie im Netz (www.phin.de). On trouvera les articles dans le second supplément / Beiheft, à partir de la barre de menu horizontale supérieure : Jörg Dünne / Dietrich Scholler / Thomas Stöber (Hg.) (2004) : Internet und digitale Medien in der Romanistik : Theorie - Ästhetik - Praxis 444444444444444444444444444444444444444444444444444444444444444444444444 Publications Publications Publications Publications Publications 444444444444444444444444444444444444444444444444444444444444444444444444 {Bonnet, 08/07/2005} VIENT DE PARAÎTRE Le N° 43 des Cahiers de Praxématique vient de paraître : Cahiers de praxématique 43 -- 2004 "Aspect du dialogisme" Numéro coordonné par Aleksandra Nowakowska. 444444444444444444444444444444444444444444444444444444444444444444444444 {FR, 10/10/2005} TEXTO ! http://www.revue-texto.net Les nouveautés de la dernière édition (septembre 2005) Dans la rubrique DITS ET INÉDITS : Alinei, Mario The Paleolithic Continuity Theory on Indo-european Origins : An Introduction (2004). [Coédition : article extrait du PCT] The author discusses the theories on the origins of Indo-Europeans and proposes a new synthesis : the Paleolithic Continuity Theory. Brandist, Craig Mikhail Bakhtine and the early Soviet Sociolinguistics (2003) Dumesnil, Pierre Pour une économie sémiotique (2005) L'article suggère qu'une réévaluation des disciplines éducatives et culturelles sans finalité professionnelle, couplées avec "l'usinage du signe" via l'ordinateur en réseau, pourrait contribuer à l'émergence d'une économie soutenable car très massivement sémiotique. Labbe, Hélène & Marcoccia, Michel Communication numérique et continuité des genres : l'exemple du courrier électronique (2005) L'article traite de la question des genres numériques et montre, à partir d'une étude de cas, l'influence des genres pré-numériques et la continuité de ces genres. L'étude de cas porte sur l'analyse comparative du billet et du courrier électronique. Rastier, François Mésosémantique et syntaxe (2005) Ce texte présente la mésosémantique, qui opère aux paliers du syntagme (syntagmes pourvus d'une fonction syntaxique) et de la période. De la sémantique cognitive à la sémantique diachronique : les valeurs et évolutions des classes lexicales (2000) Cette étude des inégalités qualitatives en diachronie montre comment l'évolution sociale des normes de valorisation remanie la structure des classes lexicales élémentaires (taxèmes) ; elle prend pour exemple l'histoire des dénominations du visage en français depuis le XVe siècle. Rousseaux, Francis & Thomas Bouaziz L'invention des connaissances par les informaticiens (2005) L'analyse de systèmes d'aide à l'interprétation de documents numériques met en évidence une déconstruction de la notion de "connaissances" telle qu'elle a été proposée aux informaticiens par Allen Newell en 1982 ; parallèlement, on assiste à l'émergence prometteuse de la notion de "collection". Sériot, Patrick Oxymore ou malentendu ? Le relativisme universaliste de la métalangue sémantique naturelle universelle d'Anna Wierzbicka (2004) Analyse des fondements épistémologiques des primitives sémantiques universelles d'Anna Wierzbicka dans le cadre d'une perspective plus générale de mise en évidence des présupposés scientifiques et idéologiques du discours sur la langue en Europe orientale. Dans la rubrique DIALOGUES ET DÉBATS : - Les sciences cognitives (2005) Entretien entre François Rastier et Philippe Lacour sur les sciences cognitives et le programme de naturalisation. François Rastier discute le programme cognitiviste denaturalisation des sciences sociales et sa version néo-darwinienne, qui privilégie les sciences de la vie et la métaphore du gène. En rupture avec ce programme, Rastier explique les raisons qui l'ont conduit à développer les bases d'un programme fédérateur pour les sciences de la culture. Dans la rubrique FERDINAND DE SAUSSURE : Saussure, Ferdinand de Nouveaux item (1996) Transcription diplomatique établie par Rudolf Engler d'après les notes manuscrites déposées à la Bibliothèque de Genève. Choi, Yong-Ho & Hyun-Kwon Kim Saussurism in Korea [Coédition : article extrait de SemiotiX, 2004, Volume 1, Issue 1] Saussure as the very first western linguist who influenced Korean linguistics. Dans la rubrique LA LETTRE ET L'INTERPRÈTE : Wögerbauer, Werner L'engagement de Paul Celan (2000) On a parfois reproché à la poésie de Paul Celan son absence de message social. Mais ses interventions politiques se sont produites dans la matière même des poèmes, comme autant de prises de position formulées à partir d'un repli à la fois personnel et poétique. Utaker, Arild Babel et la diversité des langues (2004) Lorsque la traduction sert de levier critique contre certaines thèses communes aux théories philosophiques du langage. Dans la rubrique REPÈRES : Thèmes : Dossier "Rhétorique" : Carine Duteil-Mougel Introduction à la rhétorique (2005) Étude de l'évolution de la Rhétorique à travers les conceptions des principaux auteurs Anciens : Aristote, l'auteur de la Rhétorique à Hérennius, Cicéron et Quintilien. Dossier "Textes et discours" : Rossitza Kyheng Hjelmslev et le concept de texte en linguistique (2005) Le début des conceptualisations du terme « texte » en linguistique et les deux concepts de texte chez Hjelmslev. Dans la rubrique CORPUS : Vaillant, Pascal La classification automatique des textes (2005) La classification automatique de textes et l'attribution des catégories. Dans la rubrique PARUTIONS ET TRÉSORS : Hébert, Louis Une sémantique différentielle unifiée (1996) Louis Hébert réalise le compte rendu critique de Sémantique pour l'analyse. Il présente les différentes sections de cet ouvrage collectif en dégageant les principaux concepts de la Sémantique interprétative. Brague, Rémi Le Coran, sortir du cercle ? (2003) [Coédition : article extrait de Phronesis.org : Ancients & Moderns Philosophy] Compte rendu de : LUXENBERG, Christoph. Die syro-aramâische Lesart des Koran. Ein Beitrag zur Entschlûsselung der Koransprache. Berlin : Das Arabische Buch, 2000 ; PRÉMARE, Alfred-Louis de. Les Fondations de l'Islam. Entre écriture et histoire. Paris : Le Seuil, 2000. TRADUCTIONS : En español : Wögerbauer, Werner El compromiso de Celan (Traducción de Arnau Pons) 555555555555555555555555555555555555555555555555555555555555555555555555 Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue 555555555555555555555555555555555555555555555555555555555555555555555555 {FR, 10/10/2005} DICTION DU POEME CONTEMPORAIN Dialogue entre Michel Favriaud et François Rastier. MF> On a quelquefois brocardé la diction des poètes déclamant leur propre texte -celle d'Apollinaire par exemple, alors que l'enregistrement technique et l'historicité de cette diction doivent être pris en compte. On peut être surpris au contraire de l'intérêt de la diction de James Sacré, Gherasim Luca, André du Bouchet, sans compter celle des sonores comme Bernard Heidsieck ou (l'est-il, sonore ?) Jean-Luc Parant, ou à contre pied celle de Philippe Jaccottet, qui, quoique profonde et mesurée, s'inscrit néanmoins dans une tradition de "déclamation" classique ; toutes sont émouvantes, font quelque chose de plus que celles des comédiens, comme si elles nous transformaient. Partagez-vous cet avis et comment expliquez-vous ce phénomène ? FR> L'auteur n'est point par nature le meilleur de ses interprètes ; qu'il s'agisse de dire ou de donner sens, son interprétation n'est qu'une parmi d'autres. Elle ferme le texte sur ses intentions, alors qu'en tant qu'oeuvre, il les dépasse. Apollinaire garde une diction d'avant quatorze, alors que l'esthétique vocale était dominée par Rosine Bernard -dite Sarah Bernhardt sans doute pour plus d'emphase. Rien ne vieillit plus vite que les normes de diction. Celles (pathétiques !) du romantisme tardif sont par bonheur devenues insupportables. Mais Du Bouchet a vieilli plus vite que ses textes, mais nous ne nous en apercevions pas, car nous sommes ses contemporains. MF> Alors vient la question corollaire : pourquoi la diction des comédiens est-elle si décevante, même de ceux qui s'y appliquent. Pour ma part je ferai une distinction entre diction de comédien et diction de récitant. La question importe en réception : le lecteur est trompé sur la force d'authenticité de la poésie ; et aussi en formation : d'adulte et d'élève. Avez-vous cette même frustration d'auditeur et comment l'expliquez-vous ? FR> En effet, la diction des comédiens reste souvent décevante, sans doute parce qu'elle s'adresse au public d'un spectacle. Or, non seulement la poésie contemporaine a perdu ses genres auliques (elle se fait dans un lit, dit Breton), mais elle semble écrite pour le langage intérieur, voire en langage intérieur -d'où la ponctuation blanche, car les blancs rappellent les inhibitions propres à la conscience attentionnelle. De plus, la diction est un art de la présence, alors qu'une bonne part de la poésie contemporaine creuse le problème de l'absence, elle aussi figurée dans les blancs. À cela s'ajoute spécifiquement la censure du poétique en France cartésienne et jacobine. Les réussites demeurent plutôt dans l'ordre de la prose : par exemple, "La Princesse de Clèves" lue par Michèle Morgan, dont la diction déjà un peu désuète rend à merveille la distance estompée entre le temps des Valois où se déroule le roman et celui où Madame de La Fayette le rédige. Ce texte ne me semble pouvoir être lu à haute voix que par une femme de sa trempe. MF> Pour ma part, en tant qu'auditeur et formateur, je me pose aussi la question de l'espace de diction. Si dire de la poésie, c'est autre chose que de porter sur scène un personnage fictionnel, ou encore que de lire un texte philosophique, c'est peut-être parce qu'il y a un autre rapport entre le récitant et l'auditeur-spectateur (singulier ou collectif ?). Comment se construit cet espace ? Il y a du corps, des yeux-regards. Est-ce un lieu seulement sonore, un lieu-hors, imaginaire, ou est-ce un espace que l'on peut décrire ? Dire un texte à plusieurs permettrait-il de déployer la polyphonie du texte poétique et de construire cet espace ? FR> A la différence de l'espace théâtral ou chorégraphique, l'espace de diction n'est pas socialement défini. Les lectures qui se sont multipliées dans les festivals de théâtre ont plutôt rabattu la diction poétique sur la diction théâtrale. La lecture publique a presque disparu, sauf dans certains rituels d'ailleurs passablement désertés. Le rhapsode -a fortiori l'aède- et leur public sont devenus inimaginables. On improvise donc un éthos de lecteur, entre diseur et récitant. La lecture dépend de fait de la pratique sociale où elle s'insère. L'espace de formation, la classe ou l'amphi, lèvent à leur manière certaines indécisions : mais pour sortir de l'assommoir pédagogique, je pense qu'il faut susciter des joutes implicites entre les jeunes qui vont lire pour s'accomplir. On ne peut s'appuyer que sur le régime herméneutique du texte, dans la mesure où toute diction est une lecture dans tous les sens du terme. MF> La diction du poème traduit relève-t-elle de la même problématique ou s'y adjoint-il de nouveaux éléments, réellement nouveaux ou seulement révélés à cette occasion ? Il me semble qu'on tient compte autrement du public, qui connaît quelque chose ou rien de l'oeuvre ou de la culture étrangère présentées, et qu'on ne peut "défendre" le texte traduit avec la même assurance que l'oeuvre source. Il y aurait comme une modération, une réserve qui affecteraient le timbre... FR> Peut-être par lassitude hexagonale, je dois dire que les interprétations les plus convaincantes pour moi l'ont été dans des langues étrangères : Shakespeare, Dante, Attâr... Tout comme on ne traduit pas de langue à langue, mais de genre à genre (ou du moins d'un genre à un "genre prochain") on devrait sans doute, en disant la traduction d'un poème étranger partir d'un genre analogue pour innover. Aussi le changement de genre me semble catastrophique. Quand Gougaud traduit un poème mystique de Attâr comme une fable de La Fontaine, il impose par sa ponctuation comme par son lexique une diction primesautière qui transforme la leçon mystique en apologue plaisant, et cette erreur de genre fausse définitivement la diction et le sens tout ensemble. Vous avez mis en évidence que là où Garcin de Tassy traduisait : "Un autre papillon alla passer auprès de la lumière et s'en approcha. Il toucha de ses ailes la flamme, la bougie fut victorieuse et il fut vaincu. Il revint lui aussi, et il révéla quelque chose du mystère en question. Il expliqua en quoi consistait l'union avec la bougie ; mais le sage papillon lui dit [...] ", Gougaud ose traduire : "On envoya un autre expert. Celui-là franchit le rideau, effleura la flamme, poussa un cri de papillon, revint en hâte à ses compères et révéla, tout essoufflé, qu'il s'était quelque peu brûlé ". Les octosyllabes typiques de la fable et plus généralement de la poésie légère sont bien là (8858888), tout comme l'anthropomorphisme social (expert, président), les termes hérités du fabliau (compère) et l'entrain convenu (cri de papillon, en hâte, tout essoufflé). L'intensité de l'ardeur est travestie en médiocrité (quelque peu), l'humour de la sagesse transcendante en allégresse comique. Le choix que vous avez fait d'un alexandrin méditatif me semble pouvoir éviter, voire réparer, ces dommages bien de chez nous. Comme la traduction ne s'apprécie véritablement qu'en édition bilingue, il faudrait imaginer une diction bilingue pour rendre sensible l'altérité et l'émulation des univers expressifs. Une amie étrangère me demandait un jour où sont en France les écoles de traduction poétique. Cette question demeura sans réponse. On traduit en prose. Au mieux, on fait parler Héraclite dans l'idiome de Saint John Perse. L'universalité de la langue française, de sa prose, cache mal un mépris souverain : Gallimard, par exemple, a traduit tout Mishima de l'anglais, mais peu importe dès lors qu'il a la chance d'être mis en français. MF> Le timbre, n'est-ce pas la grande affaire, que ne régulent vraiment ni la ponctuation, ni la métrique, ni cette syntaxe plurielle caractéristique du poème ? Le cadre de réception non plus ne saurait à lui seul le constituer ! Alors, comment le définir, à quel point de l'interprétation ? FR> Le timbre me semble porter l'essentiel du fond émotionnel du texte, sur lequel se détachent les formes prosodiques -et, indirectement, les formes sémantiques. MF> Vous avez aussi une expérience d'écriture et de poète. Peut-on parler d'une diction intérieure, d'une diction intérieure qui accompagne, précède ou suit l'écriture. Quel serait le rapport entre cette voix du dedans plus ou moins aboutie et l'écriture ? FR> Je ne peux répondre en lieu et place d'un pseudonyme naturellement plus autorisé. Les programmes moteurs, les gestes énonciatifs qui les réalisent ont besoin de rythmes pour s'actualiser : le rythme permet tout à la fois l'anticipation et la rétrospection, pour sortir de l'instant aveugle et oublieux et construire le temps accompli de l'action. Je parle ici des rythmes expressifs comme des rythmes sémantiques. L'écriture littéraire expérimente et réfléchit de manière parfois inouïe ces conditions générales de l'action énonciative. MF> On pourrait conclure par un très bon souvenir -ou un très mauvais- de diction entendue, vécue. Vous pourriez en évoquer le contexte et l'effet durable en vous... FR> Dans ses rares moments de repos, le commandant Massoud lisait et écrivait des poèmes dans la grande tradition. Je pense souvent à ce bref poème qu'il a dit lui-même dans un film de Christophe de Ponfilly. Le rapport de la culture persane (Massoud était tadjik) à sa poésie est immensément confiant et respectueux -alors que dans la France contemporaine la poésie reste tout à la fois exaltée et méprisée, deux manières complémentaires de ne pas lui rendre justice. 666666666666666666666666666666666666666666666666666666666666666666666666 Appels Appels Appels Appels Appels Appels Appels Appels Appels Appels 666666666666666666666666666666666666666666666666666666666666666666666666 {Le Roux, 20/07/2005} JOURNEES D'ETUDE « L'analyse secondaire en recherche qualitative. Utopie ou perspectives nouvelles ? » Maison des Sciences de l'Homme - Alpes, Grenoble, 3-4 novembre 2005. Les équipes de recherche PACTE-CIDSP (Cnrs / Univ. Grenoble) et GRETS (Edf R&D) organisent deux journées d'étude internationales intitulées : « L'analyse secondaire en recherche qualitative. Utopie ou perspectives nouvelles ? ». Ces journées ont pour ambition de contribuer à la réflexion sur le statut de l'analyse secondaire des entretiens dans les sciences humaines et sociales d'un point de vue méthodologique et épistémologique. Il s'agira notamment de faire connaître et de discuter des expériences européennes de capitalisation et de ré-utilisation des entretiens de recherche. Le programme de ces journées traitera : - d'une réflexion générale sur les usages du qualitatif, à travers un état des lieux de ces pratiques en sciences humaines et sociales ; - des expériences de capitalisation et d'analyse secondaire ; - des conditions de leur réalisation en examinant les aspects déontologiques, juridiques ainsi que les logiciels d'analyse ; - de la synthèse de ces questions et des développements futurs de l'analyse secondaire des matériaux qualitatifs. 666666666666666666666666666666666666666666666666666666666666666666666666 {FR, 10/10/2005} COLLOQUE Centre de coopération franco-norvégienne en sciences sociales et humaines MAISON DES SCIENCES DE L'HOMME 54, Boulevard Raspail - 75270 Paris Cedex 06 Tél.: 01 49 54 22 16 Fax: 01 49 54 21 95 Web: http://www.uv.uio.no/paris LANGAGE ET VIOLENCE Colloque franco-norvégien le 30 novembre 2005 La Maison des Sciences de l'Homme, Salle 215 Matin Modérateur : Arild Utaker 10.00 - 11.00 François Rastier (CNRS) : Pathos et extermination 11.00 - 12.00 Philippe Mesnard (ISTI, Bruxelles) : Rationalité, témoignage et littérature 12.00 - 12.30 Discussion Après-midi Modérateur : François Rastier 14.30 - 15.30 Olivier Remaud (EHESS) : Le point de vue du langage ordinaire 15.30 - 16.30 Arild Utaker (Université de Bergen) : Langage et expérience ; quelle critique du langage ? 16.30 - 17.00 Discussion 666666666666666666666666666666666666666666666666666666666666666666666666 {Beust, 09/09/2005} COLLOQUE 13eme Journées de Rochebrune Rencontres interdisciplinaires sur les systèmes complexes naturels et artificiels Traces, Enigmes, Problèmes : Emergence et construction du sens Du 22/1/06 au 27/1/06, Rochebrune, Megève, France L'énigme, suppose que, partant de données a priori obscures, celui qui s'y trouve confronté peut la résoudre au terme d'une série d'opérations destinées à "donner, construire, faire émerger" un sens. [...] Ainsi, toutes les disciplines visant à faire émerger, ou à construire une interprétation à partir d'un ensemble de données incomplètes ou dégradées sont concernées par la problématique de l'énigme et de la trace. Informations : http://rochebrune.iutc3.unicaen.fr/Rochebrune2006 666666666666666666666666666666666666666666666666666666666666666666666666 {FR, 10/10/2005} CALL FOR PAPERS 18th International Colloquium of the Studienkreis Geschichte der Sprachwissenschaft (SGdS2006) Historiography of Linguistics in the 21th Century : Challenges and Perspectives 28-30 June 2006, Leiden University (Leiden, The Netherlands) The XVIIIth International Colloquium of the 'Studienkreis Geschichte der Sprachwissenschaft (SGdS)' will take place at the University of Leiden from 28 to 30 June 2006 and will be organized by Els Elffers (Amsterdam), Jan Noordegraaf (Amsterdam), Peter Schmitter (Seoul / Muenster), and Marijke van der Wal (Leiden). Papers on "Historiography of Linguistics in the 21th Century : Challenges and Perspectives", the main subject of our conference, are particulary welcome, but contributions focussing on other topics within the framework of the history of linguistics are also much appreciated. Presentations will last 30 minutes, followed by 15 minutes of discussion. The conference languages are English and German. The conference fee will be 30 Euro, payable during the conference. Participants who would like to give a paper are kindly asked to submit an abstract of 250-350 words by 15 January 2006, using the template below which can be copied and returned as a Word- or rtf-file to dr. Marijke van der Wal (m.j.van.der.wal@let.leidenuniv.nl) as well as to professor Peter Schmitter (schmipe@uni-muenster.de). For further informations, please contact the local organizer Marijke van der Wal Universiteit Leiden - Department of Dutch/LUCL P.N. van Eyckhof 1 - Postbus 9515 - NL-2300 RA Leiden - The Netherlands m.j.van.der.wal@let.leidenuniv.nl or Peter Schmitter Graduate School of Interpretation and Translation Hankuk University of Foreign Studies 270 Imun-2-dong, Dongdaemun-gu - Seoul, 130-791 Korea (South) schmipe@uni-muenster.de 666666666666666666666666666666666666666666666666666666666666666666666666 {FR, 10/10/2005} COLLOQUE ALLC-ACH Du 5 au 8 juillet 2006 à Paris-IV, le grand colloque annuel de l'Association for Linguistic and Literary Computing http://www.allc-ach2006.colloques.paris-sorbonne.fr/ 666666666666666666666666666666666666666666666666666666666666666666666666 {FR, 10/10/2005} COLLOQUE - ECOLE D'ETE Colloque international et école d'été Albi, 10-14 juillet 2006 Organisé dans le cadre des Colloques d'Albi Langages et signification (CALS) Corpus en Lettres et Sciences sociales -Des documents numériques à l'interprétation Deuxième circulaire La constitution et l'analyse de corpus est en train de modifier les pratiques voire les théories en lettres et sciences sociales. Comme ces disciplines ont maintenant de plus en plus affaire à des documents numériques, cela engage pour elles un nouveau rapport à l'empirique. En outre, la numérisation des textes scientifiques eux-mêmes permet un retour réflexif sur leur élaboration et leurs parcours d'interprétation. Les nouveaux modes d'accès aux documents engagent-ils de nouvelles formes d'élaboration des connaissances ? Les nouvelles initiatives prises au plan national (création du Centre d'édition numérique scientifique du CNRS) et international (TGE Adonis - Accès unique aux données et documents numériques des Lettres et sciences humaines) peuvent devenir l'occasion et donner les moyens d'un projet fédérateur pour les lettres et les sciences sociales. De nombreuses collectivités sont de longue date engagées dans une réflexion sur la numérisation et l'analyse assistée des documents : outre bien entendu les sciences de l'information, il faut mentionner l'histoire, la sociologie, la linguistique, l'archéologie, les études littéraires - énumération évidemment non limitative... Aussi ce colloque ouvert entend-il renforcer des liens et favoriser de nouvelles rencontres d'enseignants et chercheurs de ces disciplines avec ceux des collectivités de la linguistique de corpus et du document numérique. Sans trop d'égard pour l'objectivisme ordinaire, il traitera des problèmes philologiques et herméneutiques que pose le travail sur des corpus numériques, en fonction des tâches et des disciplines. Il s'attachera par exemple à la typologie des genres et discours, à la description de formes et de fonds sémantiques, au repérage de thèmes, à la caractérisation et à l'évolution de concepts, à l'étude des corrélations contenu/expression. Au plan pratique, on abordera sous une forme didactique les questions que posent le recueil, l'établissement, le codage, l'étiquetage, le traitement des corpus et leur édition électronique. Des démonstrations de logiciels seront assurées, ainsi que des initiations aux problématiques propres aux différentes disciplines concernées. * Calendrier - Propositions de communications : un résumé d'une page comprenant références bibliographique et mots-clés. Du 1er septembre 2005 au 31 décembre 2005. À soumettre en fichier attaché aux deux adresses suivantes : LPE2@ext.jussieu.fr et beatrixmarillaud.cals@wanadoo.fr - Réponse du comité scientifique : 1er février 2006. - Remise des textes définitifs des communications (la page du résumé accepté, suivie de 4 à 10 pages de développement) : 1er juin 2006. Elles seront mises en ligne avant le colloque à l'intention des participants. Les textes (résumés et communications) doivent parvenir en pdf de préférence, dans la feuille de style accessible à l'adresse : http://www.revue-texto.net/Redaction/Normes/Consignes.html Autres informations : rubrique Agenda, site Texto ! : http://www.revue-texto.net Et : http://www.univ-tlse2.fr/gril/ * Organisation Comité d'initiative : François Rastier, Michel Ballabriga, Pierre Marillaud. Comité scientifique : Etienne Brunet (Université de Nice), Michel Ballabriga (Université de Toulouse le Mirail), Kjersti Floettum (Université de Bergen), Andrea Iacovella (CNRS, Cens et TGE Adonis), Ioannis Kanellos (ENST, Brest), Pierre Marillaud (Cals), Bénédicte Pincemin (LLI-CNRS, Villetanneuse), François Rastier (CNRS, Paris), André Salem (Université Paris III), Monique Slodzian (INALCO), Mathieu Valette (Atilf-CNRS, Nancy), Geoffrey Williams (Université de Bretagne Sud - Lorient). Comité d'organisation : Carine Duteil (Atilf-Cnrs), Baptiste Foulquié (Université de Toulouse le Mirail), Robert Gauthier (Université de Toulouse le Mirail), Béatrix Marillaud (Cals), Céline Poudat (Université d'Orléans). * Conditions d'accueil Informations et préinscriptions : CALS : beatrixmarillaud.cals@wanadoo.fr Droits d'inscription : 50 euros ; étudiants : 30 euros. Lieu du colloque : Centre Saint Amarand, 16, rue de la République, 81000, Albi. Logement sur place (nombre de places limité) : Chambre simple (avec lavabo) : 20 euros, double : 29 euros (petits déjeuners compris). Repas sur place : 11 euros (boissons comprises). Autres hébergements : Office de Tourisme : accueil@albitourisme.com - www.albi-tourisme.fr Dates : du lundi 10 au vendredi 14 juillet (cinq jours complets). Avec le soutien de l'UPS TGE Adonis, du CPST (Université de Toulouse le Mirail) et de l'Institut Ferdinand de Saussure (France). 666666666666666666666666666666666666666666666666666666666666666666666666 {FR, 15/10/2005} LANGUAGE CULTURE AND MIND CONFERENCE (LCM 2) Integrating perspectives and methodologies in the study of language Paris, 17-20 July 2006 The second 'Language Culture and Mind' Conference (LCM 2) will be held in Paris in July 2006, following the successful first LCM conference in Portsmouth in 2004. The goals of LCM conferences are to contribute to situating the study of language in a contemporary interdisciplinary dialogue, and to promote a better integration of cognitive and cultural perspectives in empirical and theoretical studies of language. Human natural languages are biologically based, cognitively motivated, affectively rich, socially shared, grammatically organized symbolic systems. They provide the principal semiotic means for the complexity and diversity of human cultural life. As has long been recognized, no single discipline or methodology is sufficient to capture all the dimensions of this complex and multifaceted phenomenon, which lies at the heart of what it is to be human. In the recent past, perception and cognition have been the basis of general unifying models of language and language activity. However, a genuine integrative perspective should also involve such essential modalities of human action as : empathy, mimesis, intersubjectivity, normativity, agentivity and narrativity. Significant theoretical, methodological and empirical advancements in the relevant disciplines now provide a realistic basis for such a broadened perspective. This conference will articulate and discuss approaches to human natural language and to diverse genres of language activity which aim to integrate its cultural, social, cognitive and bodily foundations. We call for contributions from scholars and scientists in anthropology, biology, linguistics, philosophy, psychology, semiotics, semantics, discourse analysis, cognitive and neuroscience, who wish both to impart their insights and findings, and learn from other disciplines. Preference will be given to submissions which emphasize interdisciplinarity, the interaction between culture, mind and language, and/or multi-methodological approaches in language sciences. Topics include but are not limited to the relation between language and : - biological and cultural co-evolution - comparative study of communication systems, whether animal or artificial - cognitive and cultural schematization - emergence in ontogeny and phylogeny - multi-modal communication - normativity - thought, emotion and consciousness - perception and categorization - empathy and intersubjectivity - imitation and mimesis - symbolic activity - discourse genres in language evolution and ontogeny - sign, text and literacy * Organizing committee Caroline David (Université de Montpellier) Jean-Louis Dessalles (École Nationale Supérieure des Télécommunications, Paris) Jean Lassègue (CNRS, Paris) Victor Rosenthal (Inserm-EHESS, Paris) Chris Sinha (University of Portsmouth) Yves-Marie Visetti (CNRS, Paris) Joerg Zinken (University of Portsmouth) Jordan Zlatev (Lund University) * Submissions Submissions are solicited for oral presentations and poster sessions. Oral presentations should last 20 minutes (plus 10 minutes discussion). All submissions should follow the abstract guidelines below. Submissions should be in English. Abstracts should not exceed 1200 words (about two A4 pages), single-spaced, font size 12 pt or larger, with 2.5 cm margins on all sides. Any diagrams and references must fit on this two page submission. Head material (at the top of the first page) : - Title of the paper, - Author name(s), - Author affiliation(s) in brief (1 line), - Email address of principal author - Type of submission (oral presentation, poster) Abstracts should be emailed to submission@lcm2006.net as an ATTACHMENT (i.e. not included in the message) preferably as a MS Word document, but in PDF or postscript format if it is necessary to include a diagram or figure. Please do not send abstracts before December 1st 2005. Abstracts should be submitted by January 8, 2006. Notification of acceptance by March 30, 2006. All abstracts will be reviewed by members of the International Scientific Committee. Further information about LCM 2 will be presented at http://www.lcm2006.net 666666666666666666666666666666666666666666666666666666666666666666666666 {FR, 10/10/2005} Association Conscila Confrontations en sciences du langage Sémantique des textes théoriques Le vendredi 2 décembre 2005 Institut d'Anglais de l'Université Paris VII - Salle A31, 10, rue Charles V - 75004 PARIS M° Sully-Morland (ligne 7), Saint-Paul (ligne 1) ou Bastille (lignes 1, 8,10) Journée d'études organisée par François Rastier PROGRAMME 9h30 F. Rastier Introduction : Sémantique des textes théoriques 9h45 - 10h30 Driss Ablali (Université de Besançon) Sémantique du discours critique. -Autour de la forme "Texte". Pause 10h45 - 11h30 Sylvain Loiseau (Université Paris X) Thématique et impression référentielle dans le discours philosophique -description sur corpus 11h30 - 12h15 Dominic Forest (UQAM, Montréal) Identification automatique de thèmes et analyse thématique de documents textuels assistée par ordinateur : enjeux et techniques Pause 14h - 14h45 Smaïl Djaoud (Université Paris X) "La sociologie de l'Algérie" (Bourdieu) et les avatars de l'épistémologie coloniale 14h45 - 15h30 Mathieu Valette (Atilf-Cnrs, Nancy) Eléments d'une sémantique textuelle des concepts Pause 15h45 - 16h30 Céline Poudat (Université d'Orléans) Les concepts en linguistique et leur représentation 16h30 - 17h15 François Rastier (CNRS-Inalco) Pour une typologie des discours théoriques. ____________________ Driss Ablali (Université de Besançon) Sémantique du discours critique. Autour de la forme "Texte". Le discours universitaire à travers le genre de la critique littéraire est un objet sous-représenté dans les études qui traitent des textes avec les méthodes de la sémantique interprétative et des outils de la lexicométrie. La mise en oeuvre des moyens d'investigation et de représentation du corpus montre que les résultats et les procédures statistiques peuvent constituer, dans un cadre sémantique et interprétatif, une aide à l'interprétation en permettant de renouveler les hypothèses comme de guider l'interprétation. La question de la construction des concepts de critique littéraire reste à faire, non pas dans une optique historique et taxinomique, centrée sur leur l'évolution, mais dans une optique proprement textuelle, car les textes scientifiques ont leur propre textualité qui n'a rien à envier aux discours littéraire ou politique, par exemple. Et un tel travail a un double intérêt : d'une part il permet de voir comment s'est constitué le métalangage propre de la critique littéraire, comment a-t-elle forgé les concepts nécessaires à son approche des textes, comment ses concepts se sont détachés de l'univers des significations communes. D'autre part, c'est la question du progrès de la discipline elle-même qui est visé ici, de l'évolution des concepts dans le temps dont il est question dans une approche épistémologique de la théorie. Sur quoi se base-t-on pour critiquer les textes ? C'est sans doute ce qui pourrait expliquer non seulement la construction de la textualité du discours mais aussi son incidence sur la théorisation de la vulgate critique, sur les changements de caps et les révisions inévitables qui ont marqué l'itinéraire. A partir d'un corpus électronique, constitué de revues universitaires, nous voudrions au moyen des outils lexicométriques relever les formes saillantes de notre corpus afin de voir comment elles concourent ou pas à la lexicalisation, car comme le dit F. Rastier, "une forme n'est pas une unité discrète, stable, identique à elle-même : les formes (que l'on opposait faussement à des substances) ne sont que des figures, qui contrastent sur des fonds". L'étude des concepts de notre corpus comporte l'observation des formes et l'analyse des rapports que ces formes tissent entre elles. L'accent sera mis sur la forme qui domine toutes les autres, texte. On en dénombre plus de 6000 occurrences. A quoi tient cette haute fréquence du texte dans le corpus ? De quoi parle-t-on en critique lorsqu'on évoque la question du texte ? Y a-t-il un travail de conceptualisation derrière l'utilisation de cette forme ? Quel est l'écart entre les revendications de la critique qui se veut textuelle et le reflet qu'en donnent les bases de données ? Le trousseau habituel des formes comme interpréter, analyser, critiquer, sens, signification, textualité, fiction, roman, style, littérature, oeuvre, genre, ouvre t-il une porte qui explique cette abondance ? Y t-il un "fond sémantique" derrière cette forme ? La présente communication a pour but de répondre à ce type de questions par une étude sémantique des formes. Ainsi, il s'agit de montrer que les formes dans les discours scientifique, ici le discours universitaire, peuvent être appréhendées comme les thèmes dans le discours littéraire : texte a une textualité comme l'a le thème du mouvement chez Bonnefoy ou la répétition chez Robbe-Grillet. Et comme les formes ne prennent leur sens que dans un environnement contextuel en s'opérant de façon située dans un contexte donné, on s'attachera à voir la distribution de cette forme en tenant compte de son entourage lexical et morphosyntaxique pour souligner combien est arbitraire la frontière du mot et combien indispensable une typologie des contextes dans le cadre de la sémantique des concepts. Le corpus : Notre corpus électronique avoisine les 4 198 432 mots. Il comprend des articles de revues françaises et francophones, toutes universitaires. Tous les textes de notre corpus sont assez homogènes au niveau de la taille, à part RITM qui domine tous les autres. Mais ces différences de taille n'ont aucune influence sur le traitement de notre corpus, dans la mesure où l'accent sera moins mis sur la distance lexicale que sur la construction des concepts scientifiques dans le discours critique. ____________________ Sylvain Loiseau (Université Paris X) Thématique et impression référentielle dans le discours philosophique -description sur corpus La description thématique du discours philosophique met à jour des propriétés originales, qui échappent en partie aux catégories descriptives élaborées pour les discours ayant particulièrement fait l'objet de descriptions comme les genres littéraires, les discours politiques ou scientifiques. Il semble au premier abord manifester des propriétés contradictoires, où coexistent une activité terminologique et des procédés décrits dans le discours littéraire, comme des thèmes poly-isotopique. La description thématique consistera donc ici à explorer la diversité de ces propriétés thématiques : la structure sémique des thèmes, leur lexicalisation par des figements ou des lexies complexes, les expressions néologiques, enfin les degrés de stabilité thématique des formes. On essayera également de décrire l'importance de la composante axiologique de ces thèmes. L'hypothèse qui nous guidera est que cette rigidité terminologique permet de définir un mode particulier d'impression référentielle propre au discours philosophique. Le corpus est constitué des six essais de Deleuze compris entre 1968 et 1993, ainsi que de deux essais de Derrida (L'écriture et la différence, 1979) et Lyotard (Le différend, 1983). Ce corpus est richement annoté : propriétés typographiques, lemmatisation, annotation morphosyntaxique, étiquetage des variations d'emplois et d'acceptions. Il est échantillonné pour être représentatif d'une configuration historique et académique particulière : celle de l'après guerre d'Algérie et des bouleversements culturels des années 60 et 70. Il offre plusieurs axes de variations -stylistique, diachronique, et générique. Nous essayerons d'explorer la contribution à la construction thématique de l'ensemble des dimensions de l'annotation : lexique, morphosyntaxe, ponctuation, mais aussi position et distribution. Références bibliographiques Angenot M. (1982) La parole pamphlétaire -typologie des discours modernes, Payot, Paris Loiseau S. (à paraître) "L'emprunt du discours philosophique au discours politique dans Capitalisme et schizophrénie de Gilles Deleuze et Félix Guattari", Mots, ENS Editions, Lyon. Rastier F. (2001), Arts et sciences du texte, PUF, Paris Rastier F. (2001), "L'Être naquit dans le langage. Un aspect de la mimésis philosophique ", Méthodos, Presse universitaire du Septentrion, Lille. ____________________ Dominic Forest (UQAM, Montréal) Identification automatique de thèmes et analyse thématique de documents textuels assistée par ordinateur : enjeux et techniques Mots-clés : Analyse thématique assistée par ordinateur, identification automatique de thèmes, catégorisation, classification, taxinomie Depuis les dix dernières années, on observe une hausse considérable du nombre d'initiatives visant à numériser et à diffuser, en divers formats numériques, le patrimoine informationnel des organisations et des différentes disciplines académiques. Les conséquences découlant de ces initiatives sont nombreuses et très importantes : développement de normes d'encodage (XML, TEI, Dublin Core), de moyens de diffusion de l'information (portails, content management systems), de reposoirs de données textuelles, etc. Ces impacts sont, de plus, observables à plusieurs niveaux. À cet égard, on note, de manière générale, une transformation radicale dans la pratique des individus devant manipuler, d'une manière ou d'une autre, l'information textuelle. Par ailleurs, l'accroissement de la quantité d'informations disponibles en format numérique a fortement motivé plusieurs recherches dans les domaines de l'analyse de contenu, du Traitement Automatique du Langage (TAL) et de la Lecture et de l'Analyse de textes assistées par ordinateur (LATAO). Ainsi, ces domaines ont généré de nombreuses applications visant à informatiser le traitement des données textuelles. Parmi ces applications figurent les outils d'assistance au développement et à la mise à jour de taxinomies et de thésaurus à partir de données textuelles (Jackson et Moulinier, 2002), les techniques d'assistance à la création d'ontologies fondée sur l'analyse des documents propres à un domaine (Staab et Studer, 2004), les méthodes d'indexation (Moens, 2000) et de résumé automatiques (Mani et Maybury, 1999), etc. En outre, les méthodes informatiques employées pour assister la réalisation de ces tâches sont, elles aussi, très nombreuses. Ainsi, certaines applications sont fondées sur des algorithmes d'apprentissage automatique de nature symbolique (Sebastiani, 2002; Manning et Schütze, 1999), alors que d'autres reposent plutôt sur différentes méthodes connexionnistes (Kohonen, 2001; Ruiz et Srinivasan, 1998) ou requièrent un codage linguistique des données (Jacquemin, 2001). Malgré la diversité des différentes applications d'analyse automatique des données textuelles, on constate qu'un axe de recherche partagé par l'ensemble des disciplines sensibles à l'analyse de textes par ordinateur vise à automatiser l'identification du contenu thématique des données textuelles (Louwerse et van Peer, 2002). Cet axe de recherche se situe au carrefour de plusieurs disciplines. En effet, il fait appel à des concepts et des techniques provenant tant de la littérature, des sciences du langage et des sciences cognitives que de l'informatique et des sciences de l'information. Notre présentation portera précisément sur les problèmes reliés à l'identification des thèmes et à l'analyse thématique assistée par ordinateur. Elle consistera, dans un premier temps, à identifier les principaux enjeux soulevés par ces problématiques. Nous verrons, à cet égard, que l'identification automatique des thèmes et l'analyse thématique de corpus textuels sont des opérations techniques et complexes impliquant, entre autres, plusieurs enjeux, relevant tant des propriétés du discours que de phénomènes linguistiques et terminologiques. Par ailleurs, on constate que toute entreprise visant à assister l'analyse thématique des données textuelles doit, en dernière instance, être fondée sur une conception relativement précise des concepts de "thème" et d' "analyse thématique". À ce chapitre, notre objectif ne sera pas de présenter les principales conceptions classiques de ces concepts, pas plus qu'il ne s'agira d'en proposer de nouvelles. Nous verrons plutôt comment les principaux travaux dans ces domaines reposent sur des conceptions bien spécifiques de ces concepts, lesquelles sont à la base même de l'opérationnalisation des processus d'identification des thèmes et d'analyse thématique. La seconde partie de notre exposé sera consacrée à la présentation et à la comparaison de deux approches permettant d'informatiser les processus d'identification des thèmes et l'analyse thématique. Plusieurs projets ont tenté d'automatiser, avec plus ou moins de succès, ces processus (Kastberg Sjöblom et Brunet, 2000; Rossignol et Sébillot, 2002; Roy et Beust, 2004). Nous croyons, cependant, qu'une méthode des plus fécondes pour l'assistance à l'analyse thématique des données textuelles repose sur l'utilisation du modèle vectoriel et des processus de classification et de catégorisation automatiques (dans leur application au traitement automatique des documents). Dans cette perspective, l'analyse thématique des données textuelles peut être assistée en employant une architecture informatique composée de sept étapes La première étape est l'identification des unités d'information pertinentes. Cette étape vise à extraire du corpus les unités d'information, c'est-à-dire les unités linguistiques servant d'ancrage à l'analyse. Traditionnellement, ces unités sont des mots, mais elles peuvent tout aussi bien être composées de chaînes de caractères (n-grammes) (Cavnar et Trenkle, 1994). À cette étape sont aussi extraits les domaines d'information (paragraphes, chapitres, etc.) qui seront analysés ultérieurement dans la chaîne de traitement. Certaines opérations linguistiques (suppression des mots fonctionnels, lemmatisation, étiquetage morphologique et sémantique) ou statistiques sont aussi appliquées au lexique extrait. La seconde étape réside dans la vectorisation des données textuelles. Suite au découpage du corpus en unités d'information et en domaines d'information, le texte est traduit en une matrice de vecteurs (modèle vectoriel) (Salton, 1989; Manning et Schütze, 1999) qui représente alors chaque domaine d'information par la présence ou l'absence (binaire ou floue) des unités d'information. Dans la troisième étape, les domaines d'information sont classés. Afin de réaliser cette tâche, des classifieurs numériques sont appliqués sur la matrice. Par classifieurs numériques, nous entendons les stratégies mathématiques qui permettent la production de classes d'équivalence sur des segments. Plusieurs techniques numériques ont déjà été explorées sur le texte. Malgré certaines limites, ces approches ont présenté des résultats très positifs et se comparent avantageusement aux approches exclusivement linguistiques (Salton, 1989). Elles permettent, de plus, une immense économie de temps dans le parcours exploratoire d'un corpus. Technologiquement, ces approches sont incontournables lorsqu'elles sont confrontées à de vastes corpus textuels. Les classifieurs produisent des regroupements (classes) de segments en raison de propriétés similaires. De ces classes, on extrait alors le lexique. Par des opérations ensemblistes simples (intersection, union, etc.), sont différenciés, dans la quatrième étape, divers types de sous-classes spécifiques. La cinquième étape réside dans la catégorisation thématique des données. L'hypothèse est que certaines techniques de catégorisation automatiques peuvent être utilisées afin d'identifier l'organisation thématique des documents. Sur les sous-classes lexicales différenciées (étape 4) peuvent être appliquées diverses techniques de catégorisation. Traditionnellement (Sebastiani, 1999, 2003; Jackson et Moulinier, 2002), la catégorisation consiste à attribuer une catégorie aux domaines d'information à partir d'un ensemble prédéfini de catégories. Cette catégorisation associe une étiquette catégorielle à chaque sous-classe lexicale différenciée. Ce prédicat peut soit résumer le contenu signifiant (catégorie descriptive), soit en définir la fonction (catégories fonctionnelles). Cette technique de catégorisation requiert de prendre le vecteur représentant chaque classe et de le comparer à un gabarit (l'ensemble des catégories prédéfinies). Ceci peut se faire de trois manières. Une première méthode est manuelle : c'est l'analyste qui, en fonction de son répertoire propre, attribue la catégorie à assigner. La catégorisation manuelle est un technique classique dans le domaine de l'analyse de contenu. Une seconde est automatique : les vecteurs des sous-groupes sont comparés (par un calcul de similarité) à une définition (en extension) d'une liste catégorielle ou d'un plan de classification, c'est-à-dire un ensemble de catégories prédéfinies. Une troisième approche procède par apprentissage : l'analyste assigne des catégories sur des échantillons de textes et le système les redistribue sur les items lexicaux ayant des contextes similaires. Dans cette présentation, nous présenterons les avantages et les inconvénients de la catégorisation manuelle et de la catégorisation par apprentissage. Nous présenterons aussi une technique de catégorisation thématique fondée sur l'extraction automatique des catégories à partir des documents traités, car, comme l'ont souligné entre autres Louwerse et van Peer (2002, p.4), les index thématiques (catégories thématiques prédéfinies) posent plusieurs problèmes : "The index was conceived to be a practical reference, but trying to classify tales in the [...] index proved problematic." Afin de dépasser les limites de la catégorisation manuelle et automatique effectuée à partir d'ensembles de catégories thématiques prédéfinies, nous exploitons certains outils statistiques permettant de faire émerger les catégories thématiques à partir des documents analysés. Cette méthode consiste à appliquer certains critères statistiques utilisés dans les domaines du repérage de l'information (pondération distribuée, tf·idf, taux d'information, entropie, etc.) (Salton, 1989) à chacune des sous-classes lexicales différenciées afin d'identifier au sein de chacune de ces sous-classes les termes les plus significatifs pouvant (suite à une évaluation de l'utilisateur) servir d'étiquette thématique pour la découverte des principaux thèmes d'un corpus. La sixième étape réside dans la projection des catégories thématiques sur le texte. Une fois la catégorisation thématique effectuée, chaque domaine d'information peut se voir étiquetée automatiquement avec les étiquettes thématiques. Le texte est alors soumis à des analyses classiques soit qualitatives (regroupements, listes, arbres, graphes, etc.) soit quantitatives (statistiques, etc.), mais, cette fois, ce sont les catégories thématiques qui en sont l'objet. La septième étape réside dans la découverte, la navigation et la visualisation des thèmes identifiés. Pour assister l'analyse et l'interprétation des résultats, il est de plus en plus utile d'offrir aux analystes des moyens de visualiser de manière ergonomique ces classes et les relations entre les thèmes. Ce sont, comme le dit Barry (1998), des "mind mapping tools" ou des cartographies cognitives du contenu thématique des textes. Diverses technologies commencent à apparaître pour assister ce type d'analyse (Spence, 2000; Fayyad, Grinstein et Wierse, 2001). Cette dimension ergonomique de représentation est un atout précieux dans le soutien de l'activité interprétative du chercheur. À cet égard, nous verrons comment des méthodes de représentation simples basées sur la norme d'encodage XML permettent de représenter graphiquement les résultats obtenus à des fins de navigation thématique. Comme nous l'avons mentionné, nous présenterons donc deux méthodes informatiques inspirées de l'architecture présentées précédemment. La première méthode est fondée sur des recherches dans le domaine de l'analyse de contenu. La seconde s'inspire de plusieurs travaux provenant, entre autres, des domaines du repérage de l'information et de l'intelligence artificielle. Cette seconde méthode implique des processus de classification et de catégorisation automatiques des documents. Nous verrons, d'ailleurs, que les processus de classification et de catégorisation automatiques des données textuelles s'avèrent très efficaces afin d'assister l'identification des thèmes et la navigation hypertextuelle entre ces derniers. Nous verrons que ces deux approches se distinguent cependant par le niveau d'automatisation qu'elles proposent. Dans la troisième partie de notre exposé, nous présenterons et comparerons les résultats obtenus suite à l'application de deux méthodes présentées précédemment. Le corpus employé pour illustrer ces applications est composé d'articles scientifiques en langue française dans le domaine du traitement et de l'analyse statistique des données textuelles. Plus spécifiquement, il s'agit d'un corpus composés des actes des congrès JADT 2000, 2002 et 2004. Références Barry, C. A. 1998. "Choosing qualitative data analysis software: Atlas/ti and Nudist compared". Sociological Research Online, vol. 3, no 3. www.socresonline.org.uk/socresonline/3/3/4.html. Cavnar, W. B. et Trenkle, J. M. 1994. "N-gram-based text categorization". In Proceedings of SDAIR-94, Las Vegas, Nevada, U.S.A., April 1994. UNLV Publications/Reprographics, pages 161-175. Fayyad, U., Grinstein, G. G. et Wierse, A. (dir. publ.). 2001. Information visualization in data mining and knowledge discovery. San Francisco: Morgan Kaufmann Publishers. Jackson, P. et Moulinier, I. 2002. Natural Language Processing for Online Applications,: Text Retrieval, Extraction, and Categorization. Amsterdam : John Benjamins Publishing Company. Jacquemin, C. 2001. Spotting and Discovering Terms through NLP. Cambridge (Mass.) : MIT Press. Kastberg Sjöblom, M. et Brunet, E. 2000. La thématique. Essai de repérage automatique dans l'oeuvre d'un écrivain. In Rajman, M. et J.-C. Chappelier (dir. publ.). Actes des 5ièmes Journées internationales d'Analyse statistique des Données Textuelles (JADT). Lausanne, 9-11 mars 2000, vol. 2, p. 457-466. Lausanne : EPFL. Kintsch, W et Van Dijk, T. A. 1978. Toward a model of text comprehension and production. Psychological Review, vol. 85, no 5, p. 363-394. Kohonen, T. 2001. Self-Organizing Maps. Berlin : Springer Louwerse, M. et van Peer, W. (dir. publ.). 2002. Thematics : Interdisciplinary Studies. Amsterdam : John Benjamins Publishing Company. Mani, I. et Maybury, M. T. (Dir. publ.). 1999. Advances in automatic text summarization. Cambridge (Mass.) : MIT Press. Manning, C. D. et H. Schütze. 1999. Foundations of statistical natural language processing. Cambridge (Mass.) : MIT Press. Moens, M.-F. 2000. Automatic indexing and abstracting of document texts. Boston : Kluwer Academic Publisher. Roy, T et Beust, P. 2004. ProxiDocs : un outil de cartographie et de catégorisation thématique de corpus. In Purnelle, G., Fairon, C., et Dister, A. Le poids des mots : Actes des 7e Journées internationales d'Analyses statistique des Données Textuelles (JADT). 10-12 mars 2004, Louvain-la-Neuve : Presses Universitaires de Louvain, Volume 2, p. 978 à 986. Rossignol, M. et Sébillot, P. 2002. Automatic generation of sets of keywords for theme characterization and detection. In Morin, A. et Sébillot, P (dir. publ.). Actes des 6ièmes Journées internationales d'Analyse statistique des Données Textuelles (JADT). Saint-Malo, 13-15 mars 2002, vol. 2, p. 185-196. Saint-Malo : IRISA/INRIA. Ruiz, E. et Srinivasan, P. 1998. Automatic text categorization using Neural Networks. In Efthimiadis, E. (Dir. publ.). Advances in classification research, vol. 8 : Proceedings of the 8th ASIS SIG/CR classification research workshop. New Jersey : Information Today, pp. 59-72. Salton, G. 1989. Automatic Text Processing. Reading (Mass.) : Addison-Wesley. Sebastiani, F. 1999. A tutorial on automated text categorisation. In Amandi, A. et Zunino, A. (dir. publ.). 1999. Proceedings of ASAI-99, Buenos Aires. p. 7-35. Sebastiani, F. 2002. Machine learning in automated text categorization. ACM Computing Surveys, vol. 34, no 1, p. 1-47. Sebastiani, F. 2003. Text Categorization. In Zanasi, A. (dir. publ.). Text Mining and its Applications. Southampton : WIT Press. Spence, R. et Press, A. 2000. Information visualization. Boston : Addison-Wesley. Staab, S. and R. Studer. 2004. Handbook on ontologies. Berlin ; New York : Springer-Verlag. Van Dijk, T. A. 1972. Some aspects of text grammars. A study in theoretical linguistics and poetics. The Hague : Mouton. Van Dijk, T. A. et Kintsch, W. 1983. Strategies of discourse comprehension. New York : Academic Press. ____________________ Smaïl Djaoud (Université de Paris X Nanterre) Etude thématique et dialectique de "La sociologie de l'Algérie" (Pierre Bourdieu, Paris, PUF, "Que sais-je ?" 1961) : "La sociologie de l'Algérie" et les avatars de l'épistémologie coloniale Ce travail vise à montrer, d'une part, comment un texte reçoit des interprétations et des sens inédits dés qu'il est trempé dans un nouveau corpus et, d'autre part, comment, au-delà des thèmes investis, la composante dialectique joue un rôle capital dans la constitution des concepts et des explications mais aussi et surtout de la doxa en sciences humaines. Le cas de Bourdieu nous a servi à illustrer cela tout en le mettant en relation avec lui-même dans sa production tardive, avec d'autres sociologues maghrébins et surtout avec les textes de l'école dite "d'Alger". Avec "La sociologie de l'Algérie" de Pierre Bourdieu, publiée en 1958, on amorce une nouvelle phase dans les recherches sur le Maghreb. Elle se présente comme le condensé d'un travail plus approfondi que l'auteur a mené au cours de ses enquêtes ethnologiques, dans des circonstances difficiles et parfois dramatiques, en Kabylie et ailleurs. Malgré le contexte colonial général où elle a été produite et malgré la guerre d'Algérie qui était à son point culminant, elle constitue à plus d'un titre une rupture par rapport à ce qui se faisait jusque là. Politiquement, en s'opposant à sa compatriote Germaine Tillion, le jeune sociologue dénonce avec la plus froide objectivité les conséquences de ce qu'il appelle tantôt une "déculturation ", tantôt une "désagrégation culturelle". "Expérience catastrophique de chirurgie sociale, conclut-il, la guerre a fait table rase d'une civilisation dont on ne pourra plus parler qu'au passé." (P.123). Scientifiquement, il s'insurge dans le détail de l'explication contre l'évolutionnisme ambiant qui a fait les beaux jours de l'ethnologie coloniale. C'est l'une des rares fois où, sans hésitation aucune, les termes de "civilisation algérienne" et de "civilisation nord-africaine" sont employés. Sans vouloir troubler à tout prix les évidences les plus indiscutées, la question que l'on voudrait poser ici est la suivante : si "La sociologie " a réussi à remettre en doute et l'évolutionnisme précédent et l'idéologie de l'Occidental supérieur qui l'a souvent inspiré (dans le cas du Maghreb colonisé en tous les cas), est-elle allée jusqu'à contester les fondements implicites de la doxa épistémique coloniale ? En d'autres termes, le dépassement d'une "école", d'une idéologie, suffit-il pour ébranler une doxa en matière de savoir ? L'hypothèse est d'autant moins gratuite que, d'une part, la bibliographie du livre ne mentionne que des travaux d'histoire et d'ethnologie coloniales et, d'autre part, l'auteur ne s'en cache pas quant au but de son entreprise : "J'ai commencé à connaître l'Algérie par les livres. Il y avait une sociologie et une ethnologie coloniales dans lesquelles il y avait beaucoup de choses détestables, mais aussi des choses pas mal. Mais ce qui manquait c'était une théorie moderne. Mon but a été de donner une vision juste scientifiquement, avec les instruments modernes de la sociologie et de l'ethnologie, de cette réalité algérienne, en m'appuyant sur des travaux...Alors il y avait des travaux détestables" (Awal, 2003 : 232) Toute la question reste donc de savoir si le dépassement des ces "travaux détestables", pour la plupart issus de "l'école d'Alger" et de ses ancêtres intellectuels, a été effectif et complet. L'investigation sémantique du texte mais aussi celle des corpus qui l'entourent permet d'apprécier la doxa d'une époque de production. Elle montre dans ce cas que derrière la densité des explications et des développements, derrière l'apparence désordonnée des détails et des descriptions, se tient une véritable ossature narrative qui donne au texte toute sa cohérence. Ce récit en filigrane met en scène la lutte acharnée de deux acteurs, l'homme et l'environnement, et met aux prises leurs deux univers sémantiques différents mais très liés : celui de la nature et celui de la tradition. L'histoire dialectique qui s'étend sur toute la longueur de cette étude révèle une véritable luxuriance événementielle car elle met en oeuvre une quantité importante de fonctions qui, de prime abord, se présentent toutes comme des segments de théorie sociologique. Le récit effectue en effet un brassage narratif de phénomènes aussi éloignés les uns des autres que la solidarité agnatique, le maraboutisme, la condition de la femme, la magie, l'indivision des terres, les rites. D'une part, cette lecture conduit à discerner du narratif au coeur même de l'explication sociologique, non pas à l'endroit où le chercheur présente, pour des raisons pédagogiques, les résultats de sa recherche comme un récit attrayant, mais précisément au sein même de l'appareil explicatif : là où justement il croit expliquer, il raconte. D'autre part, pour revenir à la doxa, la description à la fois de ce récit filigrané et des réseaux sémémiques qu'il engendre nous apprend que, malgré tous les dépassements qu'opère La sociologie de l'Algérie, malgré sa situation à l'antipode de "l'Ecole d'Alger", elle s'est montrée impuissante à aller au-delà d'une conception de nature écologique et plus particulièrement de ce que nous appelons le paradigme écologique au fondement de la tradition pluridisciplinaire coloniale : dans ce paradigme que nous avons rencontré notamment en Histoire avec la vision géographique de C-A. Julien ou de E-F. Gautier, ce qui façonne les hommes tient plus du relief et du climat que de l'histoire. Ce qui permet de conclure à cela c'est l'omniprésence de ce duel narré entre l'homme et l'environnement, ainsi que sa finalité, la vie ou la survie. Ce sont aussi les parallèles souvent faits entre les univers des deux acteurs, de telle façon qu'on retrouve dans la molécule sémique de la Tradition pratiquement les mêmes traits sémantiques que ceux investis dans l'acteur Environnement. Moment culminant de cette "naturalisation" sémantique, quand le sémème 'culture' se met à désigner non pas la culture, au sens ethnologique de constructions symboliques, mais la culture au sens d'exploitation de la terre, c'est-à-dire encore une fois de lutte contre le milieu naturel, et se retrouve de ce fait plus lié avec les 'céréales' qu'avec une quelconque formation culturelle. Par ailleurs, il y a également reprise et adaptation, non pas de la même vision des historiens coloniaux, mais des mêmes principes de divisions ainsi que de la même volonté de susciter partout des "entités conflictuelles et irréductibles" (Corm G, 2003). Ces oppositions ont pu ainsi être appliquées presque telles qu'elles dans le domaine sociologique malgré la transmutation disciplinaire : berbérisme / arabisme, montagne / plaine, autochtone / étranger, permanent / changeant, païen / islamique, etc. Partant de là, ce qu'on a pu appeler le fonctionnalisme (ou le culturalisme) chez le premier Bourdieu ne nous a pas paru être comme un "choix théorique" a priori ayant certaines conséquences sur le travail de terrain. C'est le "terrain" maghrébin, travaillé par tant d'ethnologues coloniaux, qui a trouvé en le fonctionnalisme une théorie d'élection et non l'inverse (une théorie qui a trouvé un terrain d'élection pour une application exemplaire) ; par cette théorie, la tradition pluridisciplinaire qui faisait la part belle aux causalités les plus proches de la nature et des besoins élémentaires pour expliquer les phénomènes sociaux et historiques les plus divers. ____________________ Mathieu Valette (Atilf-Cnrs) De la sémantique des concepts à la veille conceptuelle L'analyse sémantique d'un corpus constitué de textes théoriques en sciences humaines montre que les concepts sont, d'un point de vue textuel, des entités complexes qui, loin de se réduire à leur seule lexicalisation, s'actualisent à tous les niveaux de textualité. Ainsi, la lexicalisation d'un thème, qui aboutit à la formation du concept, aurait une incidence sur la conservation de ce thème parce qu'en le stabilisant, elle le fige. La richesse du concept n'est peut-être jamais aussi grande que lorsqu'il n'a pas (encore) reçu de nom. Sa définition demeure alors enchâssée dans un réseau complexe d'expressions et de phraséologies. En bref, d'un point de vue textuel, non seulement un concept est susceptible de s'appauvrir lorsqu'il est nommé, mais il peut également altérer sensiblement le contexte dans lequel il s'insère. Par ailleurs, un concept ne se résume jamais, loin s'en faut, à une ou des définitions, ni même à un ensemble de gloses ; il est tributaire de ses réalisations dans le texte. Chacune en modifie la nature, de sorte que l'autonymie n'en est qu'un cas particulier. Par exemple, il suffit qu'une relation quelconque soit établie une fois entre deux concepts pour que celle-ci participe à sa nature, quand même cette relation n'est pas à proprement dit définitoire. Notre corpus d'étude est constitué de textes théoriques en sciences humaines (leçons de linguistique de Gustave Guillaume). Ce choix a été notamment déterminé par (i) la grande textualité inhérente à ce type de production de connaissance ; (ii) leur richesse conceptuelle intrinsèque ; (ii) la possibilité de les aborder en diachronie, c'est-à-dire génétiquement, en respectant l'ordre de production des articles, essais, conférences, etc. de l'auteur choisi. Notre recherche a pour objectif la description des phénomènes de conceptualisation (caractérisation, typologie, modélisation). Elle intéresse certains domaines de l'ingénierie des connaissances (représentation des contenus). Elle ouvre également la voie à des travaux de type "veille conceptuelle". ____________________ Céline Poudat (Université d'Orléans) Les concepts en linguistique et leur représentation La présente communication porte sur les concepts linguistiques et leur représentation dans un corpus de 224 articles de revues linguistiques essentiellement publiées autour de 2000. Supposés constituer un mode d'accès privilégié aux thèmes scientifiques linguistiques, les substantifs au singulier et au pluriel les plus représentés ont d'abord été extraits. Bien qu'on relève trois fois plus de candidats concepts au singulier qu'au pluriel (76,21% sg. vs. 23.78% pl.), certains substantifs, comme "mots" ou "conditions" semblent résolument pluriel, tandis que d'autres, comme "exemple(s)" ou "enfant(s)" paraissent plus indéterminés en nombre. Après avoir écarté de l'analyse les substantifs relevant de la méthodologie scientifique générale, c'est-à-dire de la typologique (e.g. cas, type), la logique (relation, rapport) ou la démonstration (exemple), et des spécificités de la linguistique et de ses objets (forme, fait), ce sont douze entrées de fréquence élevée qui ont été retenues : sens, interprétation, langue, discours, parole, langage, texte, corpus, interprétation, contexte, cotexte et énonciation. Si l'on définit un thème sémantique comme "un groupement structuré de sèmes" (Rastier, 2001, p. 38), ce dernier peut être décrit à travers les récurrences observées statistiquement, qui sont l'indice de récurrences sémantiques. Outre les cooccurrents-mots des candidats-thèmes sélectionnés, nous avons examiné leurs corrélats morphosyntaxiques à partir d'un ensemble de 136 variables adapté aux spécificités du discours scientifique (Poudat, 2004). L'analyse de ces corrélats nous a permis de caractériser et de préciser la nature des thèmes linguistiques observés et d'opposer différents types de thèmes, correspondant à des degrés distincts de conceptualisation linguistique. Nous proposerons un ensemble de critères utiles à cette entreprise typologique, par exemple le niveau d'homogénéité des corrélats en termes de sous-domaines linguistiques. Bibliographie sélective LOISEAU, Sylvain. "Thématique et sémantique conceptuelle d'un concept philosophique" in Williams, G (dir.). La linguistique de corpus. Presses Universitaires de Rennes, Rennes, 2005. POUDAT, Céline. "Une annotation de corpus dédiée à la caractérisation du genre de l'article scientifique" in Workshop TCAN Construction du Savoir Scientifique dans la Langue, Maison Alpes des Sciences Humaines, 20-21 octobre 2004. RASTIER, François. Arts et sciences du texte. Paris, PUF, 2001. RASTIER, François. Sémantique interprétative. Paris, PUF, 1987. ____________________ François Rastier (Cnrs) Pour une typologie des discours théoriques Après une mise au point sur le statut des textes théoriques, on aborde leur typologie pour chercher à caractériser leur textualité propre. Le problème de la mimésis théorique permet d'interroger notamment la structure de l'article scientifique et son hétérogénéité sémiotique. L'étude des formes textuelles s'attache d'abord à la formation et à l'évolution des concepts, puis s'étend aux formes globales de la dialectique. Elle conduit à une typologie des univers sémantiques propres aux discours scientifique et philosophique. La question du texte scientifique reste difficile à poser : la tradition scientifique occidentale fait de la science une affaire de concepts et de termes, non de textes, car elle tient que l'objectivité est indépendante de la différence des langues et des normes textuelles. Le développement de la linguistique de corpus permet cependant depuis peu d'explorer les caractéristiques propres des textes scientifiques. Elle pourra véritablement les restituer à condition de disposer d'une conceptualisation permettant la comparaison des discours, champs génériques et genres ; et aussi d'hypothèses informées, de façon à pouvoir unifier sous des propositions globales les observations de régularités partielles (définitions, marques de "polyphonie", etc.). Au-delà du discours scientifique revendiqué comme tel, nous étendrons notre champ d'investigation à l'ensemble des discours théoriques. Leur étude relève de la linguistique comparée, dès lors qu'elle tient compte comme elle le doit de la dimension textuelle : elle s'assigne pour but de caractériser contrastivement les spécificités des discours et genres, en comparant notamment les discours théoriques (sciences vs philosophie), les discours scientifiques entre eux, enfin les genres au sein de chaque discipline. Nous privilégierons ainsi la comparaison entre discours scientifique et discours philosophique, le discours littéraire servant au besoin de terme de comparaison. Certes, il peut sembler quelque peu abusif de mettre sur le même plan des discours aux objectifs différents et qui font tout pour se différencier : mais, outre que pour une sémantique des textes tous les discours sont justiciables d'une étude contrastive, c'est là un moyen de mieux caractériser ce qui les distingue et d'éprouver les catégories descriptives. Nous chercherons enfin à contraster les régimes de textualité, tant globalement (par exemple pour ce qui concerne la mimésis) que localement pour le statut des unités textuelles. 666666666666666666666666666666666666666666666666666666666666666666666666