2005_10_18
________________________________________________________________________
SdT volume 11, numero 5.


						LES CITATIONS DU MOIS
			________________________________________________

			La narration est possible là où l'éternité 
			attire et surélève le temps, non là où elle 
			l'abolit.
				Ricoeur, Temps et Récit, I, p. 61.

			A Balbec, un jour où la princesse de Luxembourg 
			m'avait dit qu'elle n'avait pas emporté de
			livre, j' allais lui prêter pêcheur d'Islande
			et Tartarin de Tarascon, quand je compris 
			ce qu'elle avait voulu dire : non qu'elle 
			passerait le temps moins agréablement,
			mais que je  pourrais plus difficilement 
			mettre mon nom chez elle.
 				M. Proust, La prisonnière, t.1.,
				Paris:Gallimard, 249.
			________________________________________________
		

				SOMMAIRE


1- Coordonnees
	- Bienvenue a Emmanuelle TRICOIRE, Sheila VIEIRA DE CAMARGO
	  GRILLO, Thanh Tuyen NGUYEN THI, Romeo GALASSI, Charlotte 
	  DILKS, Magda DARGENTAS, Catherine GOUTTAS.
	- Changements d'adresse : Marie-Christine LALA, Andrea ROCCI,
	  Driss EL KHATTAB.

2- Carnet
	- Au commencement, il y avait le service de presse...
	- Programme du Seminaire de Francois Rastier, 2005-2006.

3- Textes electroniques
	- Textometrie avec Lexico
	- Site et revue EspacesTemps
	- Internet litteraire en langues romanes : actes de colloque
	
4- Publications
	- Cahiers de praxematique 43 (2004) : Aspect du dialogisme
	- Texto! : nouveautes de la derniere edition (septembre 2005)

5- Dialogues
	- Diction du poeme contemporain : dialogue entre
	  Michel Favriaud et Francois Rastier.

6- Appels : Colloques et revues
	- L'analyse secondaire en recherche qualitative. Utopie ou 
	  perspectives nouvelles ?, Grenoble, 3-4 novembre 2005.
	- Langage et violence, Paris, 30 novembre 2005.
	- Traces, Enigmes, Problemes : Emergence et construction du sens
	  Rochebrune, Megeve, 22-27 janvier 2006.
	- Historiography of Linguistics in the 21th Century : Challenges
	  and Perspectives (SGdS2006), Leiden, 28-30 June 2006.
	- Colloque de l'Association for Linguistic and Literary
	  Computing, Paris, 5-8 juillet 2006.
	- Corpus en Lettres et Sciences sociales -Des documents 
	  numeriques a l'interpretation, Albi, 10-14 juillet 2006.
	- Integrating perspectives and methodologies in the study of 
	  language (LCM 2), Paris, 17-20 July 2006.
	- Semantique des textes theoriques, Paris, 2 decembre 2005
	  (programme avec les resumes des communications).
		
111111111111111111111111111111111111111111111111111111111111111111111111
Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees Coordonnees 
111111111111111111111111111111111111111111111111111111111111111111111111

BIENVENUE AUX NOUVEAUX ABONNÉS

[information réservée aux abonnés]

222222222222222222222222222222222222222222222222222222222222222222222222
Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet Carnet
222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/10/2005}

RENTRÉE LITTÉRAIRE

"Au commencement, il y avait le service de presse, et quelqu'un le
reçut, envoyé par l'éditeur. Alors il rédigea un compte rendu. Puis il 
écrivit un livre, que l'éditeur accepta et qu'il transmit comme service 
de presse. Celui qui le reçut fit de même. Et c'est ainsi que se
constitua la littérature contemporaine."

	Karl Kraus, Troisième nuit de Walpurgis. Agone, 2005.

222222222222222222222222222222222222222222222222222222222222222222222222
{FR, 10/10/2005}

SEMINAIRE

		Séminaire Sémantique des textes, année 2005-2006
			François RASTIER, Directeur de recherche

			Sémiotique des cultures (II.)

Les thèmes suivants seront abordés :
- Le sens : référence ou références ? Ontologie et déontologie.
- Pour une sémantique des textes scientifiques.
- Sémiotique des discours identitaires.
- Plurilinguisme et traduction.
- Les spécificités de l'objet culturel.
- Objectivation et interprétation dans les sciences de la culture.
  Les programmes de naturalisation et leurs enjeux.

Institut national des langues et civilisations orientales, Centre de 
Recherches en Ingéniérie Multilingue, 2 rue de Lille, 75007 Paris -
Salons de l'Inalco, escalier C, deuxième étage, salle 223.
Métro : Saint-Germain, Musée d'Orsay ou Palais-Royal.

Les jeudis 5, 12, 19 et 26 janvier ; 2 et 23 février ; 2 mars.
Horaire : de 17h30 à 19h15. 

Contact: Lpe2@ext.jussieu.fr
Site du séminaire virtuel : http://www.revue-texto.net

Parmi les lectures possibles :
Cassirer, E., Logique des sciences de la culture, Paris, Cerf, 1991.
Descola, P. Par-delà Nature et Culture, Paris, Gallimard, 2005.
Rastier, F. et Bouquet, S. (dir.) Une introduction aux sciences de la 
   culture, Paris, Puf, 2002.
Rickert, H., Sciences de la culture et sciences de la nature, Paris, 
   Gallimard, 1997.

333333333333333333333333333333333333333333333333333333333333333333333333
Textes electroniques Textes electroniques Textes electroniques Textes
333333333333333333333333333333333333333333333333333333333333333333333333
{FR 10/10/2005, Valette 06/09/2005}

NOTES DE DEGUSTATION

* Un site consacré aux explorations textométriques avec Lexico3 qui
devrait devenir un recueil d'expériences couvrant des domaines très
différents. Il s'agit de compte rendus d'expériences, en cours ou
achevées, signées par leurs auteurs, lesquels auront ensuite le loisir 
de les remettre à jour si besoin. Les premières contributions sont 
disponibles ici :
	http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW/
		navigations-tdm.html 

* EspacesTemps
Un site et une revue des sciences sociales.
La revue :	http://EspacesTemps.net
L'adresse :	Redaction@EspacesTemps.net

333333333333333333333333333333333333333333333333333333333333333333333333
{FR, 10/10/2005}

INTERNET LITTERAIRE

Les actes d'un colloque de 2003, consacré à l'Internet littéraire dans 
les langues romanes (en grande partie le domaine francophone), sont
publiés dans la revue en ligne Philologie im Netz (www.phin.de). On
trouvera les articles dans le second supplément / Beiheft, à partir 
de la barre de menu horizontale supérieure : 
Jörg Dünne / Dietrich Scholler / Thomas Stöber (Hg.) (2004) : Internet
und digitale Medien in der Romanistik : Theorie - Ästhetik - Praxis 

444444444444444444444444444444444444444444444444444444444444444444444444
Publications Publications Publications Publications Publications
444444444444444444444444444444444444444444444444444444444444444444444444
{Bonnet, 08/07/2005}

VIENT DE PARAÎTRE

Le N° 43 des Cahiers de Praxématique vient de paraître :
Cahiers de praxématique 43 -- 2004
		"Aspect du dialogisme"
Numéro coordonné par Aleksandra Nowakowska.

444444444444444444444444444444444444444444444444444444444444444444444444
{FR, 10/10/2005}

TEXTO !  http://www.revue-texto.net

	Les nouveautés de la dernière édition (septembre 2005)
                                                      
Dans la rubrique DITS ET INÉDITS : 

Alinei, Mario
	The Paleolithic Continuity Theory on Indo-european Origins :
	An Introduction (2004). [Coédition : article extrait du PCT]
The author discusses the theories on the origins of Indo-Europeans and 
proposes a new synthesis : the Paleolithic Continuity Theory.

Brandist, Craig
	Mikhail Bakhtine and the early Soviet Sociolinguistics (2003)

Dumesnil, Pierre
	Pour une économie sémiotique (2005)
L'article suggère qu'une réévaluation des disciplines éducatives et 
culturelles sans finalité professionnelle, couplées avec "l'usinage du 
signe" via l'ordinateur en réseau, pourrait contribuer à l'émergence 
d'une économie soutenable car très massivement sémiotique.

Labbe, Hélène & Marcoccia, Michel
	Communication numérique et continuité des genres : 
	l'exemple du courrier électronique (2005)
L'article traite de la question des genres numériques et montre,
à partir d'une étude de cas, l'influence des genres pré-numériques et la
continuité de ces genres. L'étude de cas porte sur l'analyse comparative
du billet et du courrier électronique. 

Rastier, François
	Mésosémantique et syntaxe (2005)
Ce texte présente la mésosémantique, qui opère aux paliers du syntagme 
(syntagmes pourvus d'une fonction syntaxique) et de la période.
	De la sémantique cognitive à la sémantique diachronique : 
	les valeurs et évolutions des classes lexicales (2000)
Cette étude des inégalités qualitatives en diachronie montre comment 
l'évolution sociale des normes de valorisation remanie la structure des 
classes lexicales élémentaires (taxèmes) ; elle prend pour exemple 
l'histoire des dénominations du visage en français depuis le XVe siècle.

Rousseaux, Francis & Thomas Bouaziz
	L'invention des connaissances par les informaticiens (2005)
L'analyse de systèmes d'aide à l'interprétation de documents numériques 
met en évidence une déconstruction de la notion de "connaissances" telle
qu'elle a été proposée aux informaticiens par Allen Newell en 1982 ; 
parallèlement, on assiste à l'émergence prometteuse de la notion de 
"collection".

Sériot, Patrick
	Oxymore ou malentendu ? Le relativisme universaliste de la
	métalangue sémantique naturelle universelle d'Anna Wierzbicka
	(2004)
Analyse des fondements épistémologiques des primitives sémantiques 
universelles d'Anna Wierzbicka dans le cadre d'une perspective plus 
générale de mise en évidence des présupposés scientifiques et 
idéologiques du discours sur la langue en Europe orientale.


Dans la rubrique DIALOGUES ET DÉBATS :

- Les sciences cognitives (2005)
Entretien entre François Rastier et Philippe Lacour sur les sciences 
cognitives et le programme de naturalisation.
François Rastier discute le programme cognitiviste denaturalisation des 
sciences sociales et sa version néo-darwinienne, qui privilégie les 
sciences de la vie et la métaphore du gène. En rupture avec ce 
programme, Rastier explique les raisons qui l'ont conduit à développer 
les bases d'un programme fédérateur pour les sciences de la culture.


Dans la rubrique FERDINAND DE SAUSSURE : 

Saussure, Ferdinand de
	Nouveaux item (1996)
Transcription diplomatique établie par Rudolf Engler d'après les notes 
manuscrites déposées à la Bibliothèque de Genève.

Choi, Yong-Ho & Hyun-Kwon Kim
	Saussurism in Korea [Coédition : article extrait de SemiotiX,
	2004, Volume 1, Issue 1]
Saussure as the very first western linguist who influenced Korean
linguistics.


Dans la rubrique LA LETTRE ET L'INTERPRÈTE : 

Wögerbauer, Werner
	L'engagement de Paul Celan (2000)
On a parfois reproché à la poésie de Paul Celan son absence de message 
social. Mais ses interventions politiques se sont produites dans la 
matière même des poèmes, comme autant de prises de position formulées à 
partir d'un repli à la fois personnel et poétique. 

Utaker, Arild
	Babel et la diversité des langues (2004)
Lorsque la traduction sert de levier critique contre certaines thèses 
communes aux théories philosophiques du langage.


Dans la rubrique REPÈRES : 

Thèmes :

Dossier "Rhétorique" :

Carine Duteil-Mougel
	Introduction à la rhétorique (2005)
Étude de l'évolution de la Rhétorique à travers les conceptions des 
principaux auteurs Anciens : Aristote, l'auteur de la Rhétorique à 
Hérennius, Cicéron et Quintilien.

Dossier "Textes et discours" :

Rossitza Kyheng
	Hjelmslev et le concept de texte en linguistique (2005)
Le début des conceptualisations du terme « texte » en linguistique et 
les deux concepts de texte chez Hjelmslev. 


Dans la rubrique CORPUS :

Vaillant, Pascal
	La classification automatique des textes (2005)
La classification automatique de textes et l'attribution des catégories.


Dans la rubrique PARUTIONS ET TRÉSORS : 

Hébert, Louis
	Une sémantique différentielle unifiée (1996)
Louis Hébert réalise le compte rendu critique de Sémantique pour
l'analyse. Il présente les différentes sections de cet ouvrage collectif
en dégageant les principaux concepts de la Sémantique interprétative.

Brague, Rémi
	Le Coran, sortir du cercle ? (2003) [Coédition : article extrait
	de Phronesis.org : Ancients & Moderns Philosophy]
Compte rendu de : LUXENBERG, Christoph. Die syro-aramâische Lesart des 
Koran. Ein Beitrag zur Entschlûsselung der Koransprache. Berlin : Das 
Arabische Buch, 2000 ; PRÉMARE, Alfred-Louis de. Les Fondations de
l'Islam. Entre écriture et histoire. Paris : Le Seuil, 2000.


TRADUCTIONS : 

En español : 

Wögerbauer, Werner
	El compromiso de Celan
(Traducción de Arnau Pons)

555555555555555555555555555555555555555555555555555555555555555555555555
Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue Dialogue
555555555555555555555555555555555555555555555555555555555555555555555555
{FR, 10/10/2005}

DICTION DU POEME CONTEMPORAIN

Dialogue entre Michel Favriaud et François Rastier.

MF> On a quelquefois brocardé la diction des poètes déclamant leur
propre texte -celle d'Apollinaire par exemple, alors que 
l'enregistrement technique et l'historicité de cette diction doivent
être pris en compte. On peut être surpris au contraire de l'intérêt de
la diction de James Sacré, Gherasim Luca, André du Bouchet, sans compter
celle des sonores comme Bernard Heidsieck ou (l'est-il, sonore ?)
Jean-Luc Parant, ou à contre pied celle de Philippe Jaccottet, qui,
quoique profonde et mesurée, s'inscrit néanmoins dans une tradition de 
"déclamation" classique ; toutes sont émouvantes, font quelque chose de 
plus que celles des comédiens, comme si elles nous transformaient.
Partagez-vous cet avis et comment expliquez-vous ce phénomène ?

FR> L'auteur n'est point par nature le meilleur de ses interprètes ;
qu'il s'agisse de dire ou de donner sens, son interprétation n'est
qu'une parmi d'autres. Elle ferme le texte sur ses intentions, alors 
qu'en tant qu'oeuvre, il les dépasse.

Apollinaire garde une diction d'avant quatorze, alors que l'esthétique
vocale était dominée par Rosine Bernard -dite Sarah Bernhardt sans doute
pour plus d'emphase. Rien ne vieillit plus vite que les normes de
diction. Celles (pathétiques !) du romantisme tardif sont par bonheur 
devenues insupportables. Mais Du Bouchet a vieilli plus vite que ses 
textes, mais nous ne nous en apercevions pas, car nous sommes ses 
contemporains.

MF> Alors vient la question corollaire : pourquoi la diction des
comédiens est-elle si décevante, même de ceux qui s'y appliquent. Pour 
ma part je ferai une distinction entre diction de comédien et diction de
récitant. La question importe en réception : le lecteur est trompé sur 
la force d'authenticité de la poésie ; et aussi en formation : d'adulte 
et d'élève. Avez-vous cette même frustration d'auditeur et comment 
l'expliquez-vous ?

FR> En effet, la diction des comédiens reste souvent décevante, sans
doute parce qu'elle s'adresse au public d'un spectacle. Or, non
seulement la poésie contemporaine a perdu ses genres auliques (elle se 
fait dans un lit, dit Breton), mais elle semble écrite pour le langage 
intérieur, voire en langage intérieur -d'où la ponctuation blanche, car 
les blancs rappellent les inhibitions propres à la conscience
attentionnelle.

De plus, la diction est un art de la présence, alors qu'une bonne part
de la poésie contemporaine creuse le problème de l'absence, elle aussi 
figurée dans les blancs.

À cela s'ajoute spécifiquement la censure du poétique en France
cartésienne et jacobine. Les réussites demeurent plutôt dans l'ordre de 
la prose : par exemple, "La Princesse de Clèves" lue par Michèle Morgan,
dont la diction déjà un peu désuète rend à merveille la distance
estompée entre le temps des Valois où se déroule le roman et celui où 
Madame de La Fayette le rédige. Ce texte ne me semble pouvoir être lu à 
haute voix que par une femme de sa trempe.

MF> Pour ma part, en tant qu'auditeur et formateur, je me pose aussi la 
question de l'espace de diction. Si dire de la poésie, c'est autre chose
que de porter sur scène un personnage fictionnel, ou encore que de lire 
un texte philosophique, c'est peut-être parce qu'il y a un autre rapport
entre le récitant et l'auditeur-spectateur (singulier ou collectif ?). 
Comment se construit cet espace ? Il y a du corps, des yeux-regards.
Est-ce un lieu seulement sonore, un lieu-hors, imaginaire, ou est-ce un 
espace que l'on peut décrire ? Dire un texte à plusieurs permettrait-il 
de déployer la polyphonie du texte poétique et de construire cet 
espace ?

FR> A la différence de l'espace théâtral ou chorégraphique, l'espace de 
diction n'est pas socialement défini. Les lectures qui se sont
multipliées dans les festivals de théâtre ont plutôt rabattu la diction 
poétique sur la diction théâtrale. La lecture publique a presque
disparu, sauf dans certains rituels d'ailleurs passablement désertés.
Le rhapsode -a fortiori l'aède- et leur public sont devenus
inimaginables. On improvise donc un éthos de lecteur, entre diseur et 
récitant. La lecture dépend de fait de la pratique sociale où elle 
s'insère.

L'espace de formation, la classe ou l'amphi, lèvent à leur manière
certaines indécisions : mais pour sortir de l'assommoir pédagogique, je 
pense qu'il faut susciter des joutes implicites entre les jeunes qui 
vont lire pour s'accomplir. 

On ne peut s'appuyer que sur le régime herméneutique du texte, dans la 
mesure où toute diction est une lecture dans tous les sens du terme.

MF> La diction du poème traduit relève-t-elle de la même problématique 
ou s'y adjoint-il de nouveaux éléments, réellement nouveaux ou seulement
révélés à cette occasion ? Il me semble qu'on tient compte autrement du 
public, qui connaît quelque chose ou rien de l'oeuvre ou de la culture 
étrangère présentées, et qu'on ne peut "défendre" le texte traduit avec 
la même assurance que l'oeuvre source. Il y aurait comme une modération,
une réserve qui affecteraient le timbre...

FR> Peut-être par lassitude hexagonale, je dois dire que les
interprétations les plus convaincantes pour moi l'ont été dans des
langues étrangères : Shakespeare, Dante, Attâr...

Tout comme on ne traduit pas de langue à langue, mais de genre à genre
(ou du moins d'un genre à un "genre prochain") on devrait sans doute, en
disant la traduction d'un poème étranger partir d'un genre analogue pour
innover. Aussi le changement de genre me semble catastrophique. Quand 
Gougaud traduit un poème mystique de Attâr comme une fable de La 
Fontaine, il impose par sa ponctuation comme par son lexique une diction
primesautière qui transforme la leçon mystique en apologue plaisant, et 
cette erreur de genre fausse définitivement la diction et le sens tout 
ensemble.

Vous avez mis en évidence que là où Garcin de Tassy traduisait : "Un
autre papillon alla passer auprès de la lumière et s'en approcha. Il 
toucha de ses ailes la flamme, la bougie fut victorieuse et il fut 
vaincu. Il revint lui aussi, et il révéla quelque chose du mystère en 
question. Il expliqua en quoi consistait l'union avec la bougie ; mais 
le sage papillon lui dit  [...] ", Gougaud ose traduire : "On envoya un 
autre expert. Celui-là franchit le rideau, effleura la flamme, poussa un
cri de papillon, revint en hâte à ses compères et révéla, tout 
essoufflé, qu'il s'était quelque peu brûlé ".
Les octosyllabes typiques de la fable et plus généralement de la poésie 
légère sont bien là (8858888), tout comme l'anthropomorphisme social 
(expert, président), les termes hérités du fabliau (compère) et
l'entrain convenu (cri de papillon, en hâte, tout essoufflé).
L'intensité de l'ardeur est travestie en médiocrité (quelque peu), 
l'humour de la sagesse transcendante en allégresse comique.

Le choix que vous avez fait d'un alexandrin méditatif me semble pouvoir 
éviter, voire réparer, ces dommages bien de chez nous. 

Comme la traduction ne s'apprécie véritablement qu'en édition bilingue, 
il faudrait imaginer une diction bilingue pour rendre sensible
l'altérité et l'émulation des univers expressifs.

Une amie étrangère me demandait un jour où sont en France les écoles de 
traduction poétique. Cette question demeura sans réponse. On traduit en 
prose. Au mieux, on fait parler Héraclite dans l'idiome de Saint John 
Perse. 

L'universalité de la langue française, de sa prose, cache mal un mépris 
souverain : Gallimard, par exemple, a traduit tout Mishima de l'anglais,
mais peu importe dès lors qu'il a la chance d'être mis en français.

MF> Le timbre, n'est-ce pas la grande affaire, que ne régulent vraiment 
ni la ponctuation, ni la métrique, ni cette syntaxe plurielle
caractéristique du poème ? Le cadre de réception non plus ne saurait à 
lui seul le constituer ! Alors, comment le définir, à quel point de 
l'interprétation ?

FR> Le timbre me semble porter l'essentiel du fond émotionnel du texte, 
sur lequel se détachent les formes prosodiques -et, indirectement, les 
formes sémantiques.

MF> Vous avez aussi une expérience d'écriture et de poète. Peut-on
parler d'une diction intérieure, d'une diction intérieure qui
accompagne, précède ou suit l'écriture. Quel serait le rapport entre 
cette voix du dedans plus ou moins aboutie et l'écriture ? 

FR> Je ne peux répondre en lieu et place d'un pseudonyme naturellement 
plus autorisé. Les programmes moteurs, les gestes énonciatifs qui les 
réalisent ont besoin de rythmes pour s'actualiser : le rythme permet
tout à la fois l'anticipation et la rétrospection, pour sortir de
l'instant aveugle et oublieux et construire le temps accompli de
l'action. Je parle ici des rythmes expressifs comme des rythmes 
sémantiques. L'écriture littéraire expérimente et réfléchit de manière 
parfois inouïe ces conditions générales de l'action énonciative.

MF> On pourrait conclure par un très bon souvenir -ou un très mauvais- 
de diction entendue, vécue. Vous pourriez en évoquer le contexte et
l'effet durable en vous...

FR> Dans ses rares moments de repos, le commandant Massoud lisait et 
écrivait des poèmes dans la grande tradition. Je pense souvent à ce bref
poème qu'il a dit lui-même dans un film de Christophe de Ponfilly. Le 
rapport de la culture persane (Massoud était tadjik) à sa poésie est 
immensément confiant et respectueux -alors que dans la France 
contemporaine la poésie reste tout à la fois exaltée et méprisée, deux 
manières complémentaires de ne pas lui rendre justice. 

666666666666666666666666666666666666666666666666666666666666666666666666
Appels Appels Appels Appels Appels Appels Appels Appels Appels Appels
666666666666666666666666666666666666666666666666666666666666666666666666
{Le Roux, 20/07/2005}

JOURNEES D'ETUDE

		« L'analyse secondaire en recherche qualitative.
		  Utopie ou perspectives nouvelles ? »

Maison des Sciences de l'Homme - Alpes, Grenoble, 3-4 novembre 2005.


Les équipes de recherche PACTE-CIDSP (Cnrs / Univ. Grenoble) et GRETS 
(Edf R&D) organisent deux journées d'étude internationales intitulées : 
« L'analyse secondaire en recherche qualitative. Utopie ou perspectives 
nouvelles ? ». Ces journées ont pour ambition de contribuer à la 
réflexion sur le statut de l'analyse secondaire des entretiens dans les 
sciences humaines et sociales d'un point de vue méthodologique et 
épistémologique. Il s'agira notamment de faire connaître et de discuter 
des expériences européennes de capitalisation et de ré-utilisation des 
entretiens de recherche.

Le programme de ces journées traitera :
- d'une réflexion générale sur les usages du qualitatif, à travers un 
  état des lieux de ces pratiques en sciences humaines et sociales ; 
- des expériences de capitalisation et d'analyse secondaire ; 
- des conditions de leur réalisation en examinant les aspects
  déontologiques, juridiques ainsi que les logiciels d'analyse ;
- de la synthèse de ces questions et des développements futurs de 
  l'analyse secondaire des matériaux qualitatifs.

666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}

COLLOQUE

Centre de coopération franco-norvégienne 
en sciences sociales et humaines
MAISON DES SCIENCES DE L'HOMME
54, Boulevard Raspail - 75270 Paris Cedex 06
Tél.: 01 49 54 22 16   Fax: 01 49 54 21 95
Web: http://www.uv.uio.no/paris

			LANGAGE ET VIOLENCE

Colloque franco-norvégien le 30 novembre 2005
La Maison des Sciences de l'Homme, Salle  215

Matin
Modérateur : Arild Utaker
10.00 - 11.00 François Rastier (CNRS) :  Pathos et extermination
11.00 - 12.00 Philippe Mesnard (ISTI, Bruxelles) :
	Rationalité, témoignage et littérature
12.00 - 12.30 Discussion

Après-midi
Modérateur : François Rastier
14.30 - 15.30 Olivier Remaud (EHESS) :
	Le point de vue du langage ordinaire
15.30 - 16.30 Arild Utaker (Université de Bergen) :
	Langage et expérience ; quelle critique du langage ?
16.30 - 17.00 Discussion

666666666666666666666666666666666666666666666666666666666666666666666666
{Beust, 09/09/2005}

COLLOQUE

                13eme Journées de Rochebrune
        Rencontres interdisciplinaires sur les
        systèmes complexes naturels et artificiels

                Traces, Enigmes, Problèmes :
                Emergence et construction du sens

Du 22/1/06 au 27/1/06,
Rochebrune, Megève, France

L'énigme, suppose que, partant de données a priori obscures, celui qui
s'y trouve confronté peut la résoudre au terme d'une série d'opérations
destinées à "donner, construire, faire émerger" un sens.

[...] Ainsi, toutes les disciplines visant à faire émerger, ou à
construire une interprétation à partir d'un ensemble de données
incomplètes ou dégradées sont concernées par la problématique de
l'énigme et de la trace.

Informations :
	http://rochebrune.iutc3.unicaen.fr/Rochebrune2006

666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}

CALL FOR PAPERS
18th International Colloquium of the 
Studienkreis Geschichte der Sprachwissenschaft (SGdS2006)

		Historiography of Linguistics in the 21th Century :
			Challenges and Perspectives

28-30 June 2006, Leiden University (Leiden, The Netherlands)


The XVIIIth International Colloquium of the 'Studienkreis Geschichte der
Sprachwissenschaft (SGdS)' will take place at the University of Leiden 
from 28 to 30 June 2006 and will be organized by Els Elffers 
(Amsterdam), Jan Noordegraaf (Amsterdam), Peter Schmitter (Seoul / 
Muenster), and Marijke van der Wal (Leiden).

Papers on "Historiography of Linguistics in the 21th Century :
Challenges and Perspectives", the main subject of our conference, are 
particulary welcome, but contributions focussing on other topics within 
the framework of the history of linguistics are also much appreciated.
Presentations will last 30 minutes, followed by 15 minutes of
discussion. 

The conference languages are English and German. The conference fee will
be 30 Euro, payable during the conference.

Participants who would like to give a paper are kindly asked to submit 
an abstract of 250-350 words by 15 January 2006, using the template
below which can be copied and returned as a Word- or rtf-file to 
dr. Marijke van der Wal (m.j.van.der.wal@let.leidenuniv.nl) as well as 
to professor Peter Schmitter (schmipe@uni-muenster.de).

For further informations, please contact the local organizer

Marijke van der Wal
Universiteit Leiden - Department of Dutch/LUCL
P.N. van Eyckhof 1 - Postbus 9515 - NL-2300 RA Leiden - The Netherlands
	m.j.van.der.wal@let.leidenuniv.nl

or
Peter Schmitter
Graduate School of Interpretation and Translation
Hankuk University of Foreign Studies
270 Imun-2-dong, Dongdaemun-gu - Seoul, 130-791 Korea (South)
	schmipe@uni-muenster.de

666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}

COLLOQUE ALLC-ACH

Du 5 au 8 juillet 2006 à Paris-IV, le grand colloque annuel de
l'Association for Linguistic and Literary Computing 
	http://www.allc-ach2006.colloques.paris-sorbonne.fr/

666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}

COLLOQUE - ECOLE D'ETE

Colloque international et école d'été
Albi, 10-14 juillet 2006

Organisé dans le cadre des
Colloques d'Albi Langages et signification (CALS)

		Corpus en Lettres et Sciences sociales
		-Des documents numériques à l'interprétation 

			Deuxième circulaire

La constitution et l'analyse de corpus est en train de modifier les 
pratiques voire les théories en lettres et sciences sociales. Comme ces 
disciplines ont maintenant de plus en plus affaire à des documents 
numériques, cela engage pour elles un nouveau rapport à l'empirique. En 
outre, la numérisation des textes scientifiques eux-mêmes permet un 
retour réflexif sur leur élaboration et leurs parcours d'interprétation.
Les nouveaux modes d'accès aux documents engagent-ils de nouvelles 
formes d'élaboration des connaissances ?

Les nouvelles initiatives prises au plan national (création du Centre 
d'édition numérique scientifique du CNRS) et international (TGE Adonis -
Accès unique aux données et documents numériques des Lettres et sciences
humaines) peuvent devenir l'occasion et donner les moyens d'un projet 
fédérateur pour les lettres et les sciences sociales. De nombreuses 
collectivités sont de longue date engagées dans une réflexion sur la 
numérisation et l'analyse assistée des documents : outre bien entendu 
les sciences de l'information, il faut mentionner l'histoire, la 
sociologie, la linguistique, l'archéologie, les études littéraires - 
énumération évidemment non limitative...

Aussi ce colloque ouvert entend-il renforcer des liens et favoriser de 
nouvelles rencontres d'enseignants et chercheurs de ces disciplines avec
ceux des collectivités de la linguistique de corpus et du document 
numérique. Sans trop d'égard pour l'objectivisme ordinaire, il traitera 
des problèmes philologiques et herméneutiques que pose le travail sur 
des corpus numériques, en fonction des tâches et des disciplines. Il 
s'attachera par exemple à la typologie des genres et discours, à la 
description de formes et de fonds sémantiques, au repérage de thèmes, à 
la caractérisation et à l'évolution de concepts, à l'étude des 
corrélations contenu/expression.

Au plan pratique, on abordera sous une forme didactique les questions 
que posent le recueil, l'établissement, le codage, l'étiquetage, le 
traitement des corpus et leur édition électronique. Des démonstrations 
de logiciels seront assurées, ainsi que des initiations aux 
problématiques propres aux différentes disciplines concernées.

* Calendrier 

- Propositions de communications : un résumé d'une page comprenant 
  références bibliographique et mots-clés. Du 1er septembre 2005 au 31 
  décembre 2005. À soumettre en fichier attaché aux deux adresses 
  suivantes : LPE2@ext.jussieu.fr et beatrixmarillaud.cals@wanadoo.fr
- Réponse du comité scientifique : 1er février 2006.
- Remise des textes définitifs des communications (la page du résumé 
  accepté, suivie de 4 à 10 pages de développement) : 1er juin 2006.
  Elles seront mises en ligne avant le colloque à l'intention des 
  participants. Les textes (résumés et communications) doivent parvenir 
  en pdf de préférence, dans la feuille de style accessible à 
  l'adresse :  
	http://www.revue-texto.net/Redaction/Normes/Consignes.html
Autres informations :
rubrique Agenda, site Texto ! :	http://www.revue-texto.net
Et :				http://www.univ-tlse2.fr/gril/

* Organisation

Comité d'initiative : François Rastier, Michel Ballabriga, Pierre 
Marillaud.
Comité scientifique : Etienne Brunet (Université de Nice), Michel 
Ballabriga (Université de Toulouse le Mirail), Kjersti Floettum 
(Université de Bergen), Andrea Iacovella (CNRS, Cens et TGE Adonis), 
Ioannis Kanellos (ENST, Brest), Pierre Marillaud (Cals), Bénédicte 
Pincemin (LLI-CNRS, Villetanneuse), François Rastier (CNRS, Paris), 
André Salem (Université Paris III), Monique Slodzian (INALCO), Mathieu 
Valette (Atilf-CNRS, Nancy), Geoffrey Williams (Université de Bretagne 
Sud - Lorient).
Comité d'organisation : Carine Duteil (Atilf-Cnrs), Baptiste Foulquié 
(Université de Toulouse le Mirail), Robert Gauthier (Université de 
Toulouse le Mirail), Béatrix Marillaud (Cals), Céline Poudat (Université
d'Orléans).

* Conditions d'accueil 

Informations et préinscriptions :
CALS : beatrixmarillaud.cals@wanadoo.fr
Droits d'inscription : 50 euros ; étudiants : 30 euros.
Lieu du colloque  : Centre Saint Amarand, 16, rue de la République,  
81000, Albi.
Logement sur place (nombre de places limité) : Chambre simple (avec 
lavabo) : 20 euros, double : 29 euros (petits déjeuners compris). Repas 
sur place : 11 euros (boissons comprises).
Autres hébergements :  Office de Tourisme : accueil@albitourisme.com  
- www.albi-tourisme.fr
Dates : du lundi 10 au vendredi 14 juillet (cinq jours complets).

Avec le soutien de l'UPS TGE Adonis, du CPST (Université de Toulouse le 
Mirail) et de l'Institut Ferdinand de Saussure (France).

666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 15/10/2005}

LANGUAGE CULTURE AND MIND CONFERENCE (LCM 2)

		Integrating perspectives and methodologies
		in the study of language

Paris, 17-20 July 2006


The second 'Language Culture and Mind' Conference (LCM 2) will be held
in Paris in July 2006, following the successful first LCM conference in
Portsmouth in 2004. The goals of LCM conferences are to contribute to 
situating the study of language in a contemporary interdisciplinary 
dialogue, and to promote a better integration of cognitive and cultural 
perspectives in empirical and theoretical studies of language.

Human natural languages are biologically based, cognitively motivated,
affectively rich, socially shared, grammatically organized symbolic
systems. They provide the principal semiotic means for the complexity 
and diversity of human cultural life. As has long been recognized, no 
single discipline or methodology is sufficient to capture all the 
dimensions of this complex and multifaceted phenomenon, which lies at 
the heart of what it is to be human.

In the recent past, perception and cognition have been the basis of
general unifying models of language and language activity. However, a 
genuine integrative perspective should also involve such essential 
modalities of human action as : empathy, mimesis, intersubjectivity, 
normativity, agentivity and narrativity. Significant theoretical, 
methodological and empirical advancements in the relevant disciplines 
now provide a realistic basis for such a broadened perspective.

This conference will articulate and discuss approaches to human natural
language and to diverse genres of language activity which aim to
integrate its cultural, social, cognitive and bodily foundations. We 
call for contributions from scholars and scientists in anthropology, 
biology, linguistics, philosophy, psychology, semiotics, semantics, 
discourse analysis, cognitive and neuroscience, who wish both to impart 
their insights and findings, and learn from other disciplines.
Preference will be given to submissions which emphasize
interdisciplinarity, the interaction between culture, mind and language,
and/or multi-methodological approaches in language sciences.

Topics include but are not limited to the relation between language
and :
- biological and cultural co-evolution
- comparative study of communication systems, whether animal or
  artificial
- cognitive and cultural schematization
- emergence in ontogeny and phylogeny
- multi-modal communication
- normativity
- thought, emotion and consciousness
- perception and categorization
- empathy and intersubjectivity
- imitation and mimesis
- symbolic activity
- discourse genres in language evolution and ontogeny
- sign, text and literacy

* Organizing committee

Caroline David (Université de Montpellier)
Jean-Louis Dessalles (École Nationale Supérieure des Télécommunications,
Paris)
Jean Lassègue (CNRS, Paris)
Victor Rosenthal (Inserm-EHESS, Paris)
Chris Sinha (University of Portsmouth)
Yves-Marie Visetti (CNRS, Paris)
Joerg Zinken (University of Portsmouth)
Jordan Zlatev (Lund University)

* Submissions

Submissions are solicited for oral presentations and poster sessions.
Oral presentations should last 20 minutes (plus 10 minutes discussion). 
All submissions should follow the abstract guidelines below.
Submissions should be in English. Abstracts should not exceed 1200 words
(about two A4 pages), single-spaced, font size 12 pt or larger, with
2.5 cm margins on all sides. Any diagrams and references must fit on 
this two page submission. Head material (at the top of the first page) :
- Title of the paper,
- Author name(s),
- Author affiliation(s) in brief (1 line),
- Email address of principal author
- Type of submission (oral presentation, poster)
Abstracts should be emailed to submission@lcm2006.net as an ATTACHMENT
(i.e. not included in the message) preferably as a MS Word document, but
in PDF or postscript format if it is necessary to include a diagram or 
figure.
Please do not send abstracts before December 1st 2005. Abstracts should 
be submitted by January 8, 2006. Notification of acceptance by March 30,
2006.
All abstracts will be reviewed by members of the International
Scientific Committee.

Further information about LCM 2 will be presented at
	http://www.lcm2006.net

666666666666666666666666666666666666666666666666666666666666666666666666
{FR, 10/10/2005}

Association Conscila
Confrontations en sciences du langage

		Sémantique des textes théoriques

Le vendredi 2 décembre 2005
Institut d'Anglais de l'Université Paris VII - Salle A31,
10, rue Charles V - 75004 PARIS 
M° Sully-Morland (ligne 7), Saint-Paul (ligne 1) ou Bastille (lignes 1, 
8,10)

Journée d'études organisée par François Rastier

PROGRAMME

 9h30		F. Rastier
Introduction : Sémantique des textes théoriques

 9h45 - 10h30	Driss Ablali (Université de Besançon)
Sémantique du discours critique. -Autour de la forme "Texte".

Pause

10h45 - 11h30	Sylvain Loiseau (Université Paris X)
Thématique et impression référentielle dans le discours philosophique
-description sur corpus

11h30 - 12h15	Dominic Forest (UQAM, Montréal)
Identification automatique de thèmes et analyse thématique de documents
textuels assistée par ordinateur : enjeux et techniques

Pause

14h   - 14h45	Smaïl Djaoud (Université Paris X)
"La sociologie de l'Algérie" (Bourdieu) et les avatars de
l'épistémologie coloniale

14h45 - 15h30	Mathieu Valette (Atilf-Cnrs, Nancy)
Eléments d'une sémantique textuelle des concepts

Pause

15h45 - 16h30	Céline Poudat (Université d'Orléans) 
Les concepts en linguistique et leur représentation

16h30 - 17h15	François Rastier (CNRS-Inalco)
Pour une typologie des discours théoriques.

			____________________
		
Driss Ablali (Université de Besançon)
	Sémantique du discours critique.
	Autour de la forme "Texte".

Le discours universitaire à travers le genre de la critique littéraire 
est un objet sous-représenté dans les études qui traitent des textes  
avec les méthodes de la sémantique interprétative et des outils de la 
lexicométrie. La mise en oeuvre des moyens d'investigation et de 
représentation du corpus montre que les résultats et les procédures 
statistiques peuvent constituer, dans un cadre sémantique et
interprétatif, une aide à l'interprétation en permettant de renouveler 
les hypothèses comme de guider l'interprétation.

La question de la construction des concepts de critique littéraire reste
à faire, non pas dans une optique historique et taxinomique, centrée sur
leur l'évolution, mais dans une optique proprement textuelle, car les 
textes scientifiques ont leur propre textualité qui n'a rien à envier 
aux discours littéraire ou politique, par exemple. Et un tel travail a 
un double intérêt : d'une part il permet de voir comment s'est constitué
le métalangage propre de la critique littéraire, comment a-t-elle forgé 
les concepts nécessaires à son approche des textes, comment ses concepts
se sont détachés de l'univers des significations communes. D'autre part,
c'est la question du progrès de la discipline elle-même qui est visé 
ici, de l'évolution des concepts dans le temps dont il est question dans
une approche épistémologique de la théorie. Sur quoi se base-t-on pour 
critiquer les textes ? C'est sans doute ce qui pourrait expliquer non 
seulement la construction de la textualité du discours mais aussi son 
incidence sur la théorisation de la vulgate critique, sur les
changements de caps et les révisions inévitables qui ont marqué 
l'itinéraire. 

A partir d'un corpus électronique, constitué de revues universitaires, 
nous voudrions au moyen des outils lexicométriques relever les formes 
saillantes de notre corpus afin de voir comment elles concourent ou pas 
à la lexicalisation, car comme le dit F. Rastier, "une forme n'est pas 
une unité discrète, stable, identique à elle-même : les formes (que l'on
opposait faussement à des substances) ne sont que des figures, qui 
contrastent sur des fonds". L'étude des concepts de notre corpus 
comporte l'observation des formes et l'analyse des rapports que ces 
formes tissent entre elles. L'accent sera mis sur la forme qui domine 
toutes les autres, texte. On en dénombre plus de 6000 occurrences. A 
quoi tient cette haute fréquence du texte dans le corpus ? De quoi 
parle-t-on en critique lorsqu'on évoque la question du texte ? Y a-t-il 
un travail de conceptualisation derrière l'utilisation de cette forme ? 
Quel est l'écart entre les revendications de la critique qui se veut 
textuelle et le reflet qu'en donnent les bases de données ? Le trousseau
habituel des formes comme interpréter, analyser, critiquer, sens, 
signification, textualité, fiction, roman, style, littérature, oeuvre, 
genre, ouvre t-il une porte qui explique cette abondance ? Y t-il un 
"fond  sémantique" derrière cette forme ?

La présente communication a pour but de répondre à ce type de questions 
par une étude sémantique des formes. Ainsi, il s'agit de montrer que les
formes dans les discours scientifique, ici le discours universitaire, 
peuvent être appréhendées comme les thèmes dans le discours littéraire :
texte  a une textualité comme l'a le thème du mouvement chez Bonnefoy ou
la répétition chez Robbe-Grillet. Et comme les formes ne prennent leur 
sens que dans un environnement contextuel en s'opérant de façon située 
dans un contexte donné, on s'attachera à voir la distribution de cette 
forme en tenant compte de son entourage lexical et morphosyntaxique pour
souligner combien est arbitraire la frontière du mot et combien 
indispensable une typologie des contextes dans le cadre de la sémantique
des concepts. 

Le corpus :
Notre corpus électronique avoisine les 4 198 432 mots. Il comprend des 
articles de revues françaises et francophones, toutes universitaires. 
Tous les textes de notre corpus sont assez homogènes au niveau de la 
taille, à part RITM qui domine tous les autres. Mais ces différences de 
taille n'ont aucune influence sur le traitement de notre corpus, dans la
mesure où l'accent sera moins mis sur la distance lexicale que sur la 
construction des concepts scientifiques dans le discours critique. 
			____________________

Sylvain Loiseau (Université Paris X)
	Thématique et impression référentielle dans le 
	discours philosophique -description sur corpus

La description thématique du discours philosophique met à jour des 
propriétés originales, qui échappent en partie aux catégories
descriptives élaborées pour les discours ayant particulièrement fait 
l'objet de descriptions comme les genres littéraires, les discours 
politiques ou scientifiques. Il semble au premier abord manifester des 
propriétés contradictoires, où coexistent une activité terminologique et
des procédés décrits dans le discours littéraire, comme des thèmes 
poly-isotopique.

La description thématique consistera donc ici à explorer la diversité de
ces propriétés thématiques : la structure sémique des thèmes, leur 
lexicalisation par des figements ou des lexies complexes, les
expressions néologiques, enfin les degrés de stabilité thématique des 
formes. On essayera également de décrire l'importance de la composante 
axiologique de ces thèmes. L'hypothèse qui nous guidera est que cette 
rigidité terminologique permet de définir un mode particulier 
d'impression référentielle propre au discours philosophique.

Le corpus est constitué des six essais de Deleuze compris entre 1968 et 
1993, ainsi que de deux essais de Derrida (L'écriture et la différence, 
1979) et Lyotard (Le différend, 1983). Ce corpus est richement annoté : 
propriétés typographiques, lemmatisation, annotation morphosyntaxique, 
étiquetage des variations d'emplois et d'acceptions. Il est
échantillonné pour être représentatif d'une configuration historique et 
académique particulière : celle de l'après guerre d'Algérie et des 
bouleversements culturels des années 60 et 70. Il offre plusieurs axes 
de variations -stylistique, diachronique, et générique. Nous essayerons 
d'explorer la contribution à la construction thématique de l'ensemble 
des dimensions de l'annotation : lexique, morphosyntaxe, ponctuation, 
mais aussi position et distribution.

Références bibliographiques
Angenot M. (1982) La parole pamphlétaire -typologie des discours
   modernes, Payot, Paris 
Loiseau S. (à paraître) "L'emprunt du discours philosophique au discours
   politique dans Capitalisme et schizophrénie de Gilles Deleuze et 
   Félix Guattari", Mots, ENS Editions, Lyon.
Rastier F. (2001), Arts et sciences du texte, PUF, Paris
Rastier F. (2001), "L'Être naquit dans le langage. Un aspect de la 
   mimésis philosophique ", Méthodos, Presse universitaire du 
   Septentrion, Lille.
			____________________

Dominic Forest (UQAM, Montréal)
	Identification automatique de thèmes et analyse thématique 
	de documents textuels assistée par ordinateur : 
	enjeux et techniques

Mots-clés : Analyse thématique assistée par ordinateur, identification 
automatique de thèmes, catégorisation, classification, taxinomie

Depuis les dix dernières années, on observe une hausse considérable du 
nombre d'initiatives visant à numériser et à diffuser, en divers formats
numériques, le patrimoine informationnel des organisations et des 
différentes disciplines académiques. Les conséquences découlant de ces 
initiatives sont nombreuses et très importantes : développement de 
normes d'encodage (XML, TEI, Dublin Core), de moyens de diffusion de 
l'information (portails, content management systems), de reposoirs de 
données textuelles, etc. Ces impacts sont, de plus, observables à 
plusieurs niveaux. À cet égard, on note, de manière générale, une 
transformation radicale dans la pratique des individus devant manipuler,
d'une manière ou d'une autre, l'information textuelle.

Par ailleurs, l'accroissement de la quantité d'informations disponibles 
en format numérique a fortement motivé plusieurs recherches dans les 
domaines de l'analyse de contenu, du Traitement Automatique du Langage 
(TAL) et de la Lecture et de l'Analyse de textes assistées par 
ordinateur (LATAO). Ainsi, ces domaines ont généré de nombreuses 
applications visant à informatiser le traitement des données textuelles.
Parmi ces applications figurent les outils d'assistance au développement
et à la mise à jour de taxinomies et de thésaurus à partir de données 
textuelles (Jackson et Moulinier, 2002), les techniques d'assistance à 
la création d'ontologies fondée sur l'analyse des documents propres à un
domaine (Staab et Studer, 2004), les méthodes d'indexation (Moens, 2000)
et de résumé automatiques (Mani et Maybury, 1999), etc. En outre, les 
méthodes informatiques employées pour assister la réalisation de ces 
tâches sont, elles aussi, très nombreuses. Ainsi, certaines applications
sont fondées sur des algorithmes d'apprentissage automatique de nature 
symbolique (Sebastiani, 2002; Manning et Schütze, 1999), alors que 
d'autres reposent plutôt sur différentes méthodes connexionnistes 
(Kohonen, 2001; Ruiz et Srinivasan, 1998) ou requièrent un codage 
linguistique des données (Jacquemin, 2001).

Malgré la diversité des différentes applications d'analyse automatique 
des données textuelles, on constate qu'un axe de recherche partagé par 
l'ensemble des disciplines sensibles à l'analyse de textes par
ordinateur vise à automatiser l'identification du contenu thématique des
données textuelles (Louwerse et van Peer, 2002). Cet axe de recherche se
situe au carrefour de plusieurs disciplines. En effet, il fait appel à 
des concepts et des techniques provenant tant de la littérature, des 
sciences du langage et des sciences cognitives que de l'informatique et 
des sciences de l'information.

Notre présentation portera précisément sur les problèmes reliés à 
l'identification des thèmes et à l'analyse thématique assistée par 
ordinateur. Elle consistera, dans un premier temps, à identifier les 
principaux enjeux soulevés par ces problématiques. Nous verrons, à cet 
égard, que l'identification automatique des thèmes et l'analyse 
thématique de corpus textuels sont des opérations techniques et 
complexes impliquant, entre autres, plusieurs enjeux, relevant tant des 
propriétés du discours que de phénomènes linguistiques et 
terminologiques. Par ailleurs, on constate que toute entreprise visant à
assister l'analyse thématique des données textuelles doit, en dernière 
instance, être fondée sur une conception relativement précise des 
concepts de "thème" et d' "analyse thématique". À ce chapitre, notre 
objectif ne sera pas de présenter les principales conceptions classiques
de ces concepts, pas plus qu'il ne s'agira d'en proposer de nouvelles. 
Nous verrons plutôt comment les principaux travaux dans ces domaines 
reposent sur des conceptions bien spécifiques de ces concepts, 
lesquelles sont à la base même de l'opérationnalisation des processus 
d'identification des thèmes et d'analyse thématique.

La seconde partie de notre exposé sera consacrée à la présentation et à 
la comparaison de deux approches permettant d'informatiser les processus
d'identification des thèmes et l'analyse thématique. Plusieurs projets 
ont tenté d'automatiser, avec plus ou moins de succès, ces processus 
(Kastberg Sjöblom et Brunet, 2000; Rossignol et Sébillot, 2002; Roy et 
Beust, 2004). Nous croyons, cependant, qu'une méthode des plus fécondes 
pour l'assistance à l'analyse thématique des données textuelles repose 
sur l'utilisation du modèle vectoriel et des processus de classification
et de catégorisation automatiques (dans leur application au traitement 
automatique des documents). Dans cette perspective, l'analyse thématique
des données textuelles peut être assistée en employant une architecture 
informatique composée de sept étapes

La première étape est l'identification des unités d'information
pertinentes. Cette étape vise à extraire du corpus les unités 
d'information, c'est-à-dire les unités linguistiques servant d'ancrage à
l'analyse. Traditionnellement, ces unités sont des mots, mais elles 
peuvent tout aussi bien être composées de chaînes de caractères
(n-grammes) (Cavnar et Trenkle, 1994). À cette étape sont aussi extraits
les domaines d'information (paragraphes, chapitres, etc.) qui seront 
analysés ultérieurement dans la chaîne de traitement. Certaines 
opérations linguistiques (suppression des mots fonctionnels, 
lemmatisation, étiquetage morphologique et sémantique) ou statistiques 
sont aussi appliquées au lexique extrait.

La seconde étape réside dans la vectorisation des données textuelles. 
Suite au découpage du corpus en unités d'information et en domaines 
d'information, le texte est traduit en une matrice de vecteurs (modèle 
vectoriel) (Salton, 1989; Manning et Schütze, 1999) qui représente alors
chaque domaine d'information par la présence ou l'absence (binaire ou 
floue) des unités d'information.

Dans la troisième étape, les domaines d'information sont classés. Afin 
de réaliser cette tâche, des classifieurs numériques sont appliqués sur 
la matrice. Par classifieurs numériques, nous entendons les stratégies 
mathématiques qui permettent la production de classes d'équivalence sur 
des segments. Plusieurs techniques numériques ont déjà été explorées sur
le texte. Malgré certaines limites, ces approches ont présenté des 
résultats très positifs et se comparent avantageusement aux approches 
exclusivement linguistiques (Salton, 1989). Elles permettent, de plus, 
une immense économie de temps dans le parcours exploratoire d'un corpus.
Technologiquement, ces approches sont incontournables lorsqu'elles sont 
confrontées à de vastes corpus textuels.

Les classifieurs produisent des regroupements (classes) de segments en 
raison de propriétés similaires. De ces classes, on extrait alors le 
lexique. Par des opérations ensemblistes simples (intersection, union, 
etc.), sont différenciés, dans la quatrième étape, divers types de 
sous-classes spécifiques.

La cinquième étape réside dans la catégorisation thématique des données.
L'hypothèse est que certaines techniques de catégorisation automatiques 
peuvent être utilisées afin d'identifier l'organisation thématique des 
documents. Sur les sous-classes lexicales différenciées (étape 4) 
peuvent être appliquées diverses techniques de catégorisation. 
Traditionnellement (Sebastiani, 1999, 2003; Jackson et Moulinier, 2002),
la catégorisation consiste à attribuer une catégorie aux domaines 
d'information à partir d'un ensemble prédéfini de catégories. Cette 
catégorisation associe une étiquette catégorielle à chaque sous-classe 
lexicale différenciée. Ce prédicat peut soit résumer le contenu 
signifiant (catégorie descriptive), soit en définir la fonction 
(catégories fonctionnelles). Cette technique de catégorisation requiert 
de prendre le vecteur représentant chaque classe et de le comparer à un 
gabarit (l'ensemble des catégories prédéfinies). Ceci peut se faire de 
trois manières. Une première méthode est manuelle : c'est l'analyste 
qui, en fonction de son répertoire propre, attribue la catégorie à 
assigner. La catégorisation manuelle est un technique classique dans le 
domaine de l'analyse de contenu. Une seconde est automatique : les 
vecteurs des sous-groupes sont comparés (par un calcul de similarité) à 
une définition (en extension) d'une liste catégorielle ou d'un plan de 
classification, c'est-à-dire un ensemble de catégories prédéfinies. Une 
troisième approche procède par apprentissage : l'analyste assigne des 
catégories sur des échantillons de textes et le système les redistribue 
sur les items lexicaux ayant des contextes similaires. Dans cette 
présentation, nous présenterons les avantages et les inconvénients de la
catégorisation manuelle et de la catégorisation par apprentissage. Nous 
présenterons aussi une technique de catégorisation thématique fondée sur
l'extraction automatique des catégories à partir des documents traités, 
car, comme l'ont souligné entre autres Louwerse et van Peer (2002, p.4),
les index thématiques (catégories thématiques prédéfinies) posent
plusieurs problèmes : "The index was conceived to be a practical 
reference, but trying to classify tales in the [...] index proved 
problematic." Afin de dépasser les limites de la catégorisation manuelle
et automatique effectuée à partir d'ensembles de catégories thématiques 
prédéfinies, nous exploitons certains outils statistiques permettant de 
faire émerger les catégories thématiques à partir des documents 
analysés. Cette méthode consiste à appliquer certains critères 
statistiques utilisés dans les domaines du repérage de l'information 
(pondération distribuée, tf·idf, taux d'information, entropie, etc.)
(Salton, 1989) à chacune des sous-classes lexicales différenciées afin 
d'identifier au sein de chacune de ces sous-classes les termes les plus 
significatifs pouvant (suite à une évaluation de l'utilisateur) servir 
d'étiquette thématique pour la découverte des principaux thèmes d'un 
corpus.

La sixième étape réside dans la projection des catégories thématiques 
sur le texte. Une fois la catégorisation thématique effectuée, chaque 
domaine d'information peut se voir étiquetée automatiquement avec les 
étiquettes thématiques. Le texte est alors soumis à des analyses 
classiques soit qualitatives (regroupements, listes, arbres, graphes, 
etc.) soit quantitatives (statistiques, etc.), mais, cette fois, ce sont
les catégories thématiques qui en sont l'objet.

La septième étape réside dans la découverte, la navigation et la 
visualisation des thèmes identifiés. Pour assister l'analyse et 
l'interprétation des résultats, il est de plus en plus utile d'offrir 
aux analystes des moyens de visualiser de manière ergonomique ces 
classes et les relations entre les thèmes. Ce sont, comme le dit Barry 
(1998), des "mind mapping tools" ou des cartographies cognitives du 
contenu thématique des textes. Diverses technologies commencent à 
apparaître pour assister ce type d'analyse (Spence, 2000; Fayyad, 
Grinstein et Wierse, 2001). Cette dimension ergonomique de 
représentation est un atout précieux dans le soutien de l'activité 
interprétative du chercheur. À cet égard, nous verrons comment des 
méthodes de représentation simples basées sur la norme d'encodage XML 
permettent de représenter graphiquement les résultats obtenus à des fins
de navigation thématique.

Comme nous l'avons mentionné, nous présenterons donc deux méthodes 
informatiques inspirées de l'architecture présentées précédemment. La 
première méthode est fondée sur des recherches dans le domaine de 
l'analyse de contenu. La seconde s'inspire de plusieurs travaux 
provenant, entre autres, des domaines du repérage de l'information et 
de l'intelligence artificielle. Cette seconde méthode implique des 
processus de classification et de catégorisation automatiques des 
documents. Nous verrons, d'ailleurs, que les processus de classification
et de catégorisation automatiques des données textuelles s'avèrent très 
efficaces afin d'assister l'identification des thèmes et la navigation 
hypertextuelle entre ces derniers. Nous verrons que ces deux approches 
se distinguent cependant par le niveau d'automatisation qu'elles 
proposent.

Dans la troisième partie de notre exposé, nous présenterons et
comparerons les résultats obtenus suite à l'application de deux méthodes
présentées précédemment. Le corpus employé pour illustrer ces 
applications est composé d'articles scientifiques en langue française 
dans le domaine du traitement et de l'analyse statistique des données 
textuelles. Plus spécifiquement, il s'agit d'un corpus composés des 
actes des congrès JADT 2000, 2002 et 2004.

Références

Barry, C. A. 1998. "Choosing qualitative data analysis software: 
   Atlas/ti and Nudist compared". Sociological Research Online, vol. 3, 
   no 3. www.socresonline.org.uk/socresonline/3/3/4.html.
Cavnar, W. B. et Trenkle, J. M. 1994. "N-gram-based text
   categorization". In Proceedings of SDAIR-94, Las Vegas, Nevada, 
   U.S.A., April 1994. UNLV Publications/Reprographics, pages 161-175.
Fayyad, U., Grinstein, G. G. et Wierse, A. (dir. publ.). 2001.
   Information visualization in data mining and knowledge discovery. 
   San Francisco: Morgan Kaufmann Publishers.
Jackson, P. et Moulinier, I. 2002. Natural Language Processing for 
   Online Applications,: Text Retrieval, Extraction, and Categorization.
   Amsterdam : John Benjamins Publishing Company.
Jacquemin, C. 2001. Spotting and Discovering Terms through NLP.
   Cambridge (Mass.) : MIT Press.
Kastberg Sjöblom, M. et Brunet, E. 2000. La thématique. Essai de 
   repérage automatique dans l'oeuvre d'un écrivain. In Rajman, M. et 
   J.-C. Chappelier (dir. publ.). Actes des 5ièmes Journées
   internationales d'Analyse statistique des Données Textuelles (JADT).
   Lausanne, 9-11 mars 2000, vol. 2, p. 457-466. Lausanne : EPFL.
Kintsch, W et Van Dijk, T. A. 1978. Toward a model of text comprehension
   and production. Psychological Review, vol. 85, no 5, p. 363-394.
Kohonen, T. 2001. Self-Organizing Maps. Berlin : Springer
Louwerse, M. et van Peer, W. (dir. publ.). 2002. Thematics : 
   Interdisciplinary Studies. Amsterdam : John Benjamins Publishing
   Company.
Mani, I. et Maybury, M. T. (Dir. publ.). 1999. Advances in automatic 
   text summarization. Cambridge (Mass.) : MIT Press.
Manning, C. D. et H. Schütze. 1999. Foundations of statistical natural 
   language processing. Cambridge (Mass.) : MIT Press.
Moens, M.-F. 2000. Automatic indexing and abstracting of document texts.
   Boston : Kluwer Academic Publisher.
Roy, T et Beust, P. 2004. ProxiDocs : un outil de cartographie et de 
   catégorisation thématique de corpus. In Purnelle, G., Fairon, C., et 
   Dister, A. Le poids des mots : Actes des 7e Journées internationales 
   d'Analyses statistique des Données Textuelles (JADT). 10-12 mars 
   2004, Louvain-la-Neuve : Presses Universitaires de Louvain, Volume 2,
   p. 978 à 986.
Rossignol, M. et Sébillot, P. 2002. Automatic generation of sets of
   keywords for theme characterization and detection. In Morin, A. et 
   Sébillot, P (dir. publ.). Actes des 6ièmes Journées internationales 
   d'Analyse statistique des Données Textuelles (JADT). Saint-Malo, 
   13-15 mars 2002, vol. 2, p. 185-196. Saint-Malo : IRISA/INRIA.
Ruiz, E. et Srinivasan, P. 1998. Automatic text categorization using 
   Neural Networks. In Efthimiadis, E. (Dir. publ.). Advances in 
   classification research, vol. 8 : Proceedings of the 8th ASIS SIG/CR 
   classification research workshop. New Jersey : Information Today, 
   pp. 59-72.
Salton, G. 1989. Automatic Text Processing. 
   Reading (Mass.) : Addison-Wesley.
Sebastiani, F. 1999. A tutorial on automated text categorisation. In 
   Amandi, A. et Zunino, A. (dir. publ.). 1999. Proceedings of ASAI-99, 
   Buenos Aires. p. 7-35.
Sebastiani, F. 2002. Machine learning in automated text categorization. 
   ACM Computing Surveys, vol. 34, no 1, p. 1-47.
Sebastiani, F. 2003. Text Categorization. In Zanasi, A. (dir. publ.). 
   Text Mining and its Applications. Southampton : WIT Press.
Spence, R. et Press, A. 2000. Information visualization. 
   Boston : Addison-Wesley.
Staab, S. and R. Studer. 2004. Handbook on ontologies. 
   Berlin ; New York : Springer-Verlag. 
Van Dijk, T. A. 1972. Some aspects of text grammars. A study in 
   theoretical linguistics and poetics. The Hague : Mouton.
Van Dijk, T. A. et Kintsch, W. 1983. Strategies of discourse 
   comprehension. New York : Academic Press.
			____________________

Smaïl Djaoud (Université de Paris X Nanterre)
	Etude thématique et dialectique de "La sociologie de l'Algérie" 
	(Pierre Bourdieu, Paris, PUF, "Que sais-je ?" 1961) :
	"La sociologie de l'Algérie" et les avatars de l'épistémologie 
	coloniale

Ce travail vise à montrer, d'une part, comment un texte reçoit des 
interprétations et des sens inédits dés qu'il est trempé dans un nouveau
corpus et, d'autre part, comment, au-delà des thèmes investis, la 
composante dialectique joue un rôle capital dans la constitution des 
concepts et des explications mais aussi et surtout de la doxa en 
sciences humaines. Le cas de Bourdieu nous a servi à illustrer cela tout
en le mettant en relation avec lui-même dans sa production tardive, avec
d'autres sociologues maghrébins et surtout avec les textes de l'école 
dite "d'Alger". 

Avec "La sociologie de l'Algérie" de Pierre Bourdieu, publiée en 1958, 
on amorce une nouvelle phase dans les recherches sur le Maghreb. Elle se
présente comme le condensé d'un travail plus approfondi que l'auteur a 
mené au cours de ses enquêtes ethnologiques, dans des circonstances 
difficiles et parfois dramatiques, en Kabylie et ailleurs. Malgré le 
contexte colonial général où elle a été produite et malgré la guerre 
d'Algérie qui était à son point culminant, elle constitue à plus d'un 
titre une rupture par rapport à ce qui se faisait jusque là. 
Politiquement, en s'opposant à sa compatriote Germaine Tillion, le jeune
sociologue dénonce avec la plus froide objectivité les conséquences de 
ce qu'il appelle tantôt une "déculturation ", tantôt une "désagrégation 
culturelle". "Expérience catastrophique de chirurgie sociale, 
conclut-il, la guerre a fait table rase d'une civilisation dont on ne 
pourra plus parler qu'au passé." (P.123). Scientifiquement, il s'insurge
dans le détail de l'explication contre l'évolutionnisme ambiant qui a 
fait les beaux jours de l'ethnologie coloniale. C'est l'une des rares 
fois où, sans hésitation aucune, les termes de "civilisation algérienne"
et de "civilisation nord-africaine" sont employés. 
 
Sans vouloir troubler à tout prix les évidences les plus indiscutées, 
la question que l'on voudrait poser ici est la suivante : si "La 
sociologie " a réussi à remettre en doute et l'évolutionnisme précédent 
et l'idéologie de l'Occidental supérieur qui l'a souvent inspiré (dans 
le cas du Maghreb colonisé en tous les cas), est-elle allée jusqu'à 
contester les fondements implicites de la doxa épistémique coloniale ?  
En d'autres termes, le dépassement d'une "école", d'une idéologie,  
suffit-il pour ébranler une doxa en matière de savoir ? L'hypothèse est 
d'autant moins gratuite que, d'une part, la bibliographie du livre ne 
mentionne que des travaux d'histoire et d'ethnologie coloniales et, 
d'autre part, l'auteur ne s'en cache pas quant au but de son 
entreprise :

 "J'ai commencé à connaître l'Algérie par les livres. Il y avait une 
  sociologie et une ethnologie coloniales dans lesquelles il y avait 
  beaucoup de choses détestables, mais aussi des choses pas mal. Mais ce
  qui manquait c'était une théorie moderne. Mon but a été de donner une 
  vision juste scientifiquement, avec les instruments modernes de la 
  sociologie et de l'ethnologie, de cette réalité algérienne, en 
  m'appuyant sur des travaux...Alors il y avait des travaux détestables"
  				(Awal, 2003 : 232)

Toute la question reste donc de savoir si le dépassement des ces 
"travaux détestables", pour la plupart issus de "l'école d'Alger" et de 
ses ancêtres intellectuels, a été effectif et complet.

L'investigation sémantique du texte mais aussi celle des corpus qui 
l'entourent permet d'apprécier la doxa d'une époque de production. Elle 
montre dans ce cas que derrière la densité des explications et des 
développements, derrière l'apparence désordonnée des détails et des 
descriptions, se tient une véritable ossature narrative qui donne au 
texte toute sa cohérence. Ce récit en filigrane met en scène la lutte 
acharnée de deux acteurs, l'homme et l'environnement, et met aux prises 
leurs deux univers sémantiques différents mais très liés : celui de la 
nature et celui de la tradition. L'histoire dialectique qui s'étend sur 
toute la longueur de cette étude révèle une véritable luxuriance 
événementielle car elle met en oeuvre une quantité importante de 
fonctions qui, de prime abord, se présentent toutes comme des segments 
de théorie sociologique. Le récit effectue en effet un brassage narratif
de phénomènes aussi éloignés les uns des autres que la solidarité 
agnatique, le maraboutisme, la condition de la femme, la magie, 
l'indivision des terres, les rites.

D'une part, cette lecture conduit à discerner du narratif au coeur même 
de l'explication sociologique, non pas à l'endroit où le chercheur 
présente, pour des raisons pédagogiques, les résultats de sa recherche 
comme un récit attrayant, mais précisément au sein même de l'appareil 
explicatif : là où justement il croit expliquer, il raconte.

D'autre part, pour revenir à la doxa, la description à la fois de ce 
récit filigrané et des réseaux sémémiques qu'il engendre nous apprend 
que, malgré tous les dépassements qu'opère La sociologie de l'Algérie, 
malgré sa situation à l'antipode de "l'Ecole d'Alger", elle s'est
montrée impuissante à aller au-delà d'une conception de nature
écologique et plus particulièrement de ce que nous appelons le paradigme
écologique au fondement de la tradition pluridisciplinaire coloniale : 
dans ce paradigme que nous avons rencontré notamment en Histoire avec la
vision géographique de C-A. Julien ou de E-F. Gautier, ce qui façonne 
les hommes tient plus du relief et du climat que de l'histoire. Ce qui 
permet de conclure à cela c'est l'omniprésence de ce duel narré entre 
l'homme et l'environnement, ainsi que sa finalité, la vie ou la survie. 
Ce sont aussi les parallèles souvent faits entre les univers des deux 
acteurs, de telle façon qu'on retrouve dans la molécule sémique de la 
Tradition pratiquement les mêmes traits sémantiques que ceux investis 
dans l'acteur Environnement. 

Moment culminant de cette "naturalisation" sémantique, quand le sémème 
'culture' se met à désigner non pas la culture, au sens ethnologique de 
constructions symboliques, mais la culture au sens d'exploitation de la 
terre, c'est-à-dire encore une fois de lutte contre le milieu naturel, 
et se retrouve de ce fait plus lié avec les 'céréales' qu'avec une 
quelconque formation culturelle. 

Par ailleurs, il y a également reprise et adaptation, non pas de la même
vision des historiens coloniaux, mais des mêmes principes de divisions 
ainsi que de la même volonté de susciter partout des "entités
conflictuelles et irréductibles" (Corm G, 2003). Ces oppositions ont pu 
ainsi être appliquées presque telles qu'elles dans le domaine 
sociologique malgré la transmutation disciplinaire : berbérisme / 
arabisme, montagne / plaine, autochtone / étranger, permanent / 
changeant, païen / islamique, etc.

Partant de là, ce qu'on a pu appeler le fonctionnalisme (ou le
culturalisme) chez le premier Bourdieu ne nous a pas paru être comme un 
"choix théorique" a priori ayant certaines conséquences sur le travail 
de terrain. C'est le "terrain" maghrébin, travaillé par tant
d'ethnologues coloniaux, qui a trouvé en le fonctionnalisme une théorie 
d'élection et non l'inverse (une théorie qui a trouvé un terrain 
d'élection pour une application exemplaire) ; par cette théorie, la 
tradition pluridisciplinaire qui faisait la part belle aux causalités 
les plus proches de la nature et des besoins élémentaires pour expliquer
les phénomènes sociaux et historiques les plus divers.
			____________________

Mathieu Valette (Atilf-Cnrs)
	De la sémantique des concepts à la veille conceptuelle

L'analyse sémantique d'un corpus constitué de textes théoriques en 
sciences humaines montre que les concepts sont, d'un point de vue 
textuel, des entités complexes qui, loin de se réduire à leur seule 
lexicalisation, s'actualisent à tous les niveaux de textualité. Ainsi, 
la lexicalisation d'un thème, qui aboutit à la formation du concept, 
aurait une incidence sur la conservation de ce thème parce qu'en le 
stabilisant, elle le fige. La richesse du concept n'est peut-être jamais
aussi grande que lorsqu'il n'a pas (encore) reçu de nom. Sa définition 
demeure alors enchâssée dans un réseau complexe d'expressions et de 
phraséologies. En bref, d'un point de vue textuel, non seulement un 
concept est susceptible de s'appauvrir lorsqu'il est nommé, mais il peut
également altérer sensiblement le contexte dans lequel il s'insère.

Par ailleurs, un concept ne se résume jamais, loin s'en faut, à une ou 
des définitions, ni même à un ensemble de gloses ; il est tributaire de 
ses réalisations dans le texte. Chacune en modifie la nature, de sorte 
que l'autonymie n'en est qu'un cas particulier. Par exemple, il suffit 
qu'une relation quelconque soit établie une fois entre deux concepts 
pour que celle-ci participe à sa nature, quand même cette relation n'est
pas à proprement dit définitoire.

Notre corpus d'étude est constitué de textes théoriques en sciences 
humaines (leçons de linguistique de Gustave Guillaume). Ce choix a été 
notamment déterminé par (i) la grande textualité inhérente à ce type de 
production de connaissance ; (ii) leur richesse conceptuelle 
intrinsèque ; (ii) la possibilité de les aborder en diachronie, 
c'est-à-dire génétiquement, en respectant l'ordre de production des 
articles, essais, conférences, etc. de l'auteur choisi. Notre recherche 
a pour objectif la description des phénomènes de conceptualisation 
(caractérisation, typologie, modélisation). Elle intéresse certains 
domaines de l'ingénierie des connaissances (représentation des
contenus). Elle ouvre également la voie à des travaux de type "veille 
conceptuelle".
			____________________

Céline Poudat (Université d'Orléans)
	Les concepts en linguistique et leur représentation

La présente communication porte sur les concepts linguistiques et leur 
représentation dans un corpus de 224 articles de revues linguistiques 
essentiellement publiées autour de 2000.

Supposés constituer un mode d'accès privilégié aux thèmes scientifiques 
linguistiques, les substantifs au singulier et au pluriel les plus 
représentés ont d'abord été extraits. Bien qu'on relève trois fois plus 
de candidats concepts au singulier qu'au pluriel (76,21% sg. vs. 23.78% 
pl.), certains substantifs, comme "mots" ou "conditions" semblent 
résolument pluriel, tandis que d'autres, comme "exemple(s)" ou 
"enfant(s)" paraissent plus indéterminés en nombre.

Après avoir écarté de l'analyse les substantifs relevant de la 
méthodologie scientifique générale, c'est-à-dire de la typologique (e.g.
cas, type), la logique (relation, rapport) ou la démonstration 
(exemple), et des spécificités de la linguistique et de ses objets 
(forme, fait), ce sont douze entrées de fréquence élevée qui ont été 
retenues : sens, interprétation, langue, discours, parole, langage, 
texte, corpus, interprétation, contexte, cotexte et énonciation.
Si l'on définit un thème sémantique comme "un groupement structuré de 
sèmes" (Rastier, 2001, p. 38), ce dernier peut être décrit à travers les
récurrences observées statistiquement, qui sont l'indice de récurrences 
sémantiques.

Outre les cooccurrents-mots des candidats-thèmes sélectionnés, nous 
avons examiné leurs corrélats morphosyntaxiques à partir d'un ensemble 
de 136 variables adapté aux spécificités du discours scientifique 
(Poudat, 2004).

L'analyse de ces corrélats nous a permis de caractériser et de préciser 
la nature des thèmes linguistiques observés et d'opposer différents 
types de thèmes, correspondant à des degrés distincts de
conceptualisation linguistique. Nous proposerons un ensemble de critères
utiles à cette entreprise typologique, par exemple le niveau 
d'homogénéité des corrélats en termes de sous-domaines linguistiques.

Bibliographie sélective

LOISEAU, Sylvain. "Thématique et sémantique conceptuelle d'un concept 
   philosophique" in Williams, G (dir.). La linguistique de corpus.
   Presses Universitaires de Rennes, Rennes, 2005.
POUDAT, Céline. "Une annotation de corpus dédiée à la caractérisation du
   genre de l'article scientifique" in Workshop TCAN Construction du 
   Savoir Scientifique dans la Langue, Maison Alpes des Sciences 
   Humaines, 20-21 octobre 2004.
RASTIER, François. Arts et sciences du texte. Paris, PUF, 2001.
RASTIER, François. Sémantique interprétative. Paris, PUF, 1987.
			____________________

François Rastier (Cnrs)
	Pour une typologie des discours théoriques

Après une mise au point sur le statut des textes théoriques, on aborde 
leur typologie pour chercher à caractériser leur textualité propre. Le 
problème de la mimésis théorique permet d'interroger notamment la 
structure de l'article scientifique et son hétérogénéité sémiotique.

L'étude des formes textuelles s'attache d'abord à la formation et à 
l'évolution des concepts, puis s'étend aux formes globales de la 
dialectique. Elle conduit à une typologie des univers sémantiques 
propres aux discours scientifique et philosophique.

La question du texte scientifique reste difficile à poser : la tradition
scientifique occidentale fait de la science une affaire de concepts et 
de termes, non de textes, car elle tient que l'objectivité est 
indépendante de la différence des langues et des normes textuelles. Le 
développement de la linguistique de corpus permet cependant depuis peu 
d'explorer les caractéristiques propres des textes scientifiques. Elle 
pourra véritablement les restituer à condition de disposer d'une 
conceptualisation permettant la comparaison des discours, champs 
génériques et genres ; et aussi d'hypothèses informées, de façon à 
pouvoir unifier sous des propositions globales les observations de 
régularités partielles (définitions, marques de "polyphonie", etc.).
Au-delà du discours scientifique revendiqué comme tel, nous étendrons 
notre champ d'investigation à l'ensemble des discours théoriques. Leur 
étude relève de la linguistique comparée, dès lors qu'elle tient compte 
comme elle le doit de la dimension textuelle : elle s'assigne pour but 
de caractériser contrastivement les spécificités des discours et genres,
en comparant notamment les discours théoriques (sciences vs
philosophie), les discours scientifiques entre eux, enfin les genres au 
sein de chaque discipline.

Nous privilégierons ainsi la comparaison entre discours scientifique et 
discours philosophique, le discours littéraire servant au besoin de 
terme de comparaison. Certes, il peut sembler quelque peu abusif de 
mettre sur le même plan des discours aux objectifs différents et qui 
font tout pour se différencier : mais, outre que pour une sémantique des
textes tous les discours sont justiciables d'une étude contrastive, 
c'est là un moyen de mieux caractériser ce qui les distingue et 
d'éprouver les catégories descriptives. Nous chercherons enfin à 
contraster les régimes de textualité, tant globalement (par exemple pour
ce qui concerne la mimésis) que localement pour le statut des unités 
textuelles.

666666666666666666666666666666666666666666666666666666666666666666666666