Résumé : La linguistique de corpus ne sera, selon toute vraisemblance, jamais établie en discipline académique. Aujourd’hui, nombre de linguistes, quels que soient leur discipline ou leurs objets d’étude, sont conduits à constituer des corpus numériques et à les étudier au moyen d’outils logiciels chaque année plus nombreux, sophistiqués et conviviaux. La banalisation de l’outil désenclave ainsi des pratiques longtemps réservées à une petite minorité que l’informatique ne rebutait pas.
Mais cette évolution technologique, si elle peut avoir une incidence méthodologique (par exemple et minimalement, en substituant aux exemples construits des exemples attestés), n’a pas pour autant un impact fort sur les théories ni sur la définition des objets de la linguistique : à la morphologie, les corpus de mots ; à la syntaxe, les corpus de phrases ; aux théories énonciatives, les corpus d’énoncés. Et bien que tous ces objets d’étude proviennent de textes, ceux-ci ne sont que rarement considérés comme objet de science dans ces contextes disciplinaires. Ils sont réduits, par défaut, au statut préscientifique de ressource – un matériau brut dont la qualité est déterminée par la seule présence, après raffinage, de l’objet étudié. On collecte ainsi de l’indénombrable : du texte ou du corpus.
Déjà publié dans Syntaxe & Sémantique, n°9, 2008, p. 9-14.
Pour citer ce document
MATHIEU VALETTE (2009) «Pour une science des textes instrumentée», [En ligne], Volume XIV - n°1 (2009). Coordonné par Évelyne Bourion.,
URL : http://www.revue-texto.net/index.php/http:/www.revue-texto.net/1996-2007/archives/parutions/archives/parutions/archives/parutions/parutions/archives/parutions/parutions/parutions/archives/parutions/archives/Parutions/Marges/docannexe/file/2363/docannexe/file/2345/docannexe/file/Archives/Parutions/Parutions/Parutions/Archives/css/index.php?id=2096.