Résumé : Cet article propose un panorama des usages du Web en linguistique de corpus. À travers une présentation de différents travaux, il aborde les considérations méthodologiques et techniques, en mettant en avant les difficultés que rencontrent les linguistes face à cette source particulière de données langagières. En prenant exemple sur des travaux menés sur l’acquisition de données en morphologie extensive, je discute le statut des données, ainsi que de la position peu confortable dans laquelle les moteurs de recherche placent les chercheurs, et la façon dont ils doivent en permanence s’adapter à un matériau irremplaçable mais difficile d’accès.
Pour citer ce document
LUDOVIC TANGUY (2013) «La ruée linguistique vers le Web», [En ligne], Volume XVIII - n°4 (2013). Coordonné par François Laurent,
URL : http://www.revue-texto.net/index.php/http:/www.revue-texto.net/1996-2007/archives/parutions/archives/parutions/marges/docannexe/file/4227/docannexe/file/1583/docannexe/file/3873/docannexe/file/parutions/archives/sdt/docannexe/file/3477/docannexe/file/2346/docannexe/file/2346/docannexe/file/Archives/Archives/Parutions/Parutions/Parutions/Parutions/Marges/index.php?id=3335.