CÉLINE POUDAT
Résumé : La présentation détaille les principes de fonctionnement et les modalités d'utilisation de quatre étiqueteurs morphosyntaxiques entraînables: Brill Tagger, MBT Tagger, TnT Tagger et TreeTagger.
CÉLINE POUDAT
Résumé : En tant que discipline empirique, la linguistique recourt à des observables sur lesquels s’adossent et se construisent ses théories. Dans ce processus, l’exemple joue un rôle crucial de donnée observable: afin de décrire la langue et les langues, c’est en effet sur des exemples que la linguistique fonde et valide ses hypothèses et ses interprétations, et tire ses conclusions. La présente communication se propose de mener une réflexion en corpus autour de l’exemple de linguistique. Après avoir présenté les quelques 2 000 exemples, extraits d’un corpus génériquement homogène, qui constitueront la base de notre analyse, nous en apprécierons la nature, non pas en termes subjectifs de pertinence ou de validité, mais en termes objectifs et quantifiés de représentation et de propriétés. Configuration optative du genre de l’article, l’exemple est en effet soumis à un régime de textualité et à un intertexte qui lui est propre et que nous nous efforcerons de restituer, tout en posant la question de l’observable et de l’objectivation linguistique.