Bill Winder
Les titres déchaînés de Maupassant — Les Titres déchaînés de Maupassant
Résumé : Dans ce travail, nous nous demandons ce qui relie formellement les nouvelles de Maupassant à leur titre. Pour nous assurer d’une démarche explicite, nous avons d’abord tenté de reformuler cette recherche dans les termes d’un problème informatique précis : à l’aide d’une analyse automatique de notre corpus de 294 nouvelles de Maupassant, l’ordinateur peut-il engendrer pour chaque texte le titre que Maupassant lui a donné ? Nous n’avons cependant pas pu aborder de front ce problème coriace, et nous avons dû nous contenter d’un autre problème plus simple, mais apparenté : quels algorithmes peuvent servir à aligner les titres du corpus sur leur texte ? Dans cette partie de notre travail, « Décomptes électroniques », nous étudions les fréquences lexicales simples des noms propres tirés du corpus des nouvelles de Maupassant publié dans le American Research on the Treasury of the French Language. Dans la deuxième partie de ce travail, « Traitement intelligent », nous nous servons du corpus de Maupassant téléchargeable à partir de l’Association des amis de Guy de Maupassant. Le texte électronique libre et les outils informatiques plus évolués qui sont disponibles sur Internet nous permettent de réaliser des analyses plus fines de la relation entre le titre et son texte et d’aborder l’alignement d’autres classes de mots, tels les noms communs. Ces deux parties constituent une réflexion sur la méthodologie du prétraitement interprétatif et servent à l’élaboration d’une base de données « intelligente » des nouvelles de Maupassant.
Abstract : In the present study we consider how Maupassant’s titles can be seen as formally aligned with their texts. To put our study in an explicit, formal framework, we first considered alignment as a computational problem: On the basis of the texts alone, could the computer generate the exact title Maupassant gave to each of the 294 stories in ourTitres déchaînés : décomptes électroniques 1/28Mots-clés :Titres, Maupassant, édition critique, méthodologie interprétative, informatiqueKeywords:Titles, Maupassant, critical edition, interpretative methodology, computingcorpus? That question proved computationally too challenging and we were forced to consider a related, but simpler question: What algorithms could we use to align Maupassant’s titles with their texts? In this first part of our study, “Electronic frequencies”, we evaluate the role of proper nouns in Maupassant’s short stories by extracting some simple lexical frequencies from the corpus at the American Research on the Treasury of the French Language. In the second part, “Intelligent text processing”, we use Maupassant’s short story corpus that can be freely downloaded from Association des amis de Guy de Maupassant. We can achieve a more precise analysis of the relation between the title and its text using open source electronic texts and enhanced computational tools that are freely available on the Internet. That enhanced computational platform allows us to consider the alignment of other word classes, such as common nouns. These two parts of our study constitute a reflection on the methodology of interpretative preprocessing and serve as the groundwork for an “intelligent” textual database of Maupassant’s short stories.
Pour citer ce document
BILL WINDER (2014) «Les titres déchaînés de Maupassant», [En ligne], Volume XIX - n°3 (2014). Coordonné par François Laurent,
URL : http://www.revue-texto.net/index.php/Parutions/Archives/Archives/index.php?id=3582.