Exploiter des données morphosyntaxiques pour l'étude statistique des genres -
Application au roman policier

Précédent :: Sommaire

[1] Rastier F., Sémantique pour l'analyse , Masson, 1994, p.174.

[2] Ibid. , pp. 185-186.

[3] Voir « Web-Specific Genre Visualization » et « Genres defined for a Purpose, Fast Clustering, and an Iterative Information Retrieval Interface », parus en 1998, pour la description précise de ce logiciel .

[4] « Stylistic items can be found on any level of linguistic abstraction : lexical, syntactic, or textual ; each is of little importance in itself, but taken together their variation indicates systematic differences » (Karlgren et al. , « Web-Specific Genre Visualization », 1998)

[5] « We propose a theory of genres as bundles of facets , which correlate with various surface cues, and argue that genre detection based on surface cues is as successful as detection based on deeper structural properties. » (Kessler et al. , « Automatic Detection of Text Genre », 1997).

[6] «  We widely use the term "genre" here to refer to any widely recognized class of texts defined by some common communicative purpose or other fonctional traits, provided the function is connected to some formal cues or commonalities and that the class is extensible . » (ibid. )

[7]   Obtenu par le calcul 100*(Vp-Vs)/Vs où Vp et Vs désignent la valeur de la variable pour le roman policier et le roman sérieux

[8] Le graphique nous montre également la place écrasante qu'occupent les romans parus au cours des 10 dernières années ; on prendra garde de tenir compte de cette sur-représentation, qui tient plus à la constitution du corpus qu'à la réalité de l'édition de romans policiers, dans l'interprétation.

[9]    Nous n'avons pas fait figurer les noms des variables dans l'A.C.P. portant sur tous les individus pour des raisons de lisibilité ; leur disposition est identique à celle de l'A.C.P. portant sur les « individus-auteurs ».

[10] Ici encore, nous ne conservons que les variables dont la valeur est significative, pour les mêmes raisons que précédemment.

[11] Tzvetan Todorov, dans Poétique de la prose , Seuil, Paris, 1971.

[12] Dans le dendrogramme, nous avons isolé la branche concernant les romans de Manchette, qui  rejoignent le reste de l'arbre à sa racine

[13] Nous avons séparé pour des raisons de lisibilité les variables et les individus, et nous n'avons pas mentionné, dans la « loupe », toutes les variables mais les plus significatives.

Précédent :: Sommaire