Exploiter des données morphosyntaxiques pour l'étude statistique des genres -
Application au roman policier

Précédent :: Sommaire :: Suivant

II.  Etude de cas : le roman policier

B.  Le roman policier dans la continuité du roman sérieux

1.  Réseaux de variables corrélées

L'analyse des corrélations mesure la relation existant entre deux séries de données mises à l'échelle pour être indépendantes de l'unité de mesure. Le calcul de la corrélation d'une population renvoie la covariance de deux séries de données divisée par le produit de leur écart type :

L'analyse des corrélations permet de déterminer si deux plages de données varient conjointement, c'est-à-dire si les valeurs élevées d'une plage sont associées aux valeurs élevées de l'autre plage (corrélation positive), si les petites valeurs d'une plage sont associées aux valeurs élevées de l'autre plage (corrélation négative) ou bien si les valeurs des deux plages sont indépendantes (corrélation proche de 0).

L'analyse des corrélations que les trois groupes de variables « ponctuation-temps-personne » que nous avons définis entretiennent avec l'ensemble des variables va permettre de mieux voir à la fois les relations internes entre les éléments du trio et les variations qu'il représente à l'extérieur du groupe. Nous observons les corrélations suivantes :

A l'intérieur du groupe, certaines variables semblent être le signe d'un mode de discours particulier : ainsi, points d'interrogation et points de suspension sont liés à l'emploi de la deuxième personne du pluriel et aux phrases de dialogue.

% de points d'interrogation par rapport à l'ensemble des ponctuations :

% de verbes à la 2e personne du pluriel parmi l'ensemble des verbes conjugués (temps simples et composés)

0,57223

% de pronoms personnels à la 2e personne du pluriel parmi l'ensemble des pronoms personnels sujets

0,55446

% de pronoms possessifs à la 2e personne du pluriel par rapport à l'ensemble des mots

0,52475

% d'adjectifs interrogatifs par rapport à l'ensemble des déterminants

0,52298

nombre de phrases de dialogue

0,51548

% de points de suspension par rapport à l'ensemble des ponctuations :

% de points par rapport à l'ensemble des ponctuations

-0,36769

% de verbes à la 2e personne du pluriel parmi l'ensemble des verbes conjugués

0,23059

% de pronoms personnels à la 2e personne du pluriel parmi l'ensemble des pronoms personnels sujets

0,22424

% de pronoms possessifs à la 2e personne du pluriel par rapport à l'ensemble des mots

0,19994

A l'inverse, virgules et points-virgules semblent être du côté de la description ou de l'argumentation, avec une corrélation forte avec la présence d'adverbes et d'adjectifs et l'allongement des phrases. On ne s'étonnera pas, dans ces conditions, que la moindre présence des points-virgules soit en premier lieu corrélée avec une date de parution proche des origines du genre et antérieure à 1950.

% de points-virgules par rapport à l'ensemble des ponctuations :

date de parution

-0,49586

% d'adjectifs démonstratifs par rapport à l'ensemble des mots

0,29785

% d'adverbes précédant un adjectif parmi l'ensemble des adverbes

0,28081

moyenne adjectifs/proposition

0,2712

% de virgules par rapport à l'ensemble des ponctuations :

% de points par rapport à l'ensemble des ponctuations

-0,69044

moyenne mots/phrase

0,63946

moyenne mots/proposition

0,49488

% de noms communs appartenant à des sous-groupes nominaux parmi l'ensemble des substantifs

0,38824

% de points d'interrogation par rapport à l'ensemble des ponctuations

-0,37783

moyenne adjectifs/proposition

0,37095

moyenne mots/paragraphe

0,36425

% de verbes au présent par rapport à l'ensemble des verbes conjugués (temps simples et composés) :

% de verbes à l'imparfait par rapport à l'ensemble des verbes

-0,88469

% de verbes au passé simple par rapport à l'ensemble des verbes conjugués

-0,72012

% de verbes au plus-que-parfait par rapport à l'ensemble des verbes conjugués

-0,66472

% de verbes à l'impératif par rapport à l'ensemble des verbes conjugués

0,39729

% de verbes à la 3e personne du singulier parmi l'ensemble des verbes conjugués

-0,3795

% de verbes au futur par rapport à l'ensemble des verbes conjugués

0,37178

D'autre part, passé simple et passé composé sont liés à la 3 e personne du singulier pour le premier, et à la 1 re personne du singulier pour le second ; on retrouve la partition déjà évoquée entre un style oral au passé composé opposé à une écriture plus descriptive au passé simple, liée à l'emploi de temps complexes (passé et futur antérieur en particulier).

% de verbes au passé simple par rapport à l'ensemble des verbes conjugués (temps simples et composés) :

moyenne lettres/mot

0,53518

% de mots courants par rapport à l'ensemble des mots

0,47871

% de verbes à la 3e personne du singulier parmi l'ensemble des verbes conjugués

0,47774

% de pronoms possessifs à la 3e personne du singulier par rapport à l'ensemble des mots

0,4335

% des verbes intransitifs parmi l'ensemble des verbes

0,42092

% de verbes à l'imparfait par rapport à l'ensemble des verbes conjugués

0,41356

% de verbes au passé antérieur par rapport à l'ensemble des verbes conjugués

0,40553

% de verbes au passé composé par rapport à l'ensemble des verbes conjugués (temps simples et composés) :

% de verbes à la 1e personne du singulier parmi l'ensemble des verbes conjugués

0,59905

% de pronoms personnels à la 1e personne du singulier parmi l'ensemble des pronoms personnels sujets

0,57845

% de pronoms possessifs à la 1e personne du singulier par rapport à l'ensemble des mots

0,53969

% de verbes par rapport au total des mots signifiants (substantifs, adjectifs, verbes, adverbes)

0,45756

moyenne pronoms/proposition

0,41911

% de mots très courants par rapport à l'ensemble des mots

0,41045

% de verbes à la 1e personne du singulier parmi l'ensemble des verbes conjugués (temps simples et composés) :

% de pronoms personnels à la 1e personne du singulier parmi l'ensemble des pronoms personnels sujets

0,98499

% de pronoms possessifs à la 1e personne du singulier par rapport à l'ensemble des mots

0,94637

% de verbes à la 3e personne du singulier parmi l'ensemble des verbes conjugués (temps simples et composés)

-0,91388

% de pronoms possessifs à la 3e personne du singulier par rapport à l'ensemble des mots

-0,84982

% de verbes au passé composé par rapport à l'ensemble des verbes conjugués (temps simples et composés)

0,59905

moyenne pronoms/proposition

0,56019

% de pronoms parmi l'ensemble des sujets

0,52719

% de verbes à la 2e personne du singulier parmi l'ensemble des verbes conjugués (temps simples et composés) :

% de pronoms personnels à la 2e personne du singulier parmi l'ensemble des pronoms personnels sujets

0,95385

% de pronoms possessifs à la 2e personne du singulier par rapport à l'ensemble des mots

0,82161

% de verbes à l'impératif par rapport à l'ensemble des verbes conjugués (temps simples et composés)

0,45305

Ces réseaux de corrélations permettent de valider le choix des trois sous-groupes de variables ponctuation-temps-personne, et mettent à jour des réseaux d'opposition à l'intérieur du roman policier : dialogue / narration, narrateur homodiégétique / hétérodiégétique, mode perfectif / imperfectif. Si ces résultats ouvrent la voie d'une analyse plus détaillée à l'intérieur du genre policier, il importe de valider ces oppositions par une analyse opposant roman policier et roman sérieux sur la base de ces variables.

2.  Classer les variables pour classer les modes d'écriture

L'étude des corrélations sur les sous-groupes de variables ponctuation-temps-personne que nous avons exposée précédemment ouvre la voie d'une caractérisation de sous-genres à l'intérieur du roman policier en définissant des modes d'écritures particuliers. L'utilisation de l'outil de classification de StatLab appliqué à ces variables, sur l'ensemble des romans policiers, permet de montrer ces différents modes.

Dans la vue synthétique que nous offre le dendrogramme ci-dessous, les numéros renvoient à la numérotation des variables présentée en annexe (des contraintes techniques nous obligeaient à identifier les variables par des numéros et non par leur nom).

Dans cette présentation, que nous avons tronquée, les deux branches supérieures se rejoignent à la valeur 10 ; trois groupes de variables s'y dessinent :

Il est à noter dans la classification ci-dessus que les temps majeurs sont rassemblés dans les deux premiers groupes, tandis que le troisième groupe n'en contient pas, sinon le futur. Par ailleurs, le fait que les groupes se forment dans le bas du dendrogramme (aux alentours de l'indice 1 sur une échelle de 1 à 10) laisse penser qu'il n'est pas possible de créer des groupes de variables forts représentant des groupes d'individus, mais que chaque roman intègre de manière fine tous ces éléments.

Les résultats de l'analyse en composantes principales portant sur tous les romans et ce même groupe restreint de variable paraît aller dans ce sens. Le tableau des « valeurs propres » de cette A.C.P., qui montre la représentativité de chaque axe, indique qu'aucun axe ne se détache particulièrement, avec un cumul avoisinant les 70 % n'apparaissant qu'au niveau du dixième axe seulement :

L'examen des contributions des variables au poids des quatre premiers axes ébauche de manière plus fine qu'avec le dendrogramme des groupes de variables cohérents ; nous obtenons ainsi pour les contributions les plus importantes en valeur absolue :

Axe1

% de verbes au présent

-0,37749

 

% de verbes à l'imparfait

0,35671

 

% de verbes au plus-que-parfait

0,32795

 

% de verbes au passé simple

0,3068

 

% de verbes à la 3 e personne du singulier

0,29485

Axe 2

% de verbes à la 2 e personne du pluriel

0,32449

 

% de verbes au subjonctif plus-que-parfait

0,3067

 

% de verbes au futur

0,29079

 

% de points d'exclamation

0,26818

 

% de verbes au subjonctif imparfait

0,25644

 

% de verbes à l'impératif

0,25422

Axe 3

% de verbes à la 1 re pers. du singulier

-0,35777

 

% de verbes au subjonctif passé

-0,31925

 

% de verbes au subjonctif présent

-0,31739

 

% de verbes au conditionnel passé

-0,30403

 

% de verbes à la 3 e pers. du pluriel

0,29031

 

% de verbes au passé composé

-0,27905

Axe 4

% de verbes au conditionnel passé

0,47975

 

% de verbes à la 2 e pers. du singulier

-0,43615

 

% de verbes à la 1 re pers. du singulier

0,34633

 

% de tirets

-0,32884

 

% de points-virgules

0,28822

Le premier groupe s'apparenterait plutôt au récit classique (passé simple, 3 e pers. du singulier), le deuxième, étrange mélange, au dialogue précieux et impérieux (2 e pers. du pluriel, impératif, mais aussi temps complexes) ; à partir des deuxième et troisième groupe, nous éprouvons plus de difficultés à interpréter les résultats, et les groupes correspondent peu aux schémas d'analyse littéraire classiques appliqués au roman policier.

Cette difficulté à cerner l'importance de telle ou telle variable au sein d'un jeu restreint dont nous avons par ailleurs montré la validité atteste sans aucun doute qu'une vision globale du roman policier n'est plus à ce stade possible, et qu'il est nécessaire de dessiner au sein de cet ensemble des sous-groupes. Pour cela, il faut introduire une nouvelle dimension dans l'analyse, celle de l'évolution du genre.

3.  Etude diachronique : autonomisation et division du genre policier

L'étude de l'évolution du trio de classes de variables que nous avons sélectionné nous invite à étudier l'évolution et la dispersion du genre au fil du temps. Pour cela, nous allons étudier plus en détail les variations concernant les verbes, c'est-à-dire les temps et les personnes employés, qui nous renseignent sur les modes de narration utilisés ; nous nous intéressons particulièrement au singulier, qui est le nombre du narrateur, par opposition au pluriel qui est celui des « autres », en laissant de côté la 1 re personne du pluriel qui reste très minoritaire dans l'ensemble des romans et semble liée aux passages dialogiques. Le graphique ci-dessous, où chaque point représente un individu, montre l'évolution de l'emploi du singulier en fonction de la date de parution [8]  :

Nous constatons que si le « je » n'est pas l'apanage du roman contemporain, il prend à partir de 1950 une part importante dans certains ouvrages, dépassant les 20 % de l'ensemble des verbes conjugués ; la quasi-symétrie horizontale que l'on peut observer entre première et troisième personne semble indiquer que c'est bien au détriment du « il » que le « je » s'impose, et qu'il traduit bel et bien un mode narratif plus qu'une proportion particulièrement importante de dialogues. La présence de ces derniers est bien plus fidèlement exprimée par le « tu », dont on observe une présence grandissante au fil du temps.

L'étude de l'emploi des temps en fonction de la date de parution des romans vient compléter l'analyse des personnes verbales, en montrant des ruptures chronologiques fortes. Si l'on examine l'évolution de la présence des temps de la narration, et qui occupent des parts importantes dans les temps employés, à savoir le présent (46 %), l'imparfait (18 %), le passé simple (13 %) et le passé composé (7 %), on distingue qu'une rupture se fait à partir de 1960-1970 ; nous avons figuré cette rupture dans les graphiques ci-dessous par une ligne horizontale.

Nous savons que ces variations sont corrélées entre elles, puisqu'il s'agit toujours de pourcentages exprimant la répartition des temps, où un déficit ici profite à une ou plusieurs autres variables là. Nous avons également vu à travers l'analyse des corrélations que ces variations sont liées : on observe ainsi une scission entre une branche qui continue avec stabilité sur la lancée du roman de la première moitié du siècle, roman policier encore proche du roman sérieux, et une autre qui se détache de manière très nette et dont les caractéristiques sont, par rapport à la première, une valorisation du présent et, dans une moindre mesure, du passé composé, et un abandon du passé simple et de l'imparfait.

Cette séparation correspond sans aucun doute à ce que l'on a appelé le « néo-polar », qui naît dans les années 1970 et dont le père fondateur est Jean-Patrick Manchette. Ce dernier, que l'on a associé à l'esprit des « situationnistes » de mai 1968, est le père revendiqué par cette nouvelle génération d'écrivains. Il inaugure une écriture à la fois très politisée, ancrée fortement dans la mouvance anarchiste, et « behavioriste », c'est-à-dire très neutre et descriptive, qui a influencé de nombreux auteurs par la suite, comme Patrick Raynal, Jean-Bernard Pouy ou Maurice Dantec. Les statistiques dont nous disposons reflètent cette évolution tout autant qu'elles la caractérisent stylistiquement ; elles montrent la diversité et les évolutions d'un genre qui a pu à première vue paraître monolithique, et ouvrent la voie d'une étude plus fine et plus profonde à l'intérieur du roman policier.

Précédent :: Sommaire :: Suivant