Des chercheurs ont découvert comment déterminer le succès d’une œuvre littéraire

Recherche

Un groupe de chercheurs en informatique de l’Université Stony Brook à New York a développé un algorithme permettant d’analyser un livre afin de prédire si celui-ci sera un succès commercial.

En appliquant la stylométrie, une technique à la croisée de la linguistique et de la statistique qui vise à identifier le style d’un texte, ces derniers affirment atteindre un taux d’efficacité de 84%.

L’algorithme a été développé à partir de classiques de la littérature, téléchargés des archives du projet Gutenberg, et de l’information historique sur le succès de ces publications. Des livres plus modernes ont également été analysés.

Évidemment, puisqu’il s’agit d’une équipe américaine, l’analyse a été effectuée exclusivement sur des œuvres anglophones.

L’équipe s’est également intéressée aux romans qui n’ont pas su attirer la faveur de la critique, comme The Lost Symbol de Dan Brown, dont le succès commercial pourrait être attribuable à la réputation de l’auteur. Ce dernier a été intégré à la liste des livres ayant connu moins de succès afin de parfaire l’algorithme.

Les chercheurs ont établi un ensemble de facteurs déterminant le succès potentiel d’un roman, notamment la capacité du livre à être intéressant, son aspect novateur, le style de l’écriture, et à quel point son scénario peut être engageant pour le lecteur. Néanmoins, ceux-ci admettent que certains facteurs externes (comme la chance) peuvent également exercer une influence.

Les chercheurs ont fait des découvertes édifiantes. Ainsi, parmi les tendances observées dans les livres à succès, on remarque une forte propension à employer des conjonctions telles que «and» et «but», un grand nombre de noms, d’adjectifs, et de verbes qui décrivent le processus de pensée comme «recognised» ou «remembered».

De leur côté, les œuvres ayant remporté moins de succès ont tendance à comporter plus de verbes et d’adverbes, en plus de s’appuyer sur des mots qui décrivent explicitement des actions et des émotions comme «wanted», «took» ou «promised».

L’équipe s’est également intéressée aux romans qui n’ont pas su attirer la faveur de la critique, comme The Lost Symbol de Dan Brown, dont le succès commercial pourrait être attribuable à la réputation de l’auteur. Ce dernier a été intégré à la liste des livres ayant connu moins de succès afin de parfaire l’algorithme. Cependant, la majorité des œuvres qualifiées négativement a été déterminée par la liste des moins bons vendeurs sur Amazon.

«Prédire le succès d’œuvres littéraires pose un énorme dilemme auprès des éditeurs et des écrivains en herbes», a déclaré Yejin Choi, professeur adjoint et l’un des auteurs de l’article publié par l’Association of Computational Linguistics. «À notre connaissance, notre travail est le premier qui fournit des indications quantitatives sur le lien entre le style d’écriture et le succès des œuvres littéraires.»

«Des recherches antérieures ont tenté de déterminer la “recette secrète” du succès d’un livre, mais la plupart de ces études ont établi des indications qualitatives, en se basant sur une douzaine de romans, et en observant spécifiquement le contenu de haut niveau : la personnalité des protagonistes et des antagonistes, et l’intrigue.»

«Nos recherches portent sur une collection beaucoup plus vaste – 800 livres – et sur plusieurs genres, fournissant des indications lexicales, syntaxiques, et discursives qui caractérisent les styles d’écriture que partage la littérature à succès.»