RPG contre HD – Symbolisme et Imagination

Aujourd’hui, un autre article sur les RPG, un peu dans la veine du précédant mais cette fois j’aimerais revenir sur les réponses que j’ai faites à des commentaires afin de creuser un peu plus la question et de fournir une réflexion plus complète (et illustrée).

Le sommet de l’iceberg

Lorsque j’écrivais mon article sur Radiant Historia, j’ai dit que la HD avait très peu à apporter aux RPG, et beaucoup à leur enlever.

En écrivant cette phrase, je pensais avant tout aux coûts de production qui explosent et qui diminuent d’autant la portée d’un jeu. J’ai même mis un lien vers mon article sur Final Fantasy XIII dans lequel j’explique les problèmes rencontrés par Square-Enix lors du développement du titre.

Cette réduction de la portée (le scope pour employer des termes plus justes, bien qu’étrangers) est extrêmement préjudiciable pour un RPG qui se veut être une aventure. Une aventure c’est un long voyage et cette dimension épique doit ressortir du jeu. J’ai dit que Final Fantasy XIII faisait peu de choses mais les faisaient bien, mais ça n’empêche pas que tout ce qu’il n’a pas pu faire lui ont été reproché maintes et maintes fois par ceux qui en attendent plus d’un RPG.

Square-Enix entend bien corriger le tir avec FFXIII-2 en s’appuyant sur des outils terminés et plus matures ainsi que des assets réutilisables pour réduire ses couts et présenter une expérience plus riche. Cette suite s’appuie sur le premier épisode, de la même façon que Zelda Majora’s Mask n’a pu être réalisé en un an et demi que grâce au travail réalisé sur son prédécesseur.

Le problème reste donc entier : pour développer un véritable RPG HD il faut des moyens considérables, aussi bien en temps qu’en argent. Le budget exact de Final Fantasy XIII n’est pas connu, mais il est estimé aux environs de 80 millions de dollars. Pour vous donner une idée, Final Fantasy VII a couté 45 millions de dollars, et à l’époque c’était déjà considéré comme une véritable folie. Et il y avait bien plus à voir et à faire dans FFVII que dans FFXIII.

Voilà donc où nous en sommes : plus la réalisation coûte cher et plus l’étendue du jeu se doit d’être restreinte pour compenser. On l’a bien vu, dans le cas d’un RPG ça a du mal à passer puisque ce côté épique est quelque chose de cher aux joueurs.

Mais ce n’est pas le seul problème.

Understanding RPGs

Il y a des livres comme ça, dédiés à un art, qui présentent une ou plusieurs vérités de façon si pertinente et exacte qu’ils deviennent des références pour tous les esprits créatifs, même ceux officiant pour un autre médium.

Je parle bien sûr d’Understanding Comics de Scott McCloud. Sa lecture est un pré-requis pour tout artiste (naturellement) mais également pour tout game designer. Et pour tout cinéaste et pour tout… Bref, pour tous ceux qui s’intéressent à un médium visuel, Understanding Comics est un must-read.

Scott McCloud dédie notamment tout un chapitre sur le pouvoir des symboles et des icônes, et sur l’abstraction en général :

Regardez cette pyramide (page 51), c’est notamment sa base qui nous intéresse ici. A gauche, vous avez la “Réalité“, avec une photo d’un individu. On ne peut pas faire plus réaliste, c’est une photo après tout. Tous les détails sont présents et permettent d’identifier l’individu avec précision.

Mais au fur et à mesure que l’on s’approche de la droite, du “Langage“, on perd en détails. La photo devient de plus en plus simple, de plus en plus cartoon, jusqu’à n’être plus qu’un cercle avec deux points et une ligne. Pourtant on continue d’y voir un visage…

Et si on continue vers la droite jusqu’à sortir de la pyramide, on tombe sur les mots. Les mots sont l’ultime forme d’abstraction. Ici le mot “Visage” (Face en anglais) décrit exactement la même chose que le smiley, mais en utilisant des formes encore plus abstraites (les lettres de l’alphabet).

La photo est quelque chose de reçu, on reçoit l’information telle quelle par nos yeux. Il n’y a rien à interpréter, c’est une image fidèle à la réalité qu’on se contente de recevoir. C’est un visage, point. Mais plus l’image vire au cartoon, plus l’esprit du lecteur est mis à contribution. Le smiley partage très peu de ressemblances avec un vrai visage, mais notre cerveau l’interprète comme tel.

Le langage est en effet quelque chose de perçu, notre esprit entrevoit une description et recréé l’image en fonction. Un smiley est une description imagée d’un visage, le mot “Visage” est une description non-imagée mais directe. De même, si on continue encore vers la droite on a “Deux yeux, un nez, une bouche” qui est une description encore plus perçue, puisqu’elle ne parle même pas de visage. C’est nous qui associons ces éléments à un visage.

La conséquence d’un mouvement vers la droite, vers le langage, c’est qu’on perd en détails et qu’on augmente l’implication de la personne qui voit l’image.

Cela à deux effets : l’identification et l’imagination.

Identification

Le principe est simple et — encore une fois — merveilleusement imagé par Scott (page 31) :

La photo ne peut décrire qu’un seul individu. Un dessin très réaliste pourra correspondre à une poignée de gens qui se ressemblent. Un dessin moins réaliste, tel qu’on peut en trouver dans les comics peut ressembler à des milliers de gens. Un visage simple avec des cheveux noirs ? Des millions de gens correspondent à cette description ! Quand au smiley, à partir du moment où vous avez deux yeux et une bouche, vous êtes recevable.

Sur la photo vous voyez cet homme et personne d’autre… mais le smiley pourrait très bien être vous. Et il y a des chances que ce soit le cas, vous pouvez superposer votre image sur celle-ci, c’est comme un réceptacle prêt à accueillir votre personnalité.

Le mécanisme d’identification est à l’œuvre dans chaque médium mettant en scène des personnages. Quand vous voyez un film, vous vous identifiez probablement au protagoniste. Même si son visage n’est pas le votre, vous êtes capable d’empathie. Mais ce sentiment d’identification est décuplé quand vous regardez un anime présentant comme protagoniste un jeune homme lambda. Vous savez, taille moyenne, brun, yeux marrons… Le type qui me ressemble, qui vous ressemble peut être et qui ressemble en réalité à une bonne partie de l’audience visée.

Alors quand vous lisez un bouquin qui se contente juste de vous donner quelques indices sur ce à quoi les personnages ressemblent, ce sentiment d’identification est à son paroxysme. Vous pouvez littéralement lui coller votre visage si ça vous chante, aucune image ne viendra vous contredire. (C’est pour ça qu’on est souvent déçu du casting d’un film qui adapte un bouquin.)

Et qu’en est-il des jeux vidéo, et plus particulièrement des RPG ?

Bingo.

Vous voyez comment le rendu 3D de Kefka ressemble à une photo ? Et comment son visage dans le jeu ressemble à un smiley ? C’est exactement la même chose, le même principe.

Le rendu 3D représente Kefka et personne d’autre. Le sprite ? C’est plus ambiguë…

Si je met une casquette, ça passe. Et vous ? Probablement que ça passe aussi. Si vous êtes une fille il vous faudra attendre Pokémon Crystal pour faire le test, mais cela tiens aussi. Et la magie du noir et blanc : quelle que soit la couleur de votre peau, de vos cheveux, de vos yeux, ça peut passer.

C’est la raison pour laquelle beaucoup de RPG vous laissent choisir le nom du héros. Vous êtes sensé mettre le votre, et vous êtes sensé imaginer votre visage sur ces quelques petits pixels.

Mais Final Fantasy VI et Pokémon sont des jeux venus tout droit de la SNES et de la GameBoy, des consoles 16 et 8 bits. Les graphismes étaient ce qu’ils étaient par nécessité et non par choix.

De nos jours, dans un monde tout en 3D où la moindre texture de caillou a une résolution supérieure au héros de Pokémon, on a recours à la customisation du personnage pour permettre l’identification. Le joueur peut personnaliser son avatar afin qu’il lui ressemble. Mais on reste limité par la qualité du rendu et les options données au joueur.

Le but est de recréer une image de la même qualité qu’une photo mais représentant le joueur. En gros le jeu doit être capable de recréer fidèlement un visage qu’il ne connait pas, que les développeurs n’ont jamais vu et ce à partir d’options limitées. Sans compter que c’est une expérience assez pénible pour le joueur qui va passer des heures à pousser des centaines de sliders en espérant arriver à un résultat potable.

Au final il est plus facile de s’identifier au héros de Pokémon qu’à celui de Dragon’s Age, même en ayant passé des heures à le personnaliser.

Dans ce cas, la “haute définition” (au sens large, pas la norme) a introduit un problème qui n’existait pas avant.

Mais ça ne se limite pas aux graphismes. Pensez aux doublages.

Quand vous lisez les dialogues, la scène se joue dans votre tête. Comme pour un roman, vous entendez votre propre voix prendre des accents étranges comme si elle jouait la comédie. Et c’est ce qu’elle fait. Dans votre imagination se dresse un petit théâtre, et vous êtes aussi bien le metteur en scène que le seul acteur. C’est pour ça qu’il y a un sentiment de proximité aussi fort, le jeu vous décrit une scène mais c’est vous qui la jouez.

Quand le protagoniste parle avec une voix qui n’est pas la votre, une distance s’installe. Peut être avez-vous lu ces témoignages d’acteurs qui disent être tellement dans leur rôle que c’est comme s’ils devenaient le personnage. Ces acteurs s’identifient au personnage qu’ils jouent avec probablement plus de force que vous, qui êtes assis dans la salle de cinéma à regarder leur performance.

Le plus grand fan de Jack Sparrow est sans doute Johnny Depp lui même !

Quand vous jouez la scène dans votre esprit, vous êtes comme lui, un acteur qui incarne un rôle et cela créé un lien entre vous et le personnage. Quand vous écoutez les doublages vous êtes comme le spectateur assis dans son siège, le lien existe, mais il est bien moindre.

Alors les doublages systématiques sont-ils vraiment un progrès ?

Le problème peut s’étendre à ce que dit le héros, en plus de la façon dont il le dit. Le Silent Protagonist est bien connu des joueurs de RPG. Il s’agit d’un personnage qui ne parle pas, ou du moins on ne l’entend pas faire.

En effet, il n’est pas rare que les autres personnages réagissent comme s’il parlait, et pourtant le joueur n’a droit à aucun dialogue. La raison est simple : éviter d’introduire une distance entre le joueur et son avatar.

Le héros étant le représentant du joueur, le voir dire quelque chose qu’on ne cautionne pas ou qu’on aurait dit différemment est dérangeant. Certains jeux proposent de choisir la réplique, mais ça ne résous pas entièrement le problème, ça donne juste un peu plus de marge.

Le problème est là : comment réaliser un RPG HD avec des graphismes abstraits, sans doublages, et avec un héros qui ne dit pas un mot ?

Imagination

Revenons un peu en arrière :

Je pense que le principe du réalisme vous est familier, comme je l’ai dit c’est quelque chose de reçu, il n’y a donc pas grand chose à en faire et ça n’a pas besoin d’explications : c’est une copie aussi fidèle que possible de la réalité que nous connaissons bien, c’est donc intuitif.

Le symbolisme en revanche est plus intéressant, un symbole évoque une idée plutôt que de la montrer telle qu’elle est. Il s’agit en quelque sorte d’un alias, comme un mot évoque un concept sans être ce concept. Le mot “Visage” renvoi à l’idée d’un visage aussi surement qu’une photo.

C’est pareil pour les graphismes d’un jeu vidéo, ces visuels 8-bits sont des icônes, des représentations. C’est pour ça que les aberrations au niveau de l’échelle, comme le héros étant aussi grand qu’une montagne ou qu’un village sur la carte du monde ne posent pas de problème. Il ne s’agit pas du héros, il ne s’agit pas d’une montagne, et ce n’est pas un village. Ce sont des icônes qui les représentent, comme des pions sur un jeu de plateau.

La différence entre un symbole et une image réaliste, c’est le rôle de l’imagination. Plus haut j’ai dit que le manque de détail dans la représentation plus abstraite permettait l’identification et donc l’immersion, mais la raison c’est qu’un manque de détail est la porte ouverte à l’imagination du lecteur/spectateur/joueur.

Souvenez vous de votre petit théâtre mental qui joue la scène pour vous : pour se mettre en scène il a besoin de détails qui ne sont souvent pas fournis dans le matériau d’origine. Mais comme il en a besoin, il est obligé de les inventer, c’est le rôle de l’imagination.

L’imagination remplit les trous laissés par le texte ou l’image, elle complète le puzzle, et se faisant elle y met sa propre personnalité.

Ce que vous imaginez viens de vous et vous appartiens, cela révèle des choses sur vous et vous rapproche de l’œuvre. Vous êtes en quelque sortes le complice de l’auteur. C’est d’autant plus vrai dans un jeu vidéo où le joueur participe à l’action et est donc co-auteur.

L’imagination entraine l’implication.

Et comme vous vous en doutez, on garde des souvenirs plus vifs des choses dans lesquelles on s’implique.

High Definition, Low Immersion

Comme on vient de le voir, une représentation plus abstraite, plus symbolique, favorise l’imagination du joueur et facilite l’identification. Ces deux facteurs contribuent à une plus grande immersion et une implication accrue.

Ajoutons une bonne dose de nostalgie et on comprend pourquoi les RPG old-school sont toujours présents dans le cœur des joueurs.

Cependant vous vous doutez que le problème n’est pas la HD en elle même, mais ce qu’on en fait. Ce n’est qu’un outil, en théorie elle est indépendante du type de visuels réalisés avec.

La HD n’implique pas forcément un niveau de détail important, mais c’est souvent ce que l’on attend d’elle. Il est difficile de justifier des graphismes abstraits sur console HD sans jouer la carte de la nostalgie et du old school. Mais ce n’est pas une carte qu’on peut se permettre de jouer pour chaque nouveau RPG…

Les joueurs prennent la HD comme un progrès, quelque chose qui va de soi, un peu comme la 3D a rapidement occultée la 2D à cause de l’engouement des joueurs (et donc des développeurs) pour cette technologie.  Il va être difficile d’aller les voir pour leur expliquer que ce qu’ils prennent pour acquis ne convient pas au genre et qu’il vaudrait peut être mieux faire sans.

C’est la raison pour laquelle les meilleurs RPG de cette génération sont sur DS et PSP, derniers bastions de la “low definition”. Sur ces plateformes non-HD, avoir recours à des graphismes abstraits est encore “toléré” : les joueurs voient ça comme une limitation technique et l’acceptent.

Mais ça ne durera pas longtemps. L’arrivée de la 3DS, de la Playstation Vita et l’évolution des smartphones tendent à une uniformisation “tout HD”. Les jeux 2D seront probablement les premières victimes, car il sera plutôt difficile de marketer un jeu 2D sur une console dotée d’un écran 3D stéréoscopique…

Pour autant, il ne faut pas assimiler la 3D à la HD. Un jeu peut être en 3D mais pas en HD, et un jeu 2D peut être en HD. Encore une fois le seul élément qui différencie la photo du smiley c’est le niveau de détails. Si la raison d’être de la HD est d’offrir plus de détail, ce n’est pas le cas de la 3D.

Un jeu 2D HD coûte aussi cher (voir plus) à produire qu’un jeu 3D HD. Les jeux de Vanillaware se situent d’ailleurs plus du côté “Réalisme” du spectre que du côté “Symbolisme”. S’ils ces visuels font de très bon beat’em all, ils ne sont pas aussi bien adaptés pour des RPG.

Comme la HD est là pour rester et que l’ère 16 bits est loin derrière nous, y’a t-il un moyen d’accommoder les deux ? De retrouver ce sentiment d’immersion et d’identification ? Est-ce que la HD peut être utilisée pour stimuler notre imagination plutôt que l’étouffer ?

Dans une certaine mesure, oui. Mais je pense qu’on ne retrouvera jamais exactement le même niveau de symbolisme que les graphismes 8 ou 16-bits. On arrivera plutôt à un niveau semblable aux cartoons, avec des personnages vaguement définis avec qui il est facile de s’identifier, mais rien d’aussi drastique d’un petit sprite qui fait office d’indicateur : “je suis une icône sur l’écran qui représente le joueur”.

Même si le Ness de la Wii semble venir du côté “Symbolisme” du spectre présenté par Scott McCloud, il ressemble bien plus à un personnage à part entière qu’a mon avatar dans l’univers d’Earthbound.

Les détails non visuels

Si la HD et ses détails ne laissent plus la place à notre imagination pour les visuels, peut-on l’appliquer ailleurs ? N’est-il pas possible d’introduire d’autre “non-dits”, des endroits où le joueur serait libre de déchainer son imagination ?

Je pense qu’il y a beaucoup de place pour l’imagination dans la présentation et dans la structure même du jeu. Dans les ellipses, dans le choix des actions que l’on montre et celles que l’on se contente d’évoquer ou de résumer. Le “montage” du jeu, en quelque sorte.

C’est un sujet que j’aimerais creuser, et j’espère pouvoir écrire un autre article un jour pour présenter mes conclusions. Ou mieux, un jeu.