Je me baladais sur YouTube, à la recherche d'une vidéo sur les nouvelles fonctionnalités « skills » de Claude. J'ai fait ma recherche en anglais, et je suis tombée sur une vidéo très classique dans son format : une vignette avec un personnage principal et un gros titre, une personne face cam qui parle, des images qui s'incrustent par-dessus son discours, et en arrière-plan un décor type bureau, avec étagères et éclairage néon. Le genre de vidéo qu'on croise des dizaines de fois par semaine sans y prêter attention.
J'ai picoré quelques passages, j'ai noté ce qui m'intéressait, puis j'ai quitté YouTube.
Quelques jours plus tard, je repense à un passage de cette vidéo que j'aurais aimé réécouter. Je ne l'avais pas enregistrée, donc je relance une recherche. Et là, surprise : je tombe sur la même vidéo, avec le même décor, le même cadrage, la même personne... mais en français cette fois.
C'est à ce moment-là que j'ai compris que j'étais tombée dans le piège sans m'en rendre compte. Ce n'était pas une personne qui avait tourné deux versions de sa vidéo dans deux langues. C'était un avatar généré par IA, décliné automatiquement dans une autre langue, avec la même voix, les mêmes mouvements, le même décor.
Comment c'est possible techniquement
Ce qui m'a le plus marquée, c'est la qualité. On parle ici d'avatars vidéo générés à partir de photos ultra-réalistes, capables de reproduire les petits défauts qui rendent un visage humain crédible : un grain de peau, des rides, des rougeurs.
Des outils comme HeyGen permettent de transformer ce type de photo en avatar parlant, avec adaptation vocale dans plus de 175 langues et dialectes, et une synchronisation labiale automatique qui recale les mouvements des lèvres sur la nouvelle langue. Synthesia propose une fonctionnalité comparable, avec du doublage vidéo dans plus de 140 langues tout en conservant le même avatar et la même voix clonée. YouTube, de son côté, propose désormais ses propres outils de clonage d'avatar pour les créateurs de Shorts.
Concrètement, cela veut dire qu'une seule vidéo peut aujourd'hui être déclinée, automatiquement, dans des dizaines de langues, avec un rendu suffisamment crédible pour tromper quelqu'un qui n'y prête pas particulièrement attention. C'est exactement ce qui m'est arrivé.
Et ce n'est pas un cas isolé. Une étude menée par Kapwing sur 15 000 chaînes YouTube a montré qu'avec un compte tout neuf, environ 21 % des premières vidéos recommandées dans le flux étaient entièrement générées par IA.
Ce que ça veut dire pour le marché de la formation en ligne
Cette anecdote m'a fait réfléchir au-delà de YouTube, parce qu'elle touche directement mon secteur : la formation en ligne.
En France, ce marché représente aujourd'hui 4,2 milliards d'euros, avec une croissance d'environ 10 % par an. Et la raison de cette croissance est structurelle : selon l'OCDE, la durée de vie moyenne d'une compétence est passée d'environ 30 ans en 1987 à environ 2 ans aujourd'hui. Ce qui crée un besoin permanent de reformation, à grande échelle, pour énormément de personnes.
C'est exactement le terrain sur lequel les outils comme HeyGen et Synthesia s'installent. Et je vois plusieurs effets concrets se dessiner.
- -La barrière de la langue tombe. Une vidéo de formation produite en anglais peut désormais être déclinée en français, en espagnol, en allemand, avec une voix et un avatar qui paraissent natifs dans chaque langue. Ce qui protégeait jusqu'ici une partie du marché francophone ne suffit plus à lui seul.
- -La concurrence devient internationale, et potentiellement low-cost. Des acteurs étrangers peuvent produire un contenu une fois, le décliner automatiquement dans toutes les langues, et arriver directement sur le marché français avec un coût de production largement amorti.
- -Le contenu générique perd de la valeur, vite. Si la valeur d'un formateur repose principalement sur la maîtrise d'un contenu théorique standard, que l'IA peut produire et décliner en quelques minutes, ce formateur est en concurrence directe avec des acteurs capables de produire la même chose, en plus grand volume, moins cher.
À l'inverse, les formateurs dont la valeur repose sur l'expérience terrain, la dynamique de groupe, l'adaptation en temps réel, l'expertise vécue, voient leur position plutôt renforcée. C'est précisément ce que la machine ne sait pas produire.
Comment se positionner
Cette anecdote m'a poussée à me poser une question très concrète : comment produire, rapidement, une formation en ligne de qualité, qui s'appuie sur cette réalité plutôt que de l'ignorer ?
Ma réponse a été de construire une formation à deux voix. D'un côté, un avatar HeyGen qui porte la partie théorique, structurée, répétable. De l'autre, ma propre voix, pour les cas pratiques, les expériences terrain, les démonstrations métier, tout ce qui ne peut pas être généré.
C'est cette formation, « Créer des infographies avec IA », que je lance actuellement. Le principe : une bibliothèque de 120 prompts à copier-coller dans n'importe quelle IA, pour générer 120 styles graphiques d'infographies pédagogiques différents, avec la partie théorique portée par un avatar et la partie démonstration portée par moi.
Je recherche actuellement des bêta-testeurs pour cette formation. Si le sujet vous intéresse, c'est une bonne occasion de découvrir le format et de me faire vos retours avant le lancement officiel.
Créer des infographies avec IA
Ma formation à deux voix : 120 prompts pour générer des infographies pédagogiques. Je recherche des bêta-testeurs.
Sources
- HeyGen, doublage et traduction vidéo
- Synthesia, langues disponibles
- Étude Kapwing sur le contenu IA recommandé sur YouTube
- Marché français de la formation en ligne 2025
- OCDE, durée de vie des compétences
Envie d'aller plus loin ?
Échangeons sur vos enjeux IA, cognition et formation.