ChatGPT vous donne raison. C'est précisément ce qui vous coûte cher.

Tout le monde répète la même phrase : l’IA me fait gagner du temps. Vraiment ?

Regardez ce qui se passe concrètement dans une journée de travail assistée par ChatGPT, Claude ou Gemini. Vous tapez une demande. La machine produit. Vous relisez. Vous validez. Et vous passez à autre chose. C’est rapide. C’est fluide. Et c’est précisément là que le problème commence.

Parce que vous n’avez pas gagné du temps. Vous l’avez déplacé. L’effort n’est plus dans la production, il est dans la critique de ce qui a été produit. Et la critique est nettement plus difficile que la production, pour une raison simple : produire, on sait faire, on a quinze ans de pratique. Critiquer ce qu’une machine a écrit, c’est un autre métier, qu’on n’a jamais appris.

Le pire, c’est que la machine ne va pas vous aider à le faire.

Table des matières

Pourquoi ChatGPT ne vous contredira jamais

Soyons précis avant d’aller plus loin. Bien sûr qu’un LLM peut contredire. Il refusera de vous aider à coder un malware, il vous opposera des objections si vous lui demandez explicitement « critique-moi sans filtre », il s’arrêtera sur certains sujets sensibles. Mais sur les terrains métier, là où vous travaillez vraiment, là où il n’y a pas de garde-fou de safety, il ne contredit pas spontanément. Et ce n’est pas un défaut, c’est mécanique.

Les grands modèles de langage ont été entraînés à plaire. Ce n’est pas une métaphore, c’est mécanique. La phase finale de leur entraînement, le RLHF (Reinforcement Learning from Human Feedback), consiste à faire noter leurs réponses par des humains. Le modèle apprend ce qui rapporte des bonnes notes. Et ce qui rapporte des bonnes notes, ce n’est pas la contradiction, c’est la complétion utile, structurée, agréable à lire.

Les chercheurs appellent ça la sycophantie : le modèle épouse la formulation de votre question au lieu de la remettre en cause. Anthropic l’a documenté noir sur blanc dans un papier de 2023 sur ses propres modèles. OpenAI a publié une note d’aveu en 2025 sur le sujet. Depuis, le biais n’est plus seulement constaté, il est mesuré : une équipe de Stanford l’a chiffré dans une étude parue dans Science. Sur onze modèles testés, l’IA valide l’action de son interlocuteur 49 % plus souvent qu’un humain, y compris quand la demande est douteuse. Personne ne le nie. Et personne ne sait le corriger en profondeur.

Il y a aussi un biais que les éditeurs évoquent moins volontiers. Un modèle qui vous contredit en permanence, vous l’arrêtez. Vous changez d’outil. Vous résiliez l’abonnement. OpenAI, Anthropic et Google ont besoin de votre rétention. Ils ont donc, mécaniquement, intérêt à ce que leur modèle vous plaise. C’est aussi un choix de design commercial, pas seulement une limite technique.

Et soyons honnêtes : même Claude, que j’utilise tous les jours, tombe dans ce travers. Quand je travaille un sujet avec lui, il valide. Quand je lui demande de me contredire, il bascule soit en mode destructif (« voici dix problèmes »), soit en mode cosmétique (« on pourrait nuancer telle phrase »). Aucun des deux n’est une critique de fond. Une critique de fond, ça demande de comprendre pourquoi j’ai eu cette idée, ce qu’elle révèle de mon biais initial, et ce que je n’ai pas vu. Le LLM ne fait pas ça. Sa fonction de coût ne l’y entraîne pas.

Et le travers ne se limite pas au premier échange. Des travaux récents montrent qu’il s’aggrave à mesure que la conversation avance : plus vous insistez, plus vous reformulez, plus le modèle lâche sa position de départ pour épouser la vôtre, même quand sa première réponse était la bonne. L’utilisateur qui creuse pour « challenger » l’IA obtient souvent l’inverse de ce qu’il cherche : non pas une objection plus solide, mais une reddition polie.

Mais soyons clairs sur un point. La sycophantie n’est que la surface du problème. La mise en forme automatique en est la version armée.

Quand un plan d’action remplace une bonne question

Le vrai poison n’est pas la flatterie, c’est la structure. Même quand le modèle ne flatte pas, même quand il dit « non, ce n’est pas faisable », il produit ensuite un sommaire en sections numérotées, avec stack recommandée et budget chiffré, qui donne à n’importe quelle idée l’apparence du sérieux. Et un cas récent dans notre cabinet le montre mieux que n’importe quel raisonnement.

Un dirigeant nous écrit : il a posé une question à ChatGPT sur la récupération automatique des abonnés d’une page LinkedIn d’entreprise. Il transfère la réponse pour qu’on en discute.

La réponse de ChatGPT fait dix sections. Architecture recommandée, pipeline détaillé, stack précise (Apify, n8n, Clay, HubSpot), budget chiffré (« 500-2000 € par mois »), MVP en 48 heures, recommandations finales adaptées à son secteur. Du sérieux. Du concret. Du livrable.

Sauf que la demande initiale n’existe pas. L’API officielle LinkedIn ne permet pas de récupérer la liste nominative des abonnés d’une page. ChatGPT le dit d’ailleurs, en passant, dans la section 1 : « Export CSV complet des followers → non. » Puis il enchaîne neuf sections de contournement par scraping, avec proxies résidentiels, comptes secondaires, « rythme humain » pour éviter la détection. Le « non » initial est noyé. Le message qui reste, à la lecture, c’est : « voici votre solution complète ».

Le dirigeant arrive en rendez-vous convaincu que c’est un projet à cadrer. Il faut alors lui expliquer que ce qu’il croit être un cadrage est en fait une demande à reformuler, que les techniques proposées exposent juridiquement et techniquement, et que le besoin réel (qualifier une audience B2B) se traite autrement.

Ce n’est pas un cas isolé. C’est devenu une situation hebdomadaire. Le dégât ne vient pas de ce que le modèle a inventé. Il vient de la transformation d’une mauvaise question en plan industriel structuré. Un plan avec budget, étapes et stack lit comme du sérieux, même quand le besoin sous-jacent est mort-né. C’est l’autorité empruntée : la mise en forme experte donne du crédit à des idées qui n’auraient pas dû passer le premier filtre.

Pour critiquer l’IA, il faut savoir s’en passer

C’est ici que se trouve le sujet de fond, et il est rarement formulé.

La maturité critique requise pour utiliser un LLM correctement s’acquiert par la pratique sans LLM. Vous savez repérer qu’un workflow n8n proposé par Claude est mal architecturé parce que vous en avez cassé deux cents à la main. Vous savez qu’une stratégie commerciale ne tient pas parce que vous avez raté trois projets dans votre carrière. Vous savez qu’un code Python génère un memory leak parce que vous avez passé une nuit à le débugger en 2019.

Cette mémoire est procédurale. Elle ne se transmet ni par la lecture ni par la formation accélérée. Elle s’acquiert en souffrant sur la matière, sans assistant.

Or qu’est-ce qu’on est en train de faire collectivement ? On donne l’outil expert à des gens qui n’ont pas le parcours. Un développeur junior qui démarre avec Copilot écrit du code qui marche, sans comprendre pourquoi il marche, et surtout sans comprendre pourquoi il pourrait casser. Le jour où il casse, il ne sait pas réparer. C’est ce qu’on a déjà décrit comme la dette technique invisible du code généré par IA. Un cadre qui démarre sa première stratégie commerciale en s’appuyant sur ChatGPT n’aura jamais éprouvé physiquement ce que veut dire « cette idée ne tient pas la route ». Quand le LLM lui propose dix sections bien structurées, il n’a aucun moyen de repérer que la section 3 est creuse.

Le paradoxe est net : la compétence critique requise pour utiliser l’IA s’acquiert par l’absence d’IA. Le conseil « prenez du recul, soyez critiques » est juste pour ceux qui ont la mémoire procédurale d’avant. Il est inopérant pour ceux qui démarrent maintenant, parce qu’ils n’ont pas le matériau mental sur lequel exercer ce recul.

C’est ça, le sujet économique et éducatif qui se met en place sans qu’on le nomme. On ne va pas vers un monde où chacun « monte d’un cran » sur des tâches plus stratégiques pendant que la machine fait le reste. On va vers un monde à deux vitesses : ceux qui ont éprouvé le métier avant l’IA et savent l’encadrer, et ceux qui ne l’ont jamais éprouvé et croient l’encadrer. Les deuxièmes seront beaucoup plus nombreux.

Le risque opérationnel qu’on ne nomme pas encore

La question pour une direction n’est plus « comment utiliser l’IA ». Elle est devenue : est-ce que mon équipe a encore la capacité de dire non à l’IA ?

Si la réponse est oui, l’IA est un levier puissant et vous le savez déjà.

Si la réponse est non, l’IA n’est pas un levier. C’est un risque opérationnel pour la productivité de l’entreprise qui n’apparaît pas encore dans vos tableaux de bord, parce que ses effets se voient à six ou douze mois : projets mal cadrés, dettes techniques invisibles, décisions stratégiques qui semblaient solides au moment de l’arbitrage et qui se fissurent à l’exécution.

Le travail n’a pas disparu. Il est devenu invisible à ceux qui n’ont jamais appris à le voir. C’est ça qui devrait vous inquiéter.

Post-scriptum

J’ai fait relire cet article par ChatGPT avant publication. Pas pour vérifier qu’il tenait, je le savais déjà, et je ne lui demandais pas de la réassurance. Juste pour voir ce qu’il en dirait.

Il m’a répondu que le texte était fort, bien construit, juste de ton. Puis il m’a proposé trois améliorations sensées que j’ai effectivement intégrées, parce qu’elles étaient pertinentes sur le détail.

À aucun moment il ne m’a dit : « ton angle est mauvais, repars de zéro ». Ce n’est pas qu’il avait tort de ne pas le dire, l’angle tenait. Le problème, c’est qu’il ne l’aurait pas dit non plus si l’angle ne tenait pas. Il aurait proposé les mêmes trois améliorations sensées, sur un texte fondamentalement raté.

Et c’est exactement le propos de cet article.

En pratique chez BGT

Cet article s’appuie sur des déploiements IA réels en PME et ETI. Si vous préparez le vôtre, autant en parler avec une équipe dont c’est le métier.

Voir nos solutions IA générative →