Partager

Mode clair Mode sombre

C’est une fake news qui fait couler beaucoup d’encre : une requête ChatGPT « consommerait » 50 cl d’eau. À ce sujet, les grands médias nationaux, comme le journal de 20 h de France TV du 26 octobre dernier, boivent régulièrement la tasse. Debunk à contre-courant.

D’où vient cette comparaison iconique de la bouteille d’eau ? D’une étude non revue par des pairs et plusieurs fois modifiée depuis. La version originale citait « 50 cl d’eau pour 20 à 50 réponses », et le chiffre est, peu ou prou, resté le même au gré des itérations.

On remarque déjà qu’il ne s’agit pas de 50 cl par requête, mais pour 20 à 50 d’entre elles, contrairement à ce que laisse penser l’infographie du 20 h — ce qui représente entre 1,42 cl et 2,5 cl par réponse. On est déjà loin de la bouteille d’eau.

Pour établir cette estimation, l’étude s’appuie sur un article ne fournissant qu’une fourchette très large de consommation électrique pour GPT-3 : entre 1,1 et 23 GWh, soit un facteur 20. L’auteur divise ensuite cette valeur par un nombre d’utilisateurs lui aussi incertain, en déduit une consommation par requête, puis extrapole jusqu’à l’eau nécessaire au refroidissement des serveurs et à la production d’électricité.

Les 50 cl correspondent uniquement au haut de cette fourchette. Avec l’estimation basse, on tombe sous le millilitre. Un chiffre déjà dépassé, puisqu’il concerne une version de ChatGPT de 2023 — une éternité dans le monde de l’IA.

Autrement dit, ces 50 cl sont à la fois surestimés, fragiles et obsolètes. Pourtant, plutôt que de les remettre en cause, les auteurs ont tenté de les consolider. Leur méthode, qu’ils reconnaissent eux-mêmes approximative, met malgré tout en lumière plusieurs points.

D’abord, l’eau prise en compte inclut non seulement celle utilisée par les data centers, mais aussi — et surtout — celle consommée pour produire l’électricité qui les alimente. En Finlande, par exemple, 99,8 % de l’eau utilisée pour une requête vient de la production électrique, et seulement 0,2 % du refroidissement des serveurs.

Ces chiffres varient fortement selon l’emplacement du data center et le mix énergétique local. L’Arizona, désertique, n’a pas grand-chose à voir avec la Finlande.

De plus, un volume total d’eau « consommée » ne signifie rien en soi. Tout dépend d’où et quand elle est captée. Dans un fleuve en période de crue, cela n’a aucun impact, alors que puiser de l’eau potable dans une zone sous stress hydrique a, au contraire, des effets importants.

En Finlande, Google refroidit ses serveurs avec l’eau de mer, renvoyée ensuite légèrement réchauffée, sans effet notable sur l’environnement. En France, le refroidissement en circuit fermé réduit la consommation à un niveau très faible.

Malheureusement, ces nuances disparaissent du débat public, écrasé par l’image choc de la bouteille d’eau, au mépris des ordres de grandeur.

L’ensemble des data centers de Google — en partie seulement dédiés à l’IA — représentait en 2023 l’équivalent de 1/5000ᵉ du débit de la Seine. Soit la consommation d’environ 41 parcours de golf, alors qu’il en existe 15 000 rien qu’aux États-Unis. À peine plus qu’une ville comme Montpellier. Quant au Paris Digital Park, le plus grand data center de France, il consomme deux fois moins d’eau que… France Télévisions. Mais ça, peu de chances que ça passe au 20 h.