Des chercheurs étasuniens et britanniques ont passé en revue trois années de création de sites Internet. Selon leurs résultats, plus d’un tiers des pages mises en ligne ont été produit par une intelligence artificielle ou dont la création a été assistée par une IA. Pourtant au début de l’étude, c’est à dire avant le lancement de ChatGPT, la proportion de tels sites était quasiment nulle.
Un tiers du « Web neuf » généré par IA
Assistons nous à une explosion de l’utilisation de l’intelligence artificielle dans la création des sites Web ? Si oui, dans quelles proportions ? Doit t-on s’inquiéter ? Des éléments de réponses se trouvent dans une étude pré-publiée sur la plateforme ArXiv le 14 avril 2026. Des chercheurs de l’Université de Stanford (Etats-Unis) et de l’Imperial College London (Royaume-Uni) ont observé la création de sites Internet entre juin 2022 et mai 2025. Or, pas moins de 35% de ces sites ont étés classés comme produits ou assistés par une IA, soit un tiers du Web neuf.
Pour les chercheurs à l’origine de ces travaux, la stupéfaction est de mise. En effet, Internet tel que nous le connaissons aujourd’hui, a été façonné durant trois décennies par des millions de contributeurs humains. A la mi-2025, les IA en avaient remodelé plus du tiers en seulement trois ans. Soulignons également que l’étude a débuté quelques mois avant le lancement de ChatPGT (fin 2022) et qu’à ce moment là, la proportion de tels sites était dérisoire.
« Constituer un échantillon statistiquement représentatif d’Internet est difficile, car il n’existe pas d’index central, les domaines populaires sont largement surreprésentés dans la plupart des index et la couverture des archives a considérablement évolué au fil du temps. », peut-on lire dans une publication sur la plateforme GitHub relatant les travaux.
Crédit : The Impact of AI-Generated Text on the Internet / GitHub
Vers un remplacement de l’humain sur Internet ?
Le point de départ de l’étude consistait à vérifier la légitimité de l’inquiétude concernant cette prolifération de textes générés (ou modifiés) par l’IA sur Internet. Selon les auteurs, cette augmentation entraine une diminution de la diversité sémantique, ainsi qu’une hausse de positivité dans le ton. En revanche les autres points d’inquiétude possibles n’ont pas été réellement confirmés, notamment la diminution de l’exactitude des faits et de la diversité en termes de style. Les chercheurs ont également souligné que ces résultats pourraient différer par rapport à la perception des internautes eux-mêmes quant à l’impact de l’IA sur le Web.
Cependant, le point qui semble le plus contre-intuitif concerne sans doute la désinformation. En effet, les chercheurs ont missionné des fact-checkeurs humains afin de vérifier certaines affirmations provenant des sites générés par IA. Or, il n’y a pas vraiment d’explosion de fausses informations réellement vérifiables mais l’IA pourrait être à l’origine d’une hausse des affirmations impossibles à vérifier avec les outils actuels.
Aujourd’hui, les responsables collaborent avec l’Internet Archive pour essayer de transformer ces travaux ponctuels en un outil de surveillance continu. Si cette initiative aboutit vraiment, l’outil devrait permettre de suivre l’évolution de la création de sites Web au fil des mois, notamment par langue et catégorie de sites. Toutefois, la question suivante sera en toile de fond : si un tiers du Web neuf est déjà produit par l’IA, l’humain pourra t-il toute de même y perdurer ou sera t-il finalement remplacé ?


3 week_ago
86



























.jpg)






French (CA)