Pendant des années, « l’IA sur PC » a surtout signifié de petites commodités : un flou d’arrière-plan de webcam amélioré, une barre de recherche plus intelligente ou une aide à l’écriture à l’intérieur d’une seule application. Cette époque cède la place à quelque chose de plus ambitieux : des agents de bureau capables de planifier, cliquer, copier, résumer, classer et mener les tâches à terme pendant que vous continuez à travailler.
Début 2026, le vocabulaire de l’industrie évolue en conséquence. AMD a commencé à présenter les « Agent Computers » comme une nouvelle catégorie de PC conçue pour exécuter des agents IA en continu, signalant un passage de fonctionnalités IA occasionnelles à des compagnons toujours actifs, exécutant des tâches et vivant sur le bureau.
Des « fonctionnalités IA » aux agents de bureau toujours actifs
Le positionnement d’AMD en mars 2026 autour des « Agent Computers » est notable parce qu’il traite l’agent comme une charge de travail de première classe. Au lieu de commercialiser une poignée d’astuces IA isolées, cela suggère que le PC lui-même évolue en une machine capable d’héberger des processus d’agents persistants, prêts à agir chaque fois que vous le demandez, ou lorsqu’un flux de travail les déclenche.
Ce cadrage compte parce que le « toujours actif » change les attentes. Un agent de bureau ne se limite pas à générer du texte ; il peut surveiller des événements, coordonner des étapes entre applications et conserver un état dans la durée, davantage comme une couche d’opérations personnelle que comme une simple fonctionnalité dans une barre d’outils.
Concrètement, cela rapproche matériel et logiciel : inférence locale pour la réactivité, meilleure planification afin que le travail en arrière-plan ne dégrade pas l’interactivité, et nouveaux modèles d’autorisations au niveau du système qui déterminent ce qu’un agent peut voir et faire.
L’« espace de travail agent » de Windows 11 comme zone d’exploitation confinée
La documentation de Microsoft de fin 2025/début 2026 introduit le concept d’agent workspace : un « espace séparé et contenu dans Windows » où les utilisateurs peuvent accorder aux agents l’accès à des applications et à des fichiers afin que des tâches puissent s’exécuter en arrière-plan pendant que l’utilisateur continue de travailler. L’idée clé est l’isolation : les agents opèrent dans un environnement délimité plutôt que sur l’ensemble de la session par défaut.
Cela reflète un récit plus large (également repris dans des couvertures comme le cadrage « OS pour agents IA » de Forbes) selon lequel Windows devient plus capable d’accueillir des agents sans devenir pour autant entièrement « agent-first ». L’objectif est de permettre l’automatisation tout en gardant la gouvernance, la traçabilité et l’intention de l’utilisateur au centre.
Si ce modèle est le bon, l’agent workspace devient l’analogue, sur le bureau, d’un conteneur d’application isolé : suffisamment puissant pour interagir avec les outils du quotidien, mais suffisamment contraint pour réduire les risques de portée accidentelle ou malveillante.
Accès au bureau, par défaut : ce que les agents peuvent demander dans Windows
Les autorisations sont le point de bascule pour des agents de bureau utiles. La documentation de Microsoft indique que des applications agentiques (comme Copilot) peuvent demander ou obtenir l’accès à certains dossiers courants spécifiques lorsqu’elles s’exécutent dans l’agent workspace, en nommant explicitement Documents, Téléchargements, Bureau, Musique, Images, Vidéos.
Cette portée explique pourquoi ces agents peuvent être véritablement utiles : ils peuvent trouver votre brouillon dans Documents, récupérer une pièce jointe dans Téléchargements ou assembler des images depuis Images sans que vous ayez à fouiller manuellement dans les dossiers.
Cela clarifie aussi pourquoi les agents de bureau donnent une impression différente des expériences de chatbot dans un navigateur. Une fois que vous autorisez l’accès aux fichiers, l’agent n’opère plus seulement sur des extraits collés : il peut agir sur le substrat réel de votre travail, les fichiers, les noms de fichiers et la structure de vos informations personnelles.
Sécurité d’un OS agentique : injection inter-prompts et surface d’attaque étendue
Microsoft met explicitement en avant une nouvelle classe de risque pour les agents de bureau : l’injection inter-prompts (XPIA). Dans ses recommandations, Microsoft avertit que du contenu malveillant intégré dans des éléments d’interface ou des documents pourrait outrepasser les instructions de l’agent, déclenchant potentiellement des actions non souhaitées telles que l’exfiltration de données ou même l’installation de malwares.
Les médias ont souligné le sérieux de ce sujet. Windows Central a noté qu’un flux de travail Windows agentique peut élargir la surface d’attaque, en particulier si des attaquants peuvent abuser des autorisations de dossiers accordées. Tom’s Hardware a, de manière similaire, résumé la reconnaissance par Microsoft du fait que les fonctionnalités agentiques introduisent des risques de type injection de prompts et a discuté de concepts de confinement comme des espaces de travail limités ou des frontières de type profils.
Le problème central est que les agents de bureau ne se contentent pas de « lire » : ils font. Lorsqu’un agent peut cliquer sur des boutons, lancer des installateurs ou envoyer des messages, manipuler ses instructions via du contenu hostile devient matériellement dangereux. C’est pourquoi le confinement, les approbations explicites, la journalisation et l’accès au moindre privilège deviennent des exigences de conception, et non des ajouts optionnels.
Agents au niveau de l’UI : OpenAI et Anthropic apportent le « computer use » au bureau
Un moteur majeur derrière les agents de bureau est l’idée qu’une IA peut opérer au niveau de l’interface utilisateur, pas seulement via des API. La description par OpenAI en 2025 de son Computer-Using Agent (CUA) le positionne comme une approche universelle au niveau de l’UI : l’agent peut interagir avec « n’importe quel environnement informatique disponible », visant la longue traîne de tâches dépourvues d’intégrations spécialisées.
Dans la documentation API d’OpenAI (exploration 2026), cela apparaît sous la forme de l’outil « computer use » propulsé par un modèle nommé computer-use-preview. Cette appellation signale une catégorie de capacité distincte : des modèles optimisés non seulement pour répondre en texte, mais aussi pour percevoir des écrans et exécuter des actions.
Anthropic documente un outil « computer use » similaire : la capacité de voir et de contrôler des environnements de bureau, distincte des outils bash ou éditeur de texte, généralement exécutée via un schéma d’agent loop (observer → décider → agir → observer). Dans une citation d’interview TechCrunch (oct. 2024), Anthropic a décrit cela comme une « couche d’exécution d’actions », en soulignant que les humains gardent le contrôle grâce à des prompts qui dirigent les actions.
Benchmarks, « AgentOS » multi-agents et le problème de fiabilité
Une raison pour laquelle les « agents utilisant l’ordinateur » gagnent en crédibilité est que la performance est discutée en termes de benchmarks. WIRED (oct. 2024) a rapporté qu’Anthropic revendiquait de solides résultats face à d’autres agents sur des benchmarks incluant OSWorld (la capacité d’un agent à utiliser un système d’exploitation) et SWE-bench (tâches d’ingénierie logicielle). Même si les benchmarks sont imparfaits, ils créent une mesure commune des capacités au-delà des démos.
Le monde académique pousse aussi vers une automatisation du bureau plus systématique. L’article UFO2 (2025) propose un « AgentOS multi-agents pour les bureaux Windows », visant à rendre les agents utilisant l’ordinateur plus pratiques au niveau système en coordonnant des rôles (par exemple : planificateur, exécuteur, vérificateur) plutôt qu’en s’appuyant sur une seule boucle monolithique.
La fiabilité reste l’obstacle central parce que les interfaces graphiques sont fragiles : les boutons bougent, les boîtes de dialogue changent et les délais varient. Des recherches comme ComputerRL (2025) proposent un « paradigme API-GUI » qui unifie les appels API programmatiques avec l’interaction GUI, comblant le décalage entre agents machines et interfaces conçues pour les humains. Pendant ce temps, CUA-Skill (2026) introduit une bibliothèque à grande échelle de compétences conçues pour les applications Windows courantes afin d’améliorer la cohérence et la scalabilité, laissant entrevoir un futur où les agents s’appuient sur des « compétences » sélectionnées plutôt que d’improviser chaque clic.
Les fichiers deviennent prêts pour les agents : « fichiers .agent » OneDrive et copilotes de bureau concurrents
À mesure que les agents arrivent sur le bureau, les fournisseurs repensent aussi ce qu’est un « fichier ». TechRadar (févr. 2026) a rapporté que OneDrive introduisait des « fichiers agent » (avec une extension .agent) qui transportent du contexte à travers plusieurs documents OneDrive, permettant la synthèse, la Q&A et la mise en évidence d’échéances sur des ensembles de fichiers, le tout livré via l’expérience web sous licence Microsoft 365 Copilot.
En parallèle, la concurrence s’intensifie autour des agents qui opèrent directement dans votre ensemble de travail. VentureBeat (janv. 2026) a décrit « Cowork » d’Anthropic comme un agent de bureau Claude destiné à travailler dans vos fichiers, le positionnant comme une pièce d’une course grand public aux agents de productivité IA qui font plus que discuter.
La pression de l’écosystème est claire : dès qu’une plateforme prouve qu’elle peut de manière fiable « faire le travail » à travers documents, e-mails, navigateurs et outils internes, les utilisateurs attendront ce comportement partout. Cette attente se répercute sur les espaces de travail d’agents au niveau OS, de meilleures autorisations et des pistes d’audit plus riches, car l’agent opère désormais sur les actifs qui vous importent le plus.
Packaging open source et voie vers des agents personnels auto-hébergés
Tous les agents de bureau ne viendront pas de grands fournisseurs. Des applications de bureau open source et auto-hébergées de « contrôle de l’ordinateur » émergent également, y compris des projets GitHub qui empaquettent une application locale « propulsée par la capacité computer use de Claude pour contrôler votre ordinateur ». Même lorsque ces outils reposent sur des modèles hébergés, la tendance à l’empaquetage montre à quelle vitesse des expériences d’agents peuvent être transformées en produits.
Cela compte pour l’expérimentation et la personnalisation. Des wrappers auto-hébergés peuvent s’intégrer à des flux de travail de niche, des systèmes internes ou des environnements sensibles à la confidentialité où les organisations préfèrent un contrôle plus strict sur la journalisation, l’accès réseau et les chemins de données.
Cela relève aussi le niveau d’exigence en matière de culture de sécurité. Quand n’importe qui peut lancer un agent capable de voir des écrans et de cliquer à travers des boîtes de dialogue, les bonnes pratiques, moindre privilège, sandboxing, confirmations explicites pour les actions risquées et gestion soigneuse de l’injection de prompts, deviennent essentielles autant pour les amateurs que pour les équipes IT.
Les Agent computers amènent l’IA sur le bureau en faisant de l’action, et non seulement de l’insight, le centre de l’expérience. La trajectoire combinée, du cadrage « Agent Computers » d’AMD à l’agent workspace de Windows 11 de Microsoft, suggère que les PC sont en train d’être ré-architecturés pour une exécution persistante de tâches en arrière-plan, avec des limites et des autorisations plus claires.
L’opportunité est énorme, mais la responsabilité l’est tout autant. Les avertissements explicites de Microsoft sur l’injection inter-prompts (XPIA) et les discussions plus larges sur la surface d’attaque d’un « OS agentique » montrent que la prochaine génération de productivité sur le bureau dépend autant du confinement, de la gouvernance et du contrôle utilisateur que de modèles plus intelligents et de puces plus rapides.