Architecture

Posté le 28/04/2026 par David Ostermann

Gauthier Fiorentino, lors de la Duck Conf 2026, nous propose une critique constructive des architectures SPA/PESPA pour leur impact sur l'accessibilité et l'écoconception. 56 % du temps d'affichage est gaspillé à exécuter du JS pour générer du HTML. La solution : appliquer la Rule of Least Power en privilégiant le rendu serveur et le modèle MPA.

Lire la suite >

Posté le 24/04/2026 par Teilo Millet

Combien coûte vraiment un million de tokens quand on ne paie plus l’API, mais l’infrastructure qui les produit ? En partant du prefill, du decode, du batching, du KV cache et des modèles MoE, on estime combien de tokens une infrastructure GPU peut générer.

Lire la suite >

Posté le 13/04/2026 par Michel Nakache

Valérie et Fabien, architectes chez Michelin, nous racontent sept ans d’aventures sur l’implémentation progressive de Kafka au sein du géant industriel : de grandes réussites, des difficultés inédites à chaque étape de croissance et de très nombreux apprentissages.

Lire la suite >

Posté le 31/03/2026 par Vinorth Varatharasan

CR Duck Conf: L'IA générative ne supprime pas les goulots d'étranglement du développement logiciel : elle les déplace. Spécification, feedback, adoption deviennent les nouveaux facteurs limitants. 5 apprentissages concrets pour adapter les pratiques d'architecture à l'ère agentic.

Lire la suite >

Posté le 13/03/2026 par Emmanuel Lin Toulemonde

Les tests d'architecture sont un outil puissant pour automatiser la vérification des patterns d’architecture, des standards, de valider les choses qu’un linter ne peut pas aisément valider.

Lire la suite >

Posté le 27/02/2026 par François Petitit

L'Etat Plateforme s'évertue depuis 10 ans à rendre les services publics plus adaptés aux besoins des usagers. Et si les Model Context Protocol (MCP), technologie interconnectant des services avec les IA, étaient le chaînon manquant pour franchir une nouvelle étape ?

Lire la suite >

Posté le 23/02/2026 par Karim Sayadi, Gireg Roussel

Ce papier évalue l'inférence d'un LLM (14B) et d'un VLM (7B) sur une NVIDIA T4. Avec 91% de succès sur 7310 requêtes, l'architecture prouve sa résilience malgré un matériel d'entrée de gamme. Une exploration entre coût, SLO et expérience utilisateur pour optimiser le déploiement de modèles auto-hébergés.

Lire la suite >

Posté le 20/02/2026 par Frédéric Duvivier

Comment débiter la transformation digitale de l'activité industrielle à la bonne échelle pour un retour de valeur rapide

Lire la suite >

Posté le 08/02/2026 par Bruno Boucard

La modernisation technique doit être progressive, sécurisée et alignée avec la capacité réelle des équipes.

Lire la suite >