Architecture

Gauthier Fiorentino, lors de la Duck Conf 2026, nous propose une critique constructive des architectures SPA/PESPA pour leur impact sur l'accessibilité et l'écoconception. 56 % du temps d'affichage est gaspillé à exécuter du JS pour générer du HTML. La solution : appliquer la Rule of Least Power en privilégiant le rendu serveur et le modèle MPA.

Combien coûte vraiment un million de tokens quand on ne paie plus l’API, mais l’infrastructure qui les produit ? En partant du prefill, du decode, du batching, du KV cache et des modèles MoE, on estime combien de tokens une infrastructure GPU peut générer.
La Duck Conf 2026 - Architect Paradox : Pourquoi personne ne veut parler aux architectes
Cloud & Platform
Valérie et Fabien, architectes chez Michelin, nous racontent sept ans d’aventures sur l’implémentation progressive de Kafka au sein du géant industriel : de grandes réussites, des difficultés inédites à chaque étape de croissance et de très nombreux apprentissages.

CR Duck Conf: L'IA générative ne supprime pas les goulots d'étranglement du développement logiciel : elle les déplace. Spécification, feedback, adoption deviennent les nouveaux facteurs limitants. 5 apprentissages concrets pour adapter les pratiques d'architecture à l'ère agentic.

Les tests d'architecture sont un outil puissant pour automatiser la vérification des patterns d’architecture, des standards, de valider les choses qu’un linter ne peut pas aisément valider.

L'Etat Plateforme s'évertue depuis 10 ans à rendre les services publics plus adaptés aux besoins des usagers. Et si les Model Context Protocol (MCP), technologie interconnectant des services avec les IA, étaient le chaînon manquant pour franchir une nouvelle étape ?
Vers un auto-hébergement des modèles VLM/LLM : étude empirique sur une infrastructure entrée de gamme, défis et recommandations
Data & AI
Ce papier évalue l'inférence d'un LLM (14B) et d'un VLM (7B) sur une NVIDIA T4. Avec 91% de succès sur 7310 requêtes, l'architecture prouve sa résilience malgré un matériel d'entrée de gamme. Une exploration entre coût, SLO et expérience utilisateur pour optimiser le déploiement de modèles auto-hébergés.

Comment débiter la transformation digitale de l'activité industrielle à la bonne échelle pour un retour de valeur rapide

La modernisation technique doit être progressive, sécurisée et alignée avec la capacité réelle des équipes.
