Machine Learning

Posté le 24/04/2026 par Teilo Millet

Combien coûte vraiment un million de tokens quand on ne paie plus l’API, mais l’infrastructure qui les produit ? En partant du prefill, du decode, du batching, du KV cache et des modèles MoE, on estime combien de tokens une infrastructure GPU peut générer.

Lire la suite >

Posté le 23/02/2026 par Karim Sayadi, Gireg Roussel

Ce papier évalue l'inférence d'un LLM (14B) et d'un VLM (7B) sur une NVIDIA T4. Avec 91% de succès sur 7310 requêtes, l'architecture prouve sa résilience malgré un matériel d'entrée de gamme. Une exploration entre coût, SLO et expérience utilisateur pour optimiser le déploiement de modèles auto-hébergés.

Lire la suite >

Posté le 03/02/2026 par Vinorth Varatharasan

De 6 mois à 2 jours. De 100 000€ à 500€. Les LLM multimodaux (GPT-4 Vision, Gemini, Claude) révolutionnent l'OCR et l'extraction automatique de documents. Fini l'entraînement de modèles, les datasets annotés et les pipelines complexes. Un prompt et une image suffisent. Retour d'expérience sur projet IA RAD/LAD : CNI, RIB. Code et benchmarks inclus.

Lire la suite >

Posté le 27/11/2025 par Vinorth Varatharasan, Simon Calarn

Comment entraîner une IA à détecter des défauts qu'elle ne voit presque jamais ? En industrie, les anomalies graves sont si rares qu'elles privent les modèles de matière d'apprentissage. La donnée synthétique offre une réponse inattendue : générer de faux défauts pour mieux reconnaître les vrais. REX sur la détection de soudures défectueuses.

Lire la suite >

Posté le 04/11/2025 par Bintou Diarra

Les directions clés portent la stratégie, mais si la Supply Chain n’est pas maîtrisée, la performance s’effrite : coûts, délais, qualité, satisfaction client… Dans cet article, explorez comment la transformer pour obtenir des résultats opérationnels et financiers tangibles.

Lire la suite >

Posté le 24/10/2025 par Teilo Millet

Le Reinforcement Learning from Verifiable Rewards entraîne les LLMs à optimiser plutôt qu'imiter. Sur des tâches vérifiables (maths, code), les modèles explorent et découvrent des stratégies émergentes. Guide complet: algorithmes GRPO/PPO, applications, environnements, limites et bonnes pratiques.

Lire la suite >

Posté le 30/09/2025 par Nicolas Cavallo

Comprendre le fonctionnement, les usages et les limites des agents IA pour automatiser des tâches complexes et augmenter la productivité.

Lire la suite >

Posté le 15/09/2025 par Jean-louis Debezia

Découvrez la méthode PEFT (Parameter Efficient Fine-Tuning) pour adapter efficacement un LLM avec moins de ressources et améliorer la performance des modèles de langage.

Lire la suite >

Posté le 02/05/2025 par Louison Roger

L'intelligence Artificielle regroupe un ensemble de techniques sur lesquelles l'industrie peut s'appuyer pour se rapprocher de son optimum d'excellence opérationnelle. De l'IA oui, mais où ? A l'Edge ? Dans le Cloud ?

Lire la suite >

Posté le 18/04/2025 par Teilo Millet, Gireg Roussel, Ismael Debbagh

Découvrez le Model Context Protocol (MCP), un protocole innovant pour relier vos LLMs à vos données et outils internes de manière sécurisée et efficace.

Lire la suite >