Data & AI

Élément clef en logiciel, la sécurité doit bien entendu être considérée en Machine Learning Delivery. Vos modèles une fois en production auront un impact réel sur les utilisateurs et l’organisation qui les ont produits, il est alors nécessaire que personne ne les manipule.

Cet article fait partie de la série Accélérer le Delivery de projets de Machine Learning, traitant de l’application d’Accelerate dans un contexte incluant du Machine Learning. Si vous n’êtes pas familier avec Accelerate, ou si vous souhaitez avoir plus de détails sur le contexte de cet article, nous vous invitons à commencer par lire l’article intr...

Découvrez ce qu’est un produit data, ses caractéristiques clés et son rôle dans les organisations data-driven.

In this article, we will introduce the notion of concept drifts: how to define and detect them.Congratulations, you have been accepted as part of the Data Science team of an airline company! You were hired to build a Machine Learning model which predicts the company’s monthly profits.After several weeks of experimentations on your Jupyter Notebook,...

Les avis sur la mise en production du Machine Learning diffèrent. La Matrice Cynefin vous aide donc à prendre des décisions.

Les équipes développant des applications de Data Science investissent beaucoup d’énergie pour identifier et implémenter des métriques de monitoring pertinentes. Nous pensons qu’il est possible de capitaliser sur ce travail en proposant des fonctionnalités supplémentaires à nos utilisateurs afin de renforcer l’impact de nos applications.

Le but de cet article est de vous partager mon expérience de ce service, comment en tant que développeur je l’ai perçu et ce qu’il m’apporte. Je ne vais pas m’attarder sur les éléments profondément techniques de l'implémentation du dit service.Qu’est-ce que Github Copilot ?Github Copilot est la création de la société du même nom visant à améliorer ...

Tokenisation, lemmatisation, stop-words… découvrez comment nettoyer vos textes en NLP pour réduire la taille du vocabulaire, limiter le bruit et améliorer les performances de vos modèles.
1001 façons de faire parler la donnée - Compte rendu du talk de Nicolas Cavallo à la Duck Conf 2022
Data & AI
Les données textuelles en grande quantité sont difficiles à traiter et à interpréter. Il est possible de leur faire dire une chose et son contraire, de telle sorte que des statistiques calculées sur du contenu de réseaux sociaux n’ont de fait aucune valeur si on ne comprend pas la méthode par laquelle elles ont été obtenues. Dans son talk, Nicolas...
Comment structurer vos équipes et démocratiser l’Intelligence Artificielle au sein de votre organisation
Data & AI
Introduction des auteurs et de l’initiativeDans le cadre des réflexions d’OCTO Technology sur les grands enjeux du monde de la data, Jean-Baptiste Larraufie consultant OCTO et Ming-Li Gridel Directrice Data science chez DataRobot ont amorcé une discussion sur l’évolution des structures data dans les entreprises.En tant que conseiller stratégique su...