Data Science

La gestion de versions en delivery de ML, un processus qui permet de les mettre à disposition pour une utilisation en production.

Savez-vous qu’il faut évaluer en moyenne 100 candidatures pour réaliser une embauche ? C’est le résultat d’une étude menée par Lever, une société de San Francisco, basée sur les données récoltées de ses clients installés dans 40 pays.Pour gérer toutes ces candidatures, les recruteurs utilisent des outils appelés Applicant Tracking System (ATS). Ils...

Le feature store, l'outil révolutionnaire pour data science. Voyons ensemble son histoire et comment l'utiliser.

Cet article fait partie de la série “Accélérer le Delivery de projets de Machine Learning” traitant de l’application du framework Accelerate dans un contexte incluant du Machine Learning.Un Data Scientist heureux d’avoir des tests automatisés qui ont détecté un problème avant qu’il ne devienne critiqueIntroductionParmi les leviers garantissant la q...
CovidTracker : la data au service de tous - Compte-rendu du talk de Guillaume Rozier à La Duck Conf 2021
Data & AI
Une fois de plus cette année, la Duck Conf vous livre un tour d’horizon des pratiques d’architecture de SI, fondé sur des expériences terrains et nos convictions. Pour cette keynote de clôture, nous avons le plaisir d’accueillir Guillaume Rozier, fondateur de CovidTracker.Vous découvrirez dans ce compte-rendu les coulisses de ce service, ses facteu...

La mise en production d'un projet de Machine Learning, peut s'avérer être compliquée. Nous vous proposons de démystifier certaines étapes.

IntroductionEn développement logiciel et en Machine Learning, le travail en cours n’est pas aussi visible que dans une usine où l'on voit les pièces s'assembler et progresser d'une étape à l'autre. Ne pas voir le travail en cours peut nous empêcher de voir certains des points bloquants, de se projeter sur la quantité de travail bientôt terminé, d’a...

IntroductionWe live in a world in which data is becoming a key business asset, playing an increasingly central role in the success of a growing number of companies. Data and the ability to transform data into business will become critical in all sectors in the coming years. A good mastery of data and its exploitation can be an important competitive...

Un premier briefingAvant de commencer le grand plongeon, des définitions s’imposent :Jeu de données (ou dataset) : collection de données de même type, de préférence de même format et souvent accompagnées d'annotationAnnotation : description du contenu de chacune des données d’un dataset. L’annotation des données est le processus d’étiquetage du con...

Cet article sert d'introduction à une série plus large, traitant de l'application du framework Accelerate dans un contexte incluant du Machine LearningAvant de commencer, voici quelques définitions et conventions de nommage que nous adopterons tout au long de la série d'articles :Machine Learning : “Le Machine Learning est une fonctionnalité qui pe...