Data & AI

Posté le 09/09/2020 par Emmanuel Lin Toulemonde

Avant de déployer un nouveau modèle en production il est difficile de savoir précisément comment il va se comporter. La shadow production est une technique qui permet de se rassurer sur les performances du modèle avant de le déployer.Dans notre précédent article sur les alternatives aux monitoring de distributions, nous évoquions brièvement le conc...

Lire la suite >

Posté le 07/08/2020 par Touraya El Hassani

Cet article est issu d'un travail de recherche effectué au sein de la SAS pass Culture par OCTO. Il n'engage pas la SAS pass Culture et les algorithmes tels qu'évoqués dans cet article ne sont à ce jour pas ceux implémentés dans l'application. Les différents jeux de données utilisés ne sont que partiels et les analyses ne sauraient être interprétée...

Lire la suite >

Posté le 21/07/2020 par Maria MOKBEL

Lorsqu'un modèle de Machine Learning tourne en production, il nous faut l'améliorer. Voici un retour d'expérience.

Lire la suite >

Posté le 16/07/2020 par Thomas BENGUIGUI, Vincent Guigui

Aujourd’hui, de plus en plus de sociétés et de marques décident de s’équiper de chatbots, aussi bien à destination de leurs clients qu’à destination de leurs collaborateurs. Cependant, tous les chatbots ne se valent pas : certains obtiennent de meilleurs résultats que d’autres. La question alors soulevée est : pourquoi est-ce que certains chatbots ...

Lire la suite >

Posté le 10/06/2020 par Rym Laabiyad

IntroductionL’une des premières choses que l’on apprend en Machine Learning est qu’il faut souvent faire un compromis entre la performance d’un modèle et son interprétabilité. Les modèles transparents (interprétables by design, ou directement interprétables par un humain, comme la régression linéaire ou les arbres de décision) sont en général moins...

Lire la suite >

Posté le 09/06/2020 par

Introduisons les éléments de terminologie de l'Apache Kafka : topic, partition, consumer, producer...

Lire la suite >

Posté le 05/06/2020 par Julie Gallavardin, Laurent SOLLIER

Premier semestre 2018 : branle-bas de combat pour se mettre en conformité avec le RGPD. L’équipe projet a mis votre entreprise en conformité et identifié une liste de points à corriger.Deuxième semestre 2018 : le soufflé retombe. La liste à la prévert des préconisations serait-elle tombée aux oubliettes ?C’est un scénario réaliste si vous vous étie...

Lire la suite >

Posté le 27/05/2020 par David HUANG

Les réseaux de neurones convolutionnels permettent d’effectuer diverses tâches de traitement d’images, comme de la reconnaissance d’images ou la détection d’objets. (Cf article sur le fonctionnement des réseaux de neurones ici)Dans la suite de cet article, nous nous pencherons sur le cas réseaux de neurones convolutionnels pour la classification d’...

Lire la suite >

Posté le 13/05/2020 par Emmanuel Lin Toulemonde

IntroductionEn phase de construction d’un modèle de machine learning supervisé, les data scientists évaluent la performance de leur modèle par rapport aux labels en utilisant une métrique (par exemple l’AUC). Cela leur permet d’avoir un a priori sur les performances du système qu’ils sont en train de construire.Cette évaluation n’est qu’un a priori...

Lire la suite >

Posté le 05/05/2020 par Aurélien Massiot, Léa Naccache

Le Machine Learning nous permet aujourd’hui de classifier facilement du texte ; or, le texte appartient parfois à plusieurs catégories, d’où le nom de classification multilabels pour parler de cette tâche. Nous allons voir dans cet article comment traiter ce problème, évaluer la performance de nos algorithmes et les interpréter.Avant toute chose, l...

Lire la suite >