L’éditeur de base de données multimodèle et d’intégration des données ajoute des fonctions d’apprentissage machine à sa version MarkLogic 10.
Cette fonctionnalité intégrée de Machine Learning s’exécute au plus proche des données et peut être utilisée pour améliorer des opérations techniques de la base de données ou automatiser certaines tâches fonctionnelles du Data Hub MarkLogic telles que la validation, l’harmonisation ou le mastering des données.
C’est aussi une nouvelle possibilité offerte aux développeurs qui pourront dorénavant exécuter leurs processus spécifiques de Machine Learning directement au sein du Data Hub, sans avoir besoin d’exporter les données vers des outils tiers.
Une vue de l'écran de gestion de MarkLogic 10
Les fonctions s’appuient sur des briques technologiques éprouvées : le framework CNTK de Microsoft, la librairie CUDA de NVIDIA et le support du format ONNX qui facilite, entre autres, l’interopérabilité entre les différents outils du marché.
Le Microsoft Cognitive Kit (CNTK) voit ses fonctions exposées nativement dans xQuery et Javascript. Pour rappel CNTK décrit un réseau de neurones comme une série de calcul via un graphe assisté. L’utilisateur peut définir et combiner plusieurs types de modèles et les exécuter en parallèle sur des processeurs classiques ou graphiques.
ONNX est un format ouvert pour représenter les modèles d’apprentissage profond. Avec cet outil, les développeurs peuvent migrer les modèles vers leurs outils de prédilection et choisir la combinaison qui leur convient le mieux. Le format est soutenu par une large communauté de l’industrie.