Data Steward Studio (DSS) vise à apporter une vision consistante de la sécurité et de la gouvernance des données au travers des différents référentiels de données présents dans ou hors de l’entreprise. A partir de ce module, les métiers peuvent évaluer le niveau de confiance dans les données présentes et les partager de manière sécurisée dans l’entreprise pour obtenir de meilleurs résultats d’analyse à partir des données sises dans les différents data lakes utilisés.
DSS est le deuxième service, ou la deuxième application développée par Hortonworks autour de sa plate-forme de gestion des données, composant de la nouvelle architecture de données au cœur de la plate-forme HDP, actuellement la version 2.6. Le logiciel fournit un moyen aisé de trouver, d’organiser, de collaborer et d’échanger de manière sécurisée des rapports sur les données et leur contexte pour faciliter le travail des analystes ou des data scientists.
Un steward riche de fonctions
L’organisation des données se réalise suivant différents critères comme des critères métiers ou les règles de protection autour des données concernées. Il est aussi possible de découvrir, chercher et cataloguer les données sensibles ou avec des caractères spécifiques comme les données personnelles. Les données peuvent être regroupées par caractéristiques comme l’origine, la sensibilité, l’utilisation fonctionnelle, le niveau de protection ou la valeur. La solution permet de suivre le lignage des données et sécurise les données et les métadonnées. DSS est délivré sous forme de services et s’appuie sur 2 services, Apache Atlas et Apache Ranger.
Data Lifecycle Manager connaît une version mise à jour. Cette version, qui sera disponible lors du prochain trimestre, permettra d’encapsuler et de copier les données des environnements physiques vers des environnements de clouds publics autorisant une mobilité totale des données selon la tâche à effectuer dans l’environnement le plus adapté.
Scott Gnau, CTO d'Hortonworks lors de la présentation de DSS.