Pour rappel, La solution de l’éditeur se décompose en 3 éléments :
- MapD Core, un moteur qui permet de requêter sur des milliards de lignes en quelques millisecondes par un moteur SQL optimisé pour les environnements GPU en open source;
- un moteur de rendering qui fait le lien entre le moteur de requête;
- et MapD Immerse, un outil de visualisation des données interactif.
Un outil de compilation rapide permet à la solution de fonctionner à la fois sur des CPU ou des GPU suivant le choix des utilisateurs et du volume des données. Un cache intelligent positionne les données chaudes dans la mémoire principale ou la mémoire virtuelle des GPU. Le système peut s’appuyer sur des disques Flash pour assurer la persistance des données. La solution évolue en scale-out fournissant des performances prédictibles lors de son évolution. Les visualisations peuvent être partagées et être interactives même avec des milliards de points par l’API Vega dont les spécifications de rendus sont générées en tâche de fond.
MapD dans le cloud
La version cloudifiée propose les mêmes performances et fonctionnalités que la version sur site et s’appuie sur des GPU de NVidia. L’avantage de cette formule est de ne pas avoir à gérer les infrastructures GPU ni d’avoir à les acheter pour profiter de la technologie dans l’analyse de flux de données massifs.
La solution se place très agressivement en termes de coût avec un prix d’entrée de 150 $/mois pour 10 millions de lignes de données structurées. Une version d’essai de 2 semaines est gratuite et propose la possibilité d’analyser des jeux de données de 100 millions de lignes. De quoi réaliser des PoC à grande échelle ! La solution peut supporter jusqu’à des dizaines de milliards de lignes.