Pour s'imposer comme le boss du Big Data, Cloudera et Hortonworks ont fusionné. En résulte une plateforme unifiée reprenant le meilleur de leurs solutions respectives, baptisée Cloudera Data Platform, une architecture globale déclinant ses services du Edge à l'IA.
Après Berlin l'an passé, c'est à Barcelone que Cloudera tient son Dataworks Summit. Un événement marqué cette année par la fusion entre Hortonworks, l'organisateur historique du Summit, et Cloudera. Annoncée en octobre dernier elle est désormais bouclée.
Sur scène, Mick Hollison, le CMO de l'entreprise revient sur la nouvelle entité, qui conserve le nom Cloudera (avec un nouveau logo cependant). Il explique que les deux entreprises ont commencé les discussions « il y a trois ou quatre ans », avant que leur rapprochement ne se concrétise à l'été 2018, pour être annoncé en octobre et finalisé en trois mois. Une rapidité que le CMO impute au fait que, malgré la concurrence des deux sociétés, « leurs développeurs travaillaient depuis des années autour de projets open souce ».
Il aborde en outre les évolutions des plateformes Cloudera Data Hub (CDH) et Hortonworks Data Platform (HDP) et en profite pour préciser les contours de la « plateforme cohérente unique », baptisée Cloudera Data Platform (CDP), qui remplacera à terme les deux autres. L'ambition derrière cette dernière est de reprendre le meilleur de CDH et de HDP afin de fournir aux entreprises une solution « du Edge à l'IA », pour reprendre le mantra de Cloudera, avec des services s'étendant de la data ingestion au machine learning en passant par le data warehousing.
Cloudera Data Platform
A la presse, Fred Koopmans, vice-président en charge du Product Management, explique que CDP s'incarne dans une architecture unifiée passant par des API ouvertes fonctionnant aussi bien sur des clouds publics que privés, ainsi qu'en environnements hybrides et multicloud.
Afin d'assurer la gouvernance des projets Big Data sur l'ensemble des instances indépendamment du type d'infrastructure, CDP embarque Altus Data Plane. La sécurité est également de mise : le VP Product Management évoque la solution Apache Metron. Toujours dans ce souci d'unification du meilleur des deux mondes, il est question d'une console centralisée embarquant les outils de gestion mais aussi des fonctions liées à la confidentialité des données.
Une première version de CDP sera livrée en juin prochain. Cette mourture sera réservée aux cloud AWS et Azure et comportera les partie data engineering et machine learning. La version cloud privé attendra quant à elle décembre 2019, et introduira la dimension conteneurisation.
Des outils de migration permettront de passer des HDP et CDH à CDP, sachant qu'il sera possible de migrer depuis les versions Hortonworks 2 et Cloudera 5, les plus récentes (3 et 6) ayant été livrées l'été dernier. HDP et CDH seront néanmoins maintenues pendant au moins trois ans et bénéficieront elles aussi des bienfaits de la fusion avec l'ajout d'améliorations issues de leur ex-concurrente respective.