FAQ

Quelles sont les questions clés à prendre en compte dans une stratégie de stockage Big Data ?

L’un des problèmes les plus négligés en matière de stockage de Big Data est l’accessibilité pour les équipes qui en ont besoin. Les données sont régulièrement stockées sans documentation, dans des endroits difficilement accessibles ou où les équipes concernées ignorent même qu'elles existent. En fin de compte, le stockage du Big Data devrait adopter une première stratégie ouverte où les équipes sont informées de son existence, de la composition des données et de la manière d'y accéder, afin que les équipes puissent les utiliser dans le logiciel si elles en ont besoin.

Un autre problème critique que je trouve est la qualité des données stockées. Les données doivent être stockées sous la forme de la plus haute qualité possible dans leur lieu de stockage final. Le stockage de données de faible qualité dans un lac de données est généralement acceptable, mais à mesure qu'elles progressent dans le pipeline de données, chaque étape devrait augmenter la qualité des données de manière à ce qu'elles soient stockées sous la forme de la plus haute qualité dans un système tel qu'un entrepôt de données ou une base de données analytique. Cela augmentera la qualité des systèmes qui consomment le lieu de repos des données.