Les projets individuels d’entrepôt de données doivent être évalués au cas par cas. Généralement, lorsque l'on tente d'étendre la conception d'un entrepôt de données existant pour mieux gérer l'analyse du Big Data, il existe un processus de base permettant de déterminer ce qui doit être fait. Les professionnels de l'informatique peuvent appeler cela une « mise à l'échelle » ou une « mise à l'échelle ».
La mise à l'échelle implique généralement de chercher à obtenir une puissance de traitement suffisante, une quantité de mémoire suffisante et de s'adapter à des activités de serveur plus puissantes pour gérer tous les ensembles de données plus volumineux que l'entreprise traitera. En revanche, la mise à l’échelle peut impliquer de collecter des clusters de matériel serveur et de les mettre en réseau pour rassembler le Big Data.
Certains experts informatiques ont suggéré que la méthode la plus courante avec Apache Hadoop et d'autres outils et plates-formes Big Data populaires consiste à étendre et à regrouper le matériel pour obtenir les effets souhaités. Cependant, d'autres soulignent qu'avec la technologie actuelle, un entrepôt de données peut évoluer en utilisant une stratégie d'approvisionnement qui ajoute des ressources à un serveur, par exemple en obtenant un nombre plus élevé de cœurs de traitement ainsi qu'une plus grande quantité de RAM.
Qu'ils soient évolutifs ou évolutifs, les entrepôts de données ont besoin d'actifs matériels physiques supplémentaires pour pouvoir gérer des charges de travail de données plus importantes. Ils ont également besoin d’une administration humaine supplémentaire, ce qui implique davantage de formation pour les équipes internes. Le projet nécessite beaucoup de planification pour déterminer le type de stress et de pression que les charges de travail de données plus importantes exerceront sur un système existant afin de l'adapter à un nouvel écosystème Big Data. Un problème majeur concerne les goulots d'étranglement du stockage, qui nécessitent des mises à niveau des centres de stockage, ainsi que d'autres types de goulots d'étranglement en termes de performances qui peuvent entraver un système naissant s'ils ne sont pas résolus.