Dans l’idée d’un écosystème ou d’une industrie globale du Big Data, les applications des stratégies Big Data sont spécifiques aux besoins d’une entreprise ou d’une organisation particulière. L’une des plus grandes erreurs commises par les dirigeants et autres professionnels est d’adopter une approche générique du Big Data et d’essayer d’intégrer les systèmes dans un modèle qui a déjà été utilisé.
La philosophie du Big Data repose sur une utilisation très ciblée et microgérée de vastes pools d’informations. Par exemple, une entreprise qui compte des milliers et des milliers de clients entreprendra un projet Big Data pour exploiter toutes les informations dont elle dispose sur ces clients – leurs noms, où ils habitent, ce qu’ils ont acheté auparavant, etc. Il s'agit plus de mettre en place des structures spécifiques pour la manipulation des données et le reporting que de simplement collecter et « exécuter » ces ensembles de données massifs.
Une partie du défi du Big Data réside dans le fait qu’il nécessite des processus matériels plus spécialisés. Les entreprises utilisent souvent des systèmes open source comme Apache Hadoop et des outils connexes spécifiques comme MapReduce pour mettre en œuvre des solutions Big Data. Cela nécessite un savoir-faire technique supplémentaire, au-delà de la simple configuration d'une table Microsoft Access ou de l'utilisation d'une autre technologie de base de données plus simple.
Pour rendre le Big Data efficace, les entreprises doivent réfléchir à leur mise en œuvre et aux moyens d’éviter de perturber leurs activités commerciales normales. Pour que cela soit le plus efficace possible, ils doivent déterminer exactement quels ensembles de données leur seront les plus utiles. Par exemple, si les vendeurs ou autres peuvent faire ce qu'ils doivent faire avec un simple rapport contenant uniquement les noms de famille, les états et les numéros de téléphone, cela n'a pas de sens d'essayer de traiter des données plus complètes via le système et d'essayer de collecter et de présenter d’autres identifiants ou informations clés.
L'efficacité, la facilité de mise en œuvre et le coût conduisent à l'émergence de solutions Big Data spécifiques à l'entreprise. Ces innovations dépendent certainement d’un modèle économique particulier et des problèmes à résoudre.