FAQ

Que signifie le Big Data pour les statistiques officielles ?

La question de savoir dans quelle mesure les mégadonnées peuvent modifier les statistiques officielles et les recherches des agences fédérales ou gouvernementales est fascinante, en partie en raison de la nature des systèmes modernes d’exploration et de collecte de données.

D’une certaine manière, le Big Data entre en concurrence avec d’autres méthodes traditionnelles de collecte d’informations. Par exemple, des données largement regroupées provenant d'Internet peuvent constituer un indicateur plus précis que ce qui est produit par une « communauté d'experts » dans un secteur donné. Cela signifie que les mégadonnées peuvent pousser différents types de statistiques officielles vers des prévisions plus précises ou une méthodologie plus efficace.

Une autre raison pour laquelle les données sont susceptibles de modifier les statistiques officielles est que les futures méthodes de recherche pourraient intégrer des solutions Big Data afin de bénéficier de cette composante d'un effort de recherche. Par exemple, le US Census Bureau effectue de nombreux audits physiques des personnes, des bâtiments et des infrastructures aux États-Unis, en basant ses statistiques sur des observations et des réponses en temps réel. Intégrer le Big Data aux efforts du US Census Bureau pourrait impliquer de regrouper les données Internet sur ces mêmes systèmes et de les comparer à ce que les travailleurs découvrent sur le terrain. Il existe de nombreuses façons d’intégrer le Big Data et la recherche sur le terrain, qui détermineront les résultats spécifiques de tout type de projet de recherche économique, social ou industriel.

En bref, les mégadonnées transformeront les statistiques officielles en une forme de reporting plus moderne et sophistiquée, dans laquelle une tabulation physique minutieuse est renforcée par des modèles techniques et des algorithmes qui fonctionnent sur la base d’une moyenne ou d’une projection à partir d’énormes volumes de données extraites ou collectées. Ce n’est qu’une des raisons pour lesquelles les vastes quantités de données massives collectées par les gouvernements et les entreprises sont si précieuses et soigneusement gardées.