FAQ

Pourquoi les gestionnaires devraient-ils se prémunir contre la redondance des bases de données ?

Les gestionnaires de bases de données et autres professionnels de l'informatique doivent se prémunir contre la « redondance des bases de données » ou la « redondance des données » en raison de tous les impacts négatifs que la redondance peut avoir sur un système ou un environnement de base de données. Chaque fois qu'une certaine donnée est dupliquée, soit dans deux champs d'une base de données, soit dans deux environnements de base de données différents, cela peut avoir des conséquences sur la récupération des données.

L’une des premières raisons pour éviter la redondance des données est qu’elle peut être inutile ou excessive.

Il est important de souligner que certains types de redondance des données sont prévus, afin de sauvegarder et sauvegarder les données. Cependant, d’autres résultent d’un codage médiocre ou inefficace, ou du manque d’attention portée aux meilleures pratiques. Dans de nombreux cas, de grandes quantités de données redondantes entraînent une croissance rapide de la base de données au-delà d’une taille raisonnable. Dans cette optique, de nombreux efforts de lutte contre la redondance des données sont déployés pour économiser de l'espace dans une base de données et, par conséquent, pour réduire les coûts et les efforts de maintenance. Cependant, cela doit être fait dans un souci de praticité : les ingénieurs peuvent pratiquer ce qu'on appelle la déduplication des données, mais cela doit être fait d'une manière efficace.

Par exemple, les gestionnaires de bases de données peuvent envisager de supprimer une chaîne d'un champ répété, tel qu'un nom de client ou de société partagé, et de la remplacer par une simple référence de variable où la chaîne est conservée ailleurs. Cela peut économiser de l'espace sur une base de données, mais cela peut également nécessiter plus d'activité du serveur pour exécuter une requête donnée, ce qui peut ne pas être aussi efficace qu'il y paraît.

Une autre grande raison de dédupliquer les données ou d’éviter la redondance des données est la confusion qui peut en résulter. Les données redondantes dans une base de données peuvent provoquer différents types d'anomalies. L’une d’elles est appelée anomalie de mise à jour : des anomalies de mise à jour se produisent lorsqu’un enregistrement est ré-saisi avec des informations mises à jour, mais que la mise à jour ne revient pas à l’enregistrement d’origine. Dans une telle situation, il peut y avoir trois enregistrements différents pour un employé particulier de l'entreprise, avec trois titres de poste différents et trois adresses différentes, car les informations sur la personne n'ont pas été mises à jour dans l'ensemble de la base de données, mais uniquement dans le dernier enregistrement saisi.

Comme le suggèrent les experts, les administrateurs de bases de données peuvent éviter la redondance des données dès leur conception. Ils peuvent également s'engager dans des pratiques de normalisation des données qui peuvent corriger les anomalies de mise à jour et d'autres types d'anomalies en standardisant la manière dont les enregistrements des tables de base de données sont conservés. Les administrateurs de bases de données peuvent également poursuivre leurs efforts de déduplication des données pour nettoyer et standardiser les données par d'autres moyens. Tout cela a pour objectif de créer des tables de base de données plus propres, de rendre les enregistrements de base de données plus cohérents et d'éviter tous les maux de tête et problèmes complexes associés à la redondance imprévue des données.