Les travaux impliqués dans l'ingénierie de fiabilité des sites (SRE) peuvent varier considérablement en fonction des entreprises et des systèmes sur lesquels on travaille.
La définition de base de l'ingénierie de fiabilité d'un site est le processus consistant à confier les opérations à des personnes ayant une expérience en développement de logiciels, ou à mélanger ou combiner le travail de développement et les opérations d'une manière clé. Cela dit, le rôle de l’ingénieur en fiabilité du site implique souvent d’appliquer des approches de conception de haut niveau aux opérations.
L’approche consistant à utiliser l’ingénierie de fiabilité des sites est similaire à une autre approche appelée devops : les deux visent à combiner développement et opérations. Là où le développement est souvent décrit comme le processus de fusion des deux départements, l'ingénieur en fiabilité du site est souvent utilisé comme titre de poste, remplaçant le titre de poste d'administrateur système traditionnel. La différence est qu'en plus des systèmes de surveillance et de maintenance, un ingénieur en fiabilité du site appliquera également ces concepts de développement, ce qui est essentiel pour garantir que les programmes développés fonctionnent comme ils sont censés le faire.
Concrètement, un ingénieur en fiabilité du site peut être de garde pour surveiller les systèmes à tout moment. Cette personne peut rédiger des outils d'automatisation ou aider au développement de fonctionnalités d'assurance qualité. Les équipes SRE peuvent évaluer la disponibilité d'une application ou examiner comment les applications développées sont utilisées dans la pratique sur le terrain.
Dans le concept général de combinaison de développement et d’exploitation, le rôle du SRE est très flexible. Certains diront que cette approche tente également de « combler le fossé » entre les deux départements en termes de communication et de philosophie. Ainsi, une personne en SRE peut se retrouver dans un certain nombre de réunions pour parler concrètement de l'utilisation des produits et services développés. SRE peut être considéré comme une « partie prenante » dans le processus de développement, quelqu'un qui fournit des commentaires critiques sur l'ingénierie et la conception en gardant un œil sur les performances opérationnelles.
Bien que certains voient le SRE comme une sorte de rôle d'administrateur système déguisé, des entreprises comme Google adoptent le concept du SRE et investissent beaucoup plus dans la définition du rôle de ce type de professionnel. Les ingénieurs de Google évoquent certaines des contributions très importantes qui peuvent être apportées au processus SRE et décrivent ces professionnels comme étant hautement qualifiés et expérimentés, ce que les administrateurs système traditionnels n'auraient peut-être pas eu.