Actions











Explications sur la panne prolongée

Écrit le 21 juillet 2019 @ 07:15 par Drizzt

Site - Entretien/TweakBonjour tout le monde!

Nous avons vécu une panne prolongée, du 18 au 20 juillet dernier, dont la source était un entretien par Hydro-Québec du réseau électrique. Hydro-Québec a coupé l'électricité pendant environ 3 heures, ce qui était trop long pour mes UPS. Malheureusement, celui des serveurs n'est pas revenu en ligne de lui-même.

J'ai demandé à un ami habitant la même ville de venir les allumer, mais d'autres pépins ont été découverts. Continuez la lecture pour plus de détails.

Problème 1 : Courriels en panne

Cause :

La configuration de mon commutateur Cisco SG200 causait problème avec la configuration de mes serveurs de virtualisation. À chaque fois que ce commutateur était éteint et rallumé, un réseau virtuel (VLAN) était perdu dans une partie de la configuration. Ce réseau est celui des serveurs internes, servant à l'authentification entre autre pour les serveurs de courrier électronique.

Solution :

J'ai trouvé une autre façon de faire cette configuration. Je l'ai testée plusieurs fois hier soir pour arriver à une configuration fonctionnel au démarrage du commutateur. Ce problème devrait donc être définitivement résolu.

Problème 2 : Site web en panne

Cause :

Un fichier journal de la base de données du site web s'est corrompu sur le serveur Web1. Le serveur Web2 a démarré dans un état incomplet à cause d'un problème de synchronicité. Le site web a donc été hors ligne, alors que les serveurs étaient opérationnels.

Solution :

J'ai restauré les bases de données de Web2 sur Web1, ramenant un état fonctionnel. J'ai aussi modifié l'ordre de démarrage des machines virtuelles, en espérant régler le problème de synchronicité.

Conclusion :

Les tests d'extinction complète sont, par nature, des tests qui sont rarement faits. Cette fois-ci, nous avons définitivement échoué ce test. J'ai aussi tenté de modifier la configuration de l'UPS pour qu'il mette plus de temps à s'éteindre, ce qui devrait permettre aux machines virtuelles une extinction correcte.

En espérant que ces problèmes ne se présentent pas la prochaine fois!

Pas de commentaires


Tous les blogs
<< Crème d'administrateur | Retour aux blogs | Suggestions d'une distribution Linux pour un serveur d'une petite organisation >>
Blogs de la même catégorie
<< MenzoNet maintenant en HTTPS! | Retrait de la connectivité IPv6 >>