Retour sur la panne du 23/06/2021

Retour sur la panne du 23/06/2021

Étant en congés la semaine passée j’ai fait de mon mieux pour remettre en route le plus rapidement possible les services de sud-ouest2.org … maintenant de retour voici un compte rendu de la panne.

  • 23/06/2021 8h57 le serveur numéro 2 tombe en panne
  • à 11h06 notre hébergeur (ovh) nous informe l’avoir relancé après avoir remplacé la carte mère hs

Le serveur a eu besoin d’un coup de pouce pour repartir, coup de pouce humain possible de la part d’un admin de l’asso … pour ma part étant en congés je n’ai été informé de la panne que dans la fin d’après midi et n’ai pu intervenir que vers 19h puis vers 22h pour terminer la remise en route réelle des services mails (coup de bol je n’étais pas dans une zone sans couverture internet).

Dernière ligne de log avant le crash 8h48 sur un des serveurs relais mail sortant puis 1ere ligne du même serveur à 19:14:

Jun 23 08:48:06 mx-out-01 postfix/qmgr[31178]: 1FA0A4E: removed
Jun 23 19:14:43 mx-out-01 opendkim[188]: OpenDKIM Filter v2.11.0 starting (args: -P /var/run/opendkim/opendkim.pid -p inet:12345@localhost)

Le service “hébergement de fichiers cloud” qui est toujours en tests n’a été relancé pour sa part que le lendemain dans la soirée (autre “fenêtre” de temps prise sur mes congés).

N’oubliez pas que si vous ne financez pas le système nous ne pouvons pas le faire évoluer et renforcer sa capacité à prendre des coups … actuellement nous avons 325 factures “clients” impayées pour un montant total de 4 271,26 € … les petites gouttes font les grandes rivières, ne laissez pas traîner vos factures de 2 ou 5€ !

N’hésitez pas à faire aussi un peu de “pub” autour de vous pour qu’on puisse se donner les moyens de multiplier par 5 le nombre d’adhérents et ainsi prendre d’autres serveurs pour solidifier l’ensemble de l’infrastructure et la rendre plus résiliente à ce genre de panne !

Merci pour votre compréhension

Éric