Indisponibilitat de servei de matrix.guifi.net i element.guifi.net
Resum
Tipus | Incident |
Inici | 2025-03-16 19:30 (UTC) |
Final | 2025-03-16 22:54 (UTC) |
Tíquet | - |
Alertes | sí |
Reaccionen | @exopedro |
Impacte | Indisponibilitat de servei de matrix.guifi.net |
Reporten | @exopedro |
La pàgina de element.guifi.net estava en blanc, també la del meu client; així que he fet apt upgrade
(hi havia bastantes actualitzacions pendents), reboot
i s’ha arreglat
Línia de temps
Tots els temps en UTC.
- 19:30 INICI incident
- 20:30 reinici upgrade
- 22:30 ajustament apropiat a últimes versions de matrix i element
- 22:54 FINAL incident
Detecció
Via alertes de status.exo.cat
I esbrinat inici i final via els emails:
- email Subject: (FIRING:2) exo (eXO Error: Servidor Matrix status.exo.cat matrix https://matrix.guifi.net/_matrix/key/v2/server/ pubcommunications error); From: Adler; Date: 2025-03-16 19:15:55 (UTC)
- email Subject: (RESOLVED) exo (https://matrix.guifi.net/_matrix/key/v2/server/); From: Adler; Date: 2025-03-16 21:25:55 (UTC)
- email Subject: (FIRING:2) exo (eXO Warning: Servidor Matrix status.exo.cat matrix https://matrix.guifi.net/_matrix/key/v2/server/ pubcommunications warning); From: Adler; Date: 2025-03-16 21:55:55 (UTC)
- email Subject: (FIRING:2) exo (eXO Error: Servidor Matrix status.exo.cat matrix https://matrix.guifi.net/_matrix/key/v2/server/ pubcommunications error); From: Adler; Date: 2025-03-16 22:00:55 (UTC)
- email Subject: (RESOLVED) exo (https://matrix.guifi.net/_matrix/key/v2/server/); From: Adler; Date: 2025-03-16 22:55:55 (UTC)
Possible millora d’alertes
Que segueixi així
Accionables: bug en unattended sysupgrade
convindria alguna política de unattended sysupgrade, però no val la de per defecte, l’actualització de matrix a vegades és delicada (en base a experiències prèvies) i convé fer-la manualment → https://farga.exo.cat/exo/projectes/issues/1176
bugfix unattended-sysupgrade
finalment ho he fet al moment ( també en https://farga.exo.cat/exo/projectes/issues/1176#issuecomment-26981 )
he aplicat això, tot i que em quedo mosca perquè unattended ja estava habilitat i no actualitzava (?)
últim upgrade és de fa unes setmanes /var/log/unattended-upgrades/unattended-upgrades.log.1.gz
2025-01-20 06:25:34,234 INFO Initial blacklist:
2025-01-20 06:25:34,234 INFO Initial whitelist (not strict):
2025-01-20 06:25:35,151 INFO No packages found that can be upgraded unattended and no pending auto-removals
ok, el va borrar el autoremove, gràcies etckeeper
commit a738068a00e380b1e6314d295d63750307728bbe
Author: localhost <localhost>
Date: Mon Jan 20 10:17:44 2025 +0100
committing changes in /etc made by "apt autoremove"
tested another execution unattended-upgrades -v -d
(that way I saw that it was command not found) unattended-upgrades do not work properly - Ask Ubuntu
[23:09:20] root@matrix-guifi-net:/etc# cat /etc/apt/apt.conf.d/99-matrix
Unattended-Upgrade::Automatic-Reboot "true";
Unattended-Upgrade::Package-Blacklist {
"matrix-synapse-py3";
"matrix-org-archive-keyring";
"element-web";
"element-io-archive-keyring";
};
bugfix versions estables de element-web i synapse
No s’estaven actualitzant les versions, primer perquè s’havien expirat les claus dels repositoris, i al reestablir-les, vaig reiniciar malament els repositoris i com que no estava actualitzat, es negava a funcionar el client.
Fins que no he actualitzat a últimes estables no s’ha estabilitzat tla situació
Unpacking element-web (1.11.95) over (1.11.90) ...
Unpacking matrix-synapse-py3 (1.126.0+bookworm1) over (1.122.0+bullseye1) ...