2025-04-09 20:00 - 2025-04-14 14:05 Incident: Pèrdua de paquets en algunes connexions proveïdor upstream
Resum
Tipus | Incident |
Inici | 2025-04-09 18:00 (UTC) |
Final | 2025-03-14 12:05 (UTC) |
Tíquet | #1185 |
Alertes | Sí |
Reaccionen: | asíncronament per xat: roger garcia, pedro, ramon, evilham; presencialment en datacenter: víctor |
Impacte | Pèrdua general de paquets en algunes connexions upstream, cap afectació clara a eXO però potencialment podia perjudicar |
Reporten | @exopedro, ^{amb supervisió de @…} |
Línia de temps
Tots els temps en UTC.
- 2025-04-09 18:00 INICI Incident roger garcia reporta que veu problemes intermitents en status.exo.cat (en relació a l’incident recent de IPv6), pedro comenta que potser es barregi amb alguna altre incidència en curs (alguna fibra que està desconnectada i fa de trigger)
- 2025-04-10 08:55 ramon comenta que des d’ahir a la nit, determinat usuari amb determinada connexió tenia +10% en pèrdues
- 2025-04-10 09:00 tant ramon com roger garcia corroboren que efectivament aquesta nit els backups no han acabat d’anar bé
- 2025-04-10 09:47 roger garcia: s’ha tombat el peering que es creu que causa el problema
- 2025-04-10 11:47 roger garcia: aprofitant un altre intervenció s’ha provat de canviar fuetons i transceptor i persisteix el problema
- 2025-04-11 10:15 roger garcia: detecció problema: és un problema del switchos de mikrotik [que està en stack core i per allà passa tot el trànsit] (s’ha comprovat que amb un altre maquinari no generava pèrdues)
- 2025-04-11 12:20 pedro: [fa una mica resum del problema tal com ho percep ell, com a problema general de connexió, i afegeix:] per si us ajuda a ubicar-ho, consistentment hi ha algun problema subtil de pèrdua amb diferents proveïdors i tal que jo pensava que era de guifi-comm1 gràfiques anella E-2024-1
- 2025-04-11 13:00 roger i evilham: remarquen que no està clar d’on ve el problema un problema general d’eXO [tots estem d’acord]
- 2025-04-11 15:16 pedro: ok, mirem de que almenys els backups que han reportat el problema tornin a la normalitat
- 2025-04-14 12:05 rebem confirmació final que l’incident origen ja no hi és