2025-04-09 20:00 - 2025-04-14 14:05 Incident: Pèrdua de paquets en algunes connexions proveïdor upstream

2025-04-09 20:00 - 2025-04-14 14:05 Incident: Pèrdua de paquets en algunes connexions proveïdor upstream

Resum

Tipus Incident
Inici 2025-04-09 18:00 (UTC)
Final 2025-03-14 12:05 (UTC)
Tíquet #1185
Alertes
Reaccionen: asíncronament per xat: roger garcia, pedro, ramon, evilham; presencialment en datacenter: víctor
Impacte Pèrdua general de paquets en algunes connexions upstream, cap afectació clara a eXO però potencialment podia perjudicar
Reporten @exopedro, ^{amb supervisió de @…}

Línia de temps

Tots els temps en UTC.

  • 2025-04-09 18:00 INICI Incident roger garcia reporta que veu problemes intermitents en status.exo.cat (en relació a l’incident recent de IPv6), pedro comenta que potser es barregi amb alguna altre incidència en curs (alguna fibra que està desconnectada i fa de trigger)
  • 2025-04-10 08:55 ramon comenta que des d’ahir a la nit, determinat usuari amb determinada connexió tenia +10% en pèrdues
  • 2025-04-10 09:00 tant ramon com roger garcia corroboren que efectivament aquesta nit els backups no han acabat d’anar bé
  • 2025-04-10 09:47 roger garcia: s’ha tombat el peering que es creu que causa el problema
  • 2025-04-10 11:47 roger garcia: aprofitant un altre intervenció s’ha provat de canviar fuetons i transceptor i persisteix el problema
  • 2025-04-11 10:15 roger garcia: detecció problema: és un problema del switchos de mikrotik [que està en stack core i per allà passa tot el trànsit] (s’ha comprovat que amb un altre maquinari no generava pèrdues)
  • 2025-04-11 12:20 pedro: [fa una mica resum del problema tal com ho percep ell, com a problema general de connexió, i afegeix:] per si us ajuda a ubicar-ho, consistentment hi ha algun problema subtil de pèrdua amb diferents proveïdors i tal que jo pensava que era de guifi-comm1 gràfiques anella E-2024-1


  • 2025-04-11 13:00 roger i evilham: remarquen que no està clar d’on ve el problema un problema general d’eXO [tots estem d’acord]
  • 2025-04-11 15:16 pedro: ok, mirem de que almenys els backups que han reportat el problema tornin a la normalitat
  • 2025-04-14 12:05 rebem confirmació final que l’incident origen ja no hi és