@Daniele_Sunrise
Seit ca. 3 Wochen stelle ich vermehrt Teilausfälle beim Internet Zugang fest, d.h. Webseiten sind teilweise nicht verfügbar.
Zu meiner Infrastruktur:
- 1GB Connect Box im Bridge Mode
- OPNSense HA Cluster hinter der Connect Box
- zwei weitere Internet Zugänge (Init7 / SWISSCOM LTE) terminieren ebenfalls am OPNSense HA Cluster
ALLE drei Internet Anschlüsse werden über separate blackbox-exporter (http/https tests) / speedetest-exporter, prometheus und Grafana auf einem Docker Cluster überwacht.
Nun zum Fehlerbild:
Immer wieder stelle ich fest, dass vor Allem Schweizer Internet Seiten über den UPC Internet Anschluss plötzlich nicht mehr erreichbar sind. Namentlich nau.ch, blick.ch. Während der Ausfälle sind aber GitHub.com und google.com weiterhin verfügbar. Gleichzeitig zeigen Nau.ch und blick.ch dieses Verhalten über INIT7 und Swisscom LTE nicht.
Nach einer gewissen Zeit (random) erholt sich der Internet Anschluss wieder und Alles funktioniert wieder wie es soll. Während der Unterbrüche steigt die Latency von unter 200 ms auf über 4-5 Sekunden an, während via INIT7 und Swisscom LTE die Latency konstant unter 200ms / 400ms verharrt.
Letztmals trat das Fehlerbild heute zwischen 12:20:00h und 12:34:30h (apple.com / blick.ch), sowie zwischen 08:19:15h und 08:20:15h auf.
Gestern zwischen jeweils: 05:19:00 und 05:20:00, 05:30:00 und 05:31:00, 05:18:15 und 08:23:00, 08:34:00 und 08:39:30, 12:10:15 und 12:31:00, 12:35:00 und 12:41:30, 13:01:00 und 13:02:30, 15:16:00 und 15:20:15, 15:21:15 und 15:25:30h, 16:41:30 und 17:11:45.
Weder über Swisscom noch über INIT7 traten während dieser Zeit Probleme auf. Ebenfalls war der per DHCP zugewiesen UPC Gateway völlig unauffällig und via icmp problemlos erreichbar. Auch das Netzwerklog der UPC Box zeigte keine Fehler.
Während ich diese Zeilen schreibe, tritt das Fehlerbild seit 13:32:00 bis 13:51:00 ! nun erneut auf.
Ich kann somit ausschliessen, dass es an meiner Internetverbindung (letzte Meile), sowie an den Webseiten selbst liegt. Es scheint vielmehr, dass irgendwo im UPC Backbone etwas schief läuft. Nach meiner Erfahrung würde ich auf einen Backbone Router mit einem Memory Leak, oder fehlerhaften PGP / Routing Tables tippen.