La resistenza di Cardano ai problemi di rete su scala globale
Domenica 30 agosto 2020 alle 10:00 UTC (12:00 CEST) l’Internet service provider CenturyLink, basato in US, ha avuto una grave interruzione dei servizi di rete, come visibile in questo screenshot di Downdetector

Quasi istantaneamente molti sistemi di monitoraggio delle reti e delle infrastrutture IT sono diventati rossi in tutto il mondo. La dashboard live ThousandEyes Outage di Cisco ha mostrato un picco notevole e straordinario.

Ecco una descrizione dell’errore di routing BGP che ha causato questo problema. È sorprendente che tali fallimenti di notifica possano ancora verificarsi dove RPKI è già stato usato per un certo tempo. Fornisce prove crittografiche come soluzione a questo problema di fiducia.
Quindi questa è una prima buona opportunità per osservare i possibili effetti sulla Cardano Shelley Mainnet.
Non è ancora basato su un sistema automatico P2P nel primo mese dopo il lancio. Invece, gli operatori delle pool possono mantenere liste di peer manuali. O in alternativa usare liste generate semi-automaticamente dal servizio TopologyUpdater.
Quale stabilità può essere raggiunta in questa fase di sviluppo?
Si sono formati cluster regionali di peering che reagiscono in modo inaspettatamente debole a improvvisi problemi di routing globale? Molti operatori hanno deciso di effettuare connessioni solo con i nodi bootstrap IOHK per semplicità?
Il seguente diagramma mostra un nodo relay locato Germania. Siamo ora interessati a tre curve caratteristiche essenziali:

La linea verde superiore mostra cali significativi di circa il 25% nei peer remoti collegati.
La linea rossa centrale mostra la densità della catena è idealmente un valore intorno al 5% e non dovrebbe scendere significativamente. Il fatto che non sia successo, è un ottimo segno.
Potete anche vedere dalla linea inferiore marrone che le transazioni nella Memmoria della Pool non si sono mai accumulate. Perciò sono sempre state processate il più velocemente possibile e impacchettate in blocchi.
Altri nodi in altre regioni hanno mostrato effetti simili, più o meno pronunciati. In nessun caso conosciuto questo ha portato a una rete ed a una comunicazione insufficiente.

Interruzione e Ripristino
Poiché CLIO1 ha sviluppato il TopologyUpdater e lo sta fornendo gratuitamente a tutte le stake pool della rete Cardano fino all’introduzione della rete P2P, è anche possibile disegnare un grafico che mostra come questo problema di rete ha influenzato la comunicazione dei circa 660 nodi pool registrati.
Il seguente grafico mostra che circa 60 nodi, cioè circa il 10% dei nodi non avevano più la connessione.

E si può anche vedere che la connessione è stata ripristinata relativamente rapidamente dopo che i problemi di routing globale sono stati risolti. (verde = raggiungibile / rosso = non raggiungibile)
Tutto sommato, questo evento insolito, con molti fallimenti dei servizi Internet globali, non è stato un problema per la rete decentralizzata Cardano Mainnet.
Ma altre sfide più grandi seguiranno, quindi è importante avere operatori di StakePool ben addestrati che sappiano davvero cosa stanno facendo.