カルダノの世界規模ネットワーク障害に対する耐性

2020年8月30日日曜日の午前10時(午前12時CEST)に、米国に拠点を置くインターネットサービスプロバイダ センチュリーリンク において、ダウンディテクターダウンディテクターのスクリーンショットで示されたような、大規模なネットワーク停止が発生しました。

ほぼ瞬時に多くのネットワークおよびITインフラストラクチャの監視システムが世界中で赤くなりました。シスコのサウザンドアイズ停止中継ダッシュボードでは、巨大で異常なピークを示しました。.

この問題の原因となったBGPルーティングの失敗,を次に示します。すでにRPKI が一定期間使われてきたにもかかわらず、このようなアナウンスの失敗が発生するのは驚くべきことです。RPKIの暗号証拠がこの信用問題の解決策となります。

従って、これはカルダノシェリーメインネットに起こりうる影響を観察する最初の良い機会となります。

これはまだ立ち上げ後の最初の月であり自動P2Pシステムになっていません。その代わり、プールオペレータは手動ピア リストを持つことができます。また、トポロジーアップデートサービスによる半自動生成リストを使用できます。

開発中の現段階で、どのような安定性を達成できるのでしょうか?

突然のグローバルルーティングの問題に対して予想外に弱いピアリングクラスタの地域ができたでしょうか? 多くのオペレータが安易ににIOHK ブートストラップ ノードのみにつなげようとしたでしょうか?

次の図は、ロケーションがドイツのリレー ノードを示しています。興味深い3つの本質的な特性曲線が確認できます。

BGPルーティング障害のカルダノメインネット接続状態への影響

上の緑色の線は、接続されたリモート ピアで約 25% の大幅な低下が見られます。チェーン密度を示す真ん中の赤い線は、5%前後が理想的な値であり、大幅に低下すべきではありません。それは起こらなかったので、これは非常に良い状態です。また、MemPoolにトランザクションが蓄積されなかったことも一番下の茶色の線で確認できます。したがって、それらは常にできるだけ迅速に処理され、ブロックに収められました。

他の地域の他のノードは多少の違いはありながらも似たような状況でした。ネットワークや接続の不具合は認められませんでした。

停止と復旧

CLIO1は、P2Pネットワークの導入まで、トポロジアップデータを開発し、カルダノネットワーク内のすべてのステークプールに無償で提供しているため、このネットワークの問題が約660個の登録済みプールノードの通信にどのような影響を与えたかを示すグラフを描くことができます。

次の図は、約 60 個のノード、つまりノードの約 10% が接続されなくなったことを示しています。

また、グローバル ルーティングの問題が解決した後、接続は比較的迅速に復元されたこともわかります。(緑 = 接続 / 赤 = 未接続)

結局、グローバルなインターネットサービスの多くの失敗を伴うこの非常事態は、分散化されたカルダノ・メインネットにとって問題にはなりませんでした。

しかし、今後さらに大きな問題が発生するかもしれないため、十分な訓練を受けて何をしているかを熟知しているStakePoolオペレーターの確保が重要です。