エッジAIラボ
エッジAIラボ
🛡️

連合学習ポイズニング攻防ラボ — 壊そうとしても壊れない

あなたが攻撃者になって連合学習モデルを毒してみる体験デモ。サーバーと同じ品質ゲートがブラウザ内で再現され、汚染された更新がどう無害化されるかを目の前で確認できます。

ブラウザ内で完結 — データ送信なし🟢 📦 約108KB🤖 MNIST CNN + 品質ゲート再現⚖️ 自作

なぜ「悪意があっても壊れない」のか

不特定多数が参加する連合学習では、わざと壊そうとする参加者(ポイズニング攻撃)への対策が必須です。 重要なのは「単一の更新から悪意を完璧に見分ける」ことではなく、悪意があっても結果としてモデルが悪くならない仕組みにすることです。

🚪 品質ゲート(単調非減少ラチェット)

移動量の異なる候補を検証セットで全評価し最良を採用。精度を下げる更新は棄却。グローバル精度は決して下がらない。

✂️ 移動量の上限制御

どんなに大きな差分でも、1回にグローバル重みが動ける距離(L2ノルム)に上限。単一更新がモデルを支配できない。

🔒 検証セットの秘匿

本番では採点表(検証セット)をサーバー内に隠す。採点表を知られなければ『採点だけ通る悪意』を作れない。

🛡️ 評判クールダウン

明白な汚染を繰り返すIPに一定時間のクールダウン。正常な貢献は罰しない。

正直な限界: 全体精度を保ったまま特定パターンにだけ誤反応を仕込む「バックドア攻撃」は、検証精度ベースの防御だけでは原理的に完全には防げません。 実運用では差分プライバシーやロバスト集約(中央値・Krum等)を併用します。本ラボは「ゲートにより悪意を無効化できる」という防御の要点を体感する目的です。

連合学習を体験・理解する

攻撃側を体験したら、今度は正直な参加者として「みんなで育てるAI」に貢献してみてください。 仕組みの全体像はガイド記事で解説しています。

シェア: