エッジAIラボ
エッジAIラボ
↕️

垂直連合学習デモ — 違う特徴を持つ2社が中間値だけ交換

同じ対象(同一ID)について、異なる特徴量を持つ2社が、生データを渡さず中間値だけを交換して結合モデルを学習。各社単独では引けない『斜めの境界』をブラウザ内で体験できます。

ブラウザ内で完結 — データ送信なし🟢 📦 0MB(ブラウザ内学習)🤖 加法ロジスティック回帰(split learning風・自作)⚖️ 自作

垂直連合学習(VFL)とは

垂直連合学習は、同じサンプル(行=同一の顧客・地点・対象)について、各者が異なる特徴量(列)を持つ構成の連合学習です。 「同じ顧客の、銀行は与信情報を・ECは購買履歴を持つ」「同じ構造物の、測量会社は点群形状を・自治体は台帳属性を持つ」のように、データが縦(特徴)方向に分かれているケースで使われます。

各社は自分の特徴で部分スコア(中間値)を計算し、その中間値と誤差信号だけを交換して結合モデルを学習します。 生の特徴量も、相手の列も一切共有しません。前提として、同じ対象であることをIDで照合(プライバシー保護した突合)しておく必要があります。

水平FLとの違い・このデモの読み方

水平FL(HFL)

同じ特徴・違うサンプル。各拠点が同じ列を持ち、行が異なる。例:複数病院が同じ検査項目で別々の患者を学習。

垂直FL(VFL・本デモ)

同じサンプル・違う特徴。同じ対象について各社が別々の列を持つ。中間値だけ交換して結合する。

  • A社単独(縦線)は横軸の特徴だけ、B社単独(横線)は縦軸の特徴だけ。どちらも片方しか見えず精度が頭打ち。
  • 垂直FL(斜め線)は両社の特徴を結合でき、生データを集めた集中学習とほぼ同等の精度に到達します。

関連

全体像は 連合学習 完全ガイド 、水平FLは 水平連合学習デモ をどうぞ。連合転移学習のデモも順次公開します。

精度を上げるには — 実務の対応策

このデモは加法モデルへの単純化です。実際の垂直連合学習では、特徴とID照合の質が精度を左右します。

  • ID照合(PSI)の精度と重複サンプルを増やす: Private Set Intersection で安全に突合し、共通サンプルが多いほど学習が安定します。
  • 特徴量エンジニアリング・特徴選択: 各社が効く特徴を作り込み、寄与の小さい列を削る。重要度分析で投資配分を決める。
  • 中間表現の表現力を上げる: 部分モデルを線形から多層(split neural network)にし、中間次元を調整する。
  • 前処理の整合: 各社で正規化・スケール・欠損処理を揃え、交換する中間値の分布を合わせる。
  • 過学習・漏えい対策: 正則化に加え、中間値から元の特徴を復元されないよう差分プライバシー等を併用する。

落とし穴とデータ設計は 連合学習の実践ガイド も参考にしてください。

シェア:

このデモを「実機」で使うには?

実測データで最適な機種を選び、つまずいたら原因→対処をたどれます。