↕️

垂直連合学習デモ — 違う特徴を持つ2社が中間値だけ交換

同じ対象（同一ID）について、異なる特徴量を持つ2社が、生データを渡さず中間値だけを交換して結合モデルを学習。各社単独では引けない『斜めの境界』をブラウザ内で体験できます。

ブラウザ内で完結 — データ送信なし🟢 📦 0MB（ブラウザ内学習）🤖 加法ロジスティック回帰（split learning風・自作）⚖️ 自作

垂直連合学習（VFL）とは

垂直連合学習は、同じサンプル（行＝同一の顧客・地点・対象）について、各者が異なる特徴量（列）を持つ構成の連合学習です。「同じ顧客の、銀行は与信情報を・ECは購買履歴を持つ」「同じ構造物の、測量会社は点群形状を・自治体は台帳属性を持つ」のように、データが縦（特徴）方向に分かれているケースで使われます。

各社は自分の特徴で部分スコア（中間値）を計算し、その中間値と誤差信号だけを交換して結合モデルを学習します。生の特徴量も、相手の列も一切共有しません。前提として、同じ対象であることをIDで照合（プライバシー保護した突合）しておく必要があります。

水平FLとの違い・このデモの読み方

水平FL（HFL）

同じ特徴・違うサンプル。各拠点が同じ列を持ち、行が異なる。例：複数病院が同じ検査項目で別々の患者を学習。

垂直FL（VFL・本デモ）

同じサンプル・違う特徴。同じ対象について各社が別々の列を持つ。中間値だけ交換して結合する。

・A社単独（縦線）は横軸の特徴だけ、B社単独（横線）は縦軸の特徴だけ。どちらも片方しか見えず精度が頭打ち。
・垂直FL（斜め線）は両社の特徴を結合でき、生データを集めた集中学習とほぼ同等の精度に到達します。

精度を上げるには — 実務の対応策

このデモは加法モデルへの単純化です。実際の垂直連合学習では、特徴とID照合の質が精度を左右します。

・ID照合（PSI）の精度と重複サンプルを増やす: Private Set Intersection で安全に突合し、共通サンプルが多いほど学習が安定します。
・特徴量エンジニアリング・特徴選択: 各社が効く特徴を作り込み、寄与の小さい列を削る。重要度分析で投資配分を決める。
・中間表現の表現力を上げる: 部分モデルを線形から多層（split neural network）にし、中間次元を調整する。
・前処理の整合: 各社で正規化・スケール・欠損処理を揃え、交換する中間値の分布を合わせる。
・過学習・漏えい対策: 正則化に加え、中間値から元の特徴を復元されないよう差分プライバシー等を併用する。

落とし穴とデータ設計は連合学習の実践ガイドも参考にしてください。

このデモを「実機」で使うには？

実測データで最適な機種を選び、つまずいたら原因→対処をたどれます。

🎯 機種を選ぶ

条件から最適構成を診断

✓ 実測を見る

何がどれだけ動くか検証DB

🔧 動かない時は

症状→原因→対処