🧠 サーディン猫 ML学習ラボ 戦略を「学習」して、あり/なしを比較
← ゲームに戻る
やっていること: 探す猫の頭脳=小さなニューラルネットを、ブラウザの中だけで進化(ES)させて学習します(クラウド不要=エッジで学習&推論)。
入力は「においセンサ3方向(缶に近いほど強い)」+「壁センサ3方向」、出力は「曲がる向き」。
缶のにおいの勾配を、壁をよけながら登って最短到達する方策を、世代を重ねて獲得します。
右では ルール猫(学習なし=近づくまで気づけない従来の動き) と
学習ずみ猫(におい勾配を活用) を同じ地図で競走させ、発見の速さと成功率を比べます。
① 学習 ニューラルネット × 進化
成功率(%)
平均発見歩数(低いほど良い)
いまの一番賢い個体の動き live
表示の成功率・歩数は学習に使っていない新しい地図(検証用12枚)での値=丸暗記ではなく本当の実力。学習用の地図も20世代ごとに入れ替わるので特定地図を覚えられません。「におい探索」はそもそも学習で解ける易しめの課題なので、十分学習すると成功率はほぼ100%=正常です。見どころは右のルール猫との差(速さ・成功率)。
② 比較 学習あり vs なし
学習済みモデルを読み込み中…
ルール猫(学習なし)
学習ずみ猫(ML)
🥫 缶=ゴール / ふんわり=におい
🐾 ルール猫(学習なし)
—
平均発見 —歩 / 勝ち 0
🧠 学習ずみ猫(ML)
—
平均発見 —歩 / 勝ち 0
比較に使う地図は学習に使っていない新しいランダム地図。=「丸暗記」ではなく本当に戦略が身についたかを見ています。まず左で少し学習させてから競走させると差が出ます。
🔎 これが“エッジML”の実演です:学習(training)=多数の試行から方策を改善(ふつうA6000等のGPUが得意)、推論(inference)=学習済みネットで1手を即決(Jetson/RPi5+Hailo等の省電力エッジで実行)。本デモはその両方を、この端末のブラウザ内だけで回しています。