🧠 サーディン猫 ML学習ラボ戦略を「学習」して、あり／なしを比較

← ゲームに戻る

やっていること： 探す猫の頭脳＝小さなニューラルネットを、ブラウザの中だけで進化（ES）させて学習します（クラウド不要＝エッジで学習＆推論）。入力は「においセンサ3方向（缶に近いほど強い）」＋「壁センサ3方向」、出力は「曲がる向き」。缶のにおいの勾配を、壁をよけながら登って最短到達する方策を、世代を重ねて獲得します。右ではルール猫（学習なし＝近づくまで気づけない従来の動き）と学習ずみ猫（におい勾配を活用）を同じ地図で競走させ、発見の速さと成功率を比べます。

① 学習ニューラルネット × 進化

成功率(%) 平均発見歩数（低いほど良い）

学習速度 2/frame

世代0

成功率(新地図)—

平均発見歩数—

いまの一番賢い個体の動き live

表示の成功率・歩数は学習に使っていない新しい地図（検証用12枚）での値＝丸暗記ではなく本当の実力。学習用の地図も20世代ごとに入れ替わるので特定地図を覚えられません。「におい探索」はそもそも学習で解ける易しめの課題なので、十分学習すると成功率はほぼ100%＝正常です。見どころは右のルール猫との差（速さ・成功率）。

② 比較学習あり vs なし

学習済みモデルを読み込み中…

ルール猫（学習なし）学習ずみ猫（ML） 🥫 缶＝ゴール / ふんわり＝におい

🐾 ルール猫（学習なし）

—

平均発見 —歩／勝ち 0

🧠 学習ずみ猫（ML）

—

平均発見 —歩／勝ち 0

比較に使う地図は学習に使っていない新しいランダム地図。＝「丸暗記」ではなく本当に戦略が身についたかを見ています。まず左で少し学習させてから競走させると差が出ます。

🔎 これが“エッジML”の実演です：学習(training)＝多数の試行から方策を改善（ふつうA6000等のGPUが得意）、推論(inference)＝学習済みネットで1手を即決（Jetson/RPi5+Hailo等の省電力エッジで実行）。本デモはその両方を、この端末のブラウザ内だけで回しています。

① 学習 ニューラルネット × 進化

いまの一番賢い個体の動き live

② 比較 学習あり vs なし

🐾 ルール猫（学習なし）

🧠 学習ずみ猫（ML）

① 学習ニューラルネット × 進化

② 比較学習あり vs なし