エッジAIラボ
エッジAIラボ
症状別・原因→対処

エッジAIが動かない・遅い・落ちる

ブラウザAIデモやローカルLLMがうまく動かないとき、症状から原因→対処をたどれます。まず自己診断で端末を判定し、該当する症状へ。対処は当サイトの実機ベンチ・訪問端末の匿名実測に紐づいています。

まず自己診断:この端末はどう動く?

ボタンでこの端末のWebGPU対応を判定し、該当する症状へ案内します(端末能力のみ・匿名集計にも反映)。

🚫WebGPUで動かない/WASM(CPU)に落ちて遅い

考えられる原因

  • モバイルGPUのWebGPUサポートが断片化している(対応外のGPU命令)
  • ブラウザ/OSが未対応・古い
  • GPUはあるがアダプタ取得に失敗(no-adapter)

対処(上から順に)

  1. ブラウザ(Chrome/Safari/Edge)とOSを最新に更新する
  2. 下の自己診断ボタンで自端末のWebGPU対応を確認する
  3. 🟢軽量モデル(<50MB)のデモに切り替える(WASMでも実用速度)
  4. 可能ならWebGPU対応のPCで試す
根拠・詳しく: WebGPU対応マトリクス(端末別の実測)

💥タブが落ちる・クラッシュする/端末が熱くなる

考えられる原因

  • 🔴PC専用(200MB超)モデルをスマホで実行している
  • WASM(CPU)で重い処理を続け、メモリ不足・発熱(サーマルスロットリング)
  • 古い/低メモリ端末でWebGPU非対応のまま重いデモを実行

対処(上から順に)

  1. モデルサイズ凡例を確認し、🔴はPCで・🟢軽量をスマホで
  2. 他タブ/他アプリを閉じてメモリを空ける
  3. 連続実行を避け、端末を冷ましてから再試行する
  4. WebGPUが有効な端末・ブラウザに切り替える
根拠・詳しく: 検証DB(ブラウザ実測でクラッシュ率も集計)

🐢推論が「思ったより遅い」

考えられる原因

  • 日本語で tok/s と char/s を混同している(日本語の体感は約1/3.5)
  • GPUが使われずCPU/WASM実行になっている
  • 統合メモリ機(Mac/Jetson)でGPU優位が出にくい
  • モデルが大きく、VRAMを超えて逆に低下している

対処(上から順に)

  1. 日本語は char/s の期待値で評価する(Pi5でも約18 char/s=黙読より速い)
  2. WebGPU/GPUが有効か自己診断で確認する
  3. モデルを小さく(量子化・サイズダウン)してVRAMに収める
  4. 用途次第ではCPUでも実用圏(小型LLM・軽量ビジョン)
根拠・詳しく: 日本語LLMは char/s で測れ

🈶ローカルLLMが英語/中国語で返る・簡体字が混じる

考えられる原因

  • 日本語の指示を与える前は別言語で出力するモデルがある
  • thinking型モデルが思考を別言語で行い、回答が空・混在する
  • ブラウザ内の強く量子化された小型モデルは崩れやすい

対処(上から順に)

  1. 「日本語で答えてください」と明示的に指示する
  2. thinkingを無効化、または別モデルに替える
  3. 量子化を緩める/モデルサイズを上げる
根拠・詳しく: 日本語に中国語は混じる?(9モデル実測)

🧠NPU(Hailo/Coral)を積んだのにLLMが動かない

考えられる原因

  • Hailo等はビジョンCNN専用アクセラレータで、GGUF形式のLLMは動かせない

対処(上から順に)

  1. LLM(生成)はGPU/CPUで動かす(Pi5はCPUで約11 tok/s)
  2. NPUはYOLO等のビジョン推論(高FPS・低電力)に使う
  3. ビジョン+LLMを同時に使うなら、NPU=ビジョン/CPU・GPU=LLM の役割分担構成にする
根拠・詳しく: Hailo-10Hレビュー(用途の住み分け)

📷カメラ・マイクが使えない(デモが反応しない)

考えられる原因

  • ブラウザのカメラ/マイク権限が未許可
  • HTTP(非https)ページで実行している
  • 他アプリ/他タブがカメラを占有している

対処(上から順に)

  1. アドレスバーの権限アイコンから「許可」に変更する
  2. https(または localhost)で開く
  3. カメラを使う他アプリ・他タブを閉じてからページを再読込

モデルの初回ロードが長い・途中で止まる

考えられる原因

  • 🟡中量(50〜200MB)モデルのダウンロードに時間がかかる
  • 回線が細い・不安定でDLが完了しない
  • キャッシュが効かず毎回ダウンロードしている

対処(上から順に)

  1. 初回はWi-Fi等の安定回線でダウンロードする
  2. サイズ凡例で🟢軽量を選ぶ(初回ロードが短い)
  3. 再読込でブラウザキャッシュを利用する(2回目以降が速い)

🤔GPUを積んだのに期待ほど速くならない

考えられる原因

  • 統合メモリ(Mac/Jetson)はCPUと帯域を共有しGPU優位が小さい(≦1〜1.7倍)
  • VRAMを超えるモデルで逆に低下している
  • バッチ1の単発推論はメモリ帯域律速で倍率が伸びない

対処(上から順に)

  1. メモリ構成を確認(専用VRAMか統合か)。専用VRAM機ほど効く
  2. モデルをVRAMに収まるサイズへ(量子化・縮小)
  3. 用途次第ではCPUで十分(Pi5の日本語LLMも実用圏)
根拠・詳しく: “GPUは10〜20倍速い”は嘘?

💎Chrome内蔵AI(Gemini Nano)/ Prompt APIが使えない

考えられる原因

  • Chromeのバージョンが古い・対応OS外(デスクトップ版が必要)
  • オリジントライアル/フラグが未設定
  • モデル(Gemini Nano)のバックグラウンドDLが未完了

対処(上から順に)

  1. Chromeを最新の安定版に更新する(デスクトップ推奨)
  2. chrome://flags で Prompt API / on-device model を有効化し再起動
  3. 数分待ってモデルのダウンロード完了後に再試行する
根拠・詳しく: Chrome内蔵AI活用ガイド

🎙️音声認識(Whisper等)の精度が低い・雑音を拾う

考えられる原因

  • 環境ノイズが多い・マイクが遠い/低品質
  • 強く量子化された小型モデルで精度が落ちている
  • 言語設定が未指定で誤認識している

対処(上から順に)

  1. 静かな環境で、マイクを口元に近づける
  2. ノイズ除去デモで前処理する/外部マイクを使う
  3. より大きいモデルに切り替え、言語(日本語)を明示する
根拠・詳しく: ノイズ除去デモ

🧱「out of memory」で大型モデルが読み込めない

考えられる原因

  • 🔴PC専用(200MB超)モデルを低メモリ端末で開いている
  • タブを多数開いてメモリが枯渇している
  • 古い端末・ブラウザのメモリ上限

対処(上から順に)

  1. 🟢軽量/🟡中量モデルのデモに切り替える
  2. 他タブ・他アプリを閉じてから再読込する
  3. メモリの大きい端末・PCで開く
根拠・詳しく: 検証DB(端末×タスクで可否を確認)

🏢社内ネットワーク(プロキシ/FW)でモデルDLがブロックされる

考えられる原因

  • 企業プロキシが Hugging Face / CDN への通信を遮断している
  • SSL検査(中間証明書)でモデル取得が失敗する
  • オフライン環境でCDNに到達できない

対処(上から順に)

  1. 情シスにモデル配布元ドメイン(CDN/HF)の許可を依頼する
  2. モデルを社内ミラーにセルフホストして配信する
  3. オフライン前提なら事前キャッシュ/同梱の構成を検討する
根拠・詳しく: エッジMLOps/運用(社内導入の設計)

現場で再現しない・切り分けたい

「自社の端末・現場でだけ起きる遅さ/落ち」を、実機ベンチで原因切り分けからご支援します。

相談する(Link Field)