エッジAI最新リソース
Hugging Face・GitHubの注目プロジェクトからハードウェア動向まで
ブラウザAIフレームワーク比較
用途に応じた最適なフレームワークの選び方
TensorFlow.js
- ブラウザ + Node.js
- WebGL/WebGPU加速
- トレーニング可能
- 豊富な事前学習モデル
MediaPipe
- Google製
- WASM + GPU
- 超高速推論
- ビジョン特化
Transformers.js
- HuggingFace連携
- 100+アーキテクチャ
- WebGPU対応
- 多様なタスク
WebLLM
- WebGPU必須
- LLM特化
- ストリーミング
- OpenAI互換API
エッジAIハードウェア動向
主要チップメーカーのAI処理性能と対応状況
Apple Neural Engine
M4: 38 TOPS
Core ML + MLXフレームワークでオンデバイス推論。SmolLM2のMLX版も公開中。
Qualcomm AI Engine
Snapdragon X: 45 TOPS
AI Hub上に209の最適化モデル。スマホからPCまで幅広いエッジデバイスに対応。
Google Coral Edge TPU
4 TOPS / 2W
超低消費電力のエッジTPU。IoTデバイスやスマートカメラに最適。$25から。
NVIDIA Jetson Orin
40〜275 TOPS
ロボティクス・自動運転向け。フルNVIDIA GPUエコシステムをエッジで実現。
🤗注目のエッジAIモデル
用途・対応ハードウェア・鮮度がひと目でわかるモデルカタログ
Qwen3-0.6B
Alibaba
思考/非思考モード切替の超軽量LLM。100言語対応、月間1,870万DL。
何に使える?
動作する機材
MedPsy-1.7B
QVAC
医療特化エッジLLM。2.4倍大きいMedGemma-4Bを+11.42pt上回る驚異的コスパ。
何に使える?
動作する機材
DeepSeek-R1-Distill-Qwen-1.5B
DeepSeek
671Bの推論能力を蒸留。MATH 83.9%の高精度を1.5Bで実現。月間46万DL。
何に使える?
動作する機材
SmolLM2-135M / 360M / 1.7B
HuggingFace
HuggingFace公式の超軽量LLMファミリー。135Mはスマホ・マイコンでも動作。
何に使える?
動作する機材
Phi-4-mini
Microsoft
128Kコンテキスト。GSM8K 88.6%の高精度。22言語対応、ONNX形式公開。
何に使える?
動作する機材
Gemma 3-1B
テキスト+画像のマルチモーダル。140言語対応。月間61万DL。
何に使える?
動作する機材
Whisper Tiny / Small
OpenAI
99言語の音声認識。Tinyは39MBでブラウザ動作可。月間80万DL。日本語対応。
何に使える?
動作する機材
YOLOv10n / YOLOv9
onnx-community
超高速物体検出。ONNX最適化でブラウザ・モバイル・Raspberry Piで動作。
何に使える?
動作する機材
ONNX Community (1,136モデル)
onnx-community
1,136以上のONNX最適化モデル群。ブラウザ・モバイル・エッジで高速推論。
何に使える?
動作する機材
⭐注目のGitHubプロジェクト
人気・注目・急上昇でカテゴリ分け。具体的な用途アイデア付き。
llama.cpp
LLMの超高効率C++推論エンジン。GGUF量子化でモデルサイズを大幅削減。
こんな用途に使える
- ›Raspberry Pi上でオフラインチャットボット構築
- ›社内文書Q&Aシステムをローカルサーバーで運用
- ›IoTゲートウェイでの音声コマンド処理
MediaPipe
Googleのオンデバイス推論FW。顔・手・ポーズ・セグメンテーション等をリアルタイム処理。
こんな用途に使える
- ›店舗カメラで来客数・動線をリアルタイム分析
- ›リハビリ用のポーズ判定アプリ開発
- ›ジェスチャーで操作するキオスク端末
TensorFlow.js
ブラウザ・Node.jsでML。WebGL/WebGPU加速でトレーニングも推論も可能。
こんな用途に使える
- ›Webアプリに画像認識機能を組み込み
- ›ブラウザ上で独自モデルを転移学習
- ›教育向けAI体験サイトの構築
WebLLM
WebGPUでLLMをブラウザ実行。Llama, Qwen, Phi, Gemma等に対応。OpenAI互換API。
こんな用途に使える
- ›社内チャットAIをサーバーレスで提供
- ›プライバシー重視の相談チャットボット
- ›オフライン環境での技術文書検索アシスタント
Transformers.js
HuggingFaceモデルをブラウザで直接実行。100以上のアーキテクチャ、WebGPU加速。
こんな用途に使える
- ›ブラウザ完結の音声文字起こしツール
- ›クライアントサイドで動くテキスト感情分析
- ›画像自動タグ付けのWebアプリ
ONNX Runtime
クロスプラットフォーム推論エンジン。WebGPU/WASM/WebNN対応。int4量子化で5-12倍高速化。
こんな用途に使える
- ›Windowsアプリに DirectML推論を組み込み
- ›React NativeアプリでオンデバイスAI
- ›ブラウザとサーバーで同じモデルを共有運用
Gemma 4 Browser Extension
Chrome拡張でGemma 4をフルエージェント動作。Transformers.js + WebGPUで完全ローカル。
こんな用途に使える
- ›ブラウジング中にAIアシスタントをローカル実行
- ›Webページ要約をプライバシー保護しながら実行
- ›Chrome拡張ベースの社内ツールに応用
SmolLM
HuggingFace公式の小型モデルファミリー。トレーニングコード・データセットを完全公開。
こんな用途に使える
- ›独自ドメインの小型LLMをファインチューン
- ›ESP32やRaspberry Piに載る超軽量AIアシスタント開発
- ›エッジAIの学習教材として活用
Whisper.cpp
OpenAI WhisperのC/C++移植。Raspberry Piやスマホでリアルタイム音声認識が可能。
こんな用途に使える
- ›Raspberry Piで常時稼働の議事録ボット
- ›オフラインで動く多言語字幕生成システム
- ›スマートスピーカー自作キットのASRエンジン
Ultralytics (YOLOv8/v11)
最新YOLO。検出・セグメンテーション・ポーズ推定・分類をワンパッケージで。TFLite/ONNX export可。
こんな用途に使える
- ›工場ラインの製品検査を低コストで自動化
- ›農業用ドローンの害虫・病害検出
- ›駐車場の空き状況リアルタイムモニタリング