EDGE AI ECOSYSTEM

エッジAI最新リソース

Hugging Face・GitHubの注目プロジェクトからハードウェア動向まで

最終更新: 2025-05-15

今月のピックアップ

今月特に注目すべきエッジAIの最新動向

モデル

Qwen3-0.6B

思考/非思考モード切替が可能な超軽量LLM。100言語対応で月間1,870万DLを突破。ブラウザやRaspberry Piでも動作。

モデル

MedPsy-1.7B

2.4倍大きいMedGemma-4Bを上回る医療特化エッジLLM。量子化で1.28GBに収まりRaspberry Piで動作。

プロジェクト

Gemma 4 Browser Extension

Chrome拡張でGemma 4をフルエージェント動作。Transformers.js + WebGPUで完全ローカル実行。

ハードウェア

Qualcomm Snapdragon X (45 TOPS)

AI Hub上に209の最適化モデル。WindowsノートPCでローカルAI推論を実現。

ブラウザAIフレームワーク比較

用途に応じた最適なフレームワークの選び方

TensorFlow.js

ブラウザ + Node.js
WebGL/WebGPU加速
トレーニング可能
豊富な事前学習モデル

画像認識・物体検出TF / TFLite

MediaPipe

Google製
WASM + GPU
超高速推論
ビジョン特化

ポーズ推定・顔認識TFLite

Transformers.js

HuggingFace連携
100+アーキテクチャ
WebGPU対応
多様なタスク

NLP・音声認識ONNX

WebLLM

WebGPU必須
LLM特化
ストリーミング
OpenAI互換API

チャットAI・文章生成MLC

エッジAIハードウェア動向

主要チップメーカーのAI処理性能と対応状況

Apple Neural Engine

M4: 38 TOPS

Core ML + MLXフレームワークでオンデバイス推論。SmolLM2のMLX版も公開中。

Qualcomm AI Engine

Snapdragon X: 45 TOPS

AI Hub上に209の最適化モデル。スマホからPCまで幅広いエッジデバイスに対応。

Google Coral Edge TPU

4 TOPS / 2W

超低消費電力のエッジTPU。IoTデバイスやスマートカメラに最適。$25から。

NVIDIA Jetson Orin

40〜275 TOPS

ロボティクス・自動運転向け。フルNVIDIA GPUエコシステムをエッジで実現。

🤗注目のエッジAIモデル

用途・対応ハードウェア・鮮度がひと目でわかるモデルカタログ

新着0.6BLLM多言語Apache 2.0

Qwen3-0.6B

Alibaba

思考/非思考モード切替の超軽量LLM。100言語対応、月間1,870万DL。

何に使える？

チャットボットコード補完テキスト要約翻訳

動作する機材

Raspberry Pi 5Jetson Orin Nanoブラウザ(WebGPU)スマートフォン

新着1.7B (量子化1.28GB)医療AIApache 2.0

MedPsy-1.7B

QVAC

医療特化エッジLLM。2.4倍大きいMedGemma-4Bを+11.42pt上回る驚異的コスパ。

何に使える？

医療問診支援医薬品情報検索患者トリアージ医学教育

動作する機材

Raspberry Pi 5 (8GB)Jetson Orin Nanoスマートフォン

新着1.5BLLM推論特化MIT

DeepSeek-R1-Distill-Qwen-1.5B

DeepSeek

671Bの推論能力を蒸留。MATH 83.9%の高精度を1.5Bで実現。月間46万DL。

何に使える？

数学・論理推論コーディング支援問題解決教育用AI

動作する機材

Raspberry Pi 5 (8GB)Jetson Orin Nanoブラウザ(WebGPU)Orange Pi 5 Plus

新着135M〜1.7BLLM超軽量Apache 2.0

SmolLM2-135M / 360M / 1.7B

HuggingFace

HuggingFace公式の超軽量LLMファミリー。135Mはスマホ・マイコンでも動作。

何に使える？

オンデバイスアシスタントテキスト生成コード補完IoTデバイス組込

動作する機材

ESP32-S3 (135Mのみ)Raspberry Pi 5スマートフォンブラウザ

新着3.8BLLM高効率MIT

Phi-4-mini

Microsoft

128Kコンテキスト。GSM8K 88.6%の高精度。22言語対応、ONNX形式公開。

何に使える？

長文要約RAG検索多言語チャットコーディング

動作する機材

Jetson Orin Nano (8GB)RTX搭載PCブラウザ(WebGPU/高性能PC)

新着1.0BマルチモーダルGemma License

Gemma 3-1B

Google

テキスト+画像のマルチモーダル。140言語対応。月間61万DL。

何に使える？

画像キャプション生成VQA (画像質問応答)多言語チャット文書理解

動作する機材

Raspberry Pi 5 (8GB)Jetson Orin Nanoブラウザ(WebGPU)Coral+Pi

定番39M / 244M音声認識多言語MIT

Whisper Tiny / Small

OpenAI

99言語の音声認識。Tinyは39MBでブラウザ動作可。月間80万DL。日本語対応。

何に使える？

議事録作成字幕生成音声コマンド多言語翻訳

動作する機材

Raspberry Pi 5ブラウザ(WASM)スマートフォンJetson Nano

最近6M〜25M物体検出リアルタイム

YOLOv10n / YOLOv9

onnx-community

超高速物体検出。ONNX最適化でブラウザ・モバイル・Raspberry Piで動作。

何に使える？

監視カメラ検知製造ライン検査交通量計測ドローン映像解析

動作する機材

Raspberry Pi 5 + AI HAT+Coral USBJetson Orinブラウザ(WASM)

定番各種ONNXエコシステム

ONNX Community (1,136モデル)

onnx-community

1,136以上のONNX最適化モデル群。ブラウザ・モバイル・エッジで高速推論。

何に使える？

あらゆるAIタスククロスプラットフォーム量子化推論

動作する機材

全エッジデバイスブラウザモバイル

⭐注目のGitHubプロジェクト

人気・注目・急上昇でカテゴリ分け。具体的な用途アイデア付き。

👑 人気🔍 注目🚀 急上昇

👑 人気C / C++

75k+

llama.cpp

LLMの超高効率C++推論エンジン。GGUF量子化でモデルサイズを大幅削減。

こんな用途に使える

›Raspberry Pi上でオフラインチャットボット構築
›社内文書Q&Aシステムをローカルサーバーで運用
›IoTゲートウェイでの音声コマンド処理

👑 人気C++ / JS

28k+

MediaPipe

Googleのオンデバイス推論FW。顔・手・ポーズ・セグメンテーション等をリアルタイム処理。

こんな用途に使える

›店舗カメラで来客数・動線をリアルタイム分析
›リハビリ用のポーズ判定アプリ開発
›ジェスチャーで操作するキオスク端末

👑 人気TypeScript

18k+

TensorFlow.js

ブラウザ・Node.jsでML。WebGL/WebGPU加速でトレーニングも推論も可能。

こんな用途に使える

›Webアプリに画像認識機能を組み込み
›ブラウザ上で独自モデルを転移学習
›教育向けAI体験サイトの構築

🔍 注目TypeScript

15k+

WebLLM

WebGPUでLLMをブラウザ実行。Llama, Qwen, Phi, Gemma等に対応。OpenAI互換API。

こんな用途に使える

›社内チャットAIをサーバーレスで提供
›プライバシー重視の相談チャットボット
›オフライン環境での技術文書検索アシスタント

🔍 注目TypeScript

12k+

Transformers.js

HuggingFaceモデルをブラウザで直接実行。100以上のアーキテクチャ、WebGPU加速。

こんな用途に使える

›ブラウザ完結の音声文字起こしツール
›クライアントサイドで動くテキスト感情分析
›画像自動タグ付けのWebアプリ

🔍 注目C++ / JS

15k+

ONNX Runtime

クロスプラットフォーム推論エンジン。WebGPU/WASM/WebNN対応。int4量子化で5-12倍高速化。

こんな用途に使える

›Windowsアプリに DirectML推論を組み込み
›React NativeアプリでオンデバイスAI
›ブラウザとサーバーで同じモデルを共有運用

🚀 急上昇TypeScript

New

Gemma 4 Browser Extension

Chrome拡張でGemma 4をフルエージェント動作。Transformers.js + WebGPUで完全ローカル。

こんな用途に使える

›ブラウジング中にAIアシスタントをローカル実行
›Webページ要約をプライバシー保護しながら実行
›Chrome拡張ベースの社内ツールに応用

🚀 急上昇Python

3k+

SmolLM

HuggingFace公式の小型モデルファミリー。トレーニングコード・データセットを完全公開。

こんな用途に使える

›独自ドメインの小型LLMをファインチューン
›ESP32やRaspberry Piに載る超軽量AIアシスタント開発
›エッジAIの学習教材として活用

👑 人気C / C++

37k+

Whisper.cpp

OpenAI WhisperのC/C++移植。Raspberry Piやスマホでリアルタイム音声認識が可能。

こんな用途に使える

›Raspberry Piで常時稼働の議事録ボット
›オフラインで動く多言語字幕生成システム
›スマートスピーカー自作キットのASRエンジン

🚀 急上昇Python

35k+

Ultralytics (YOLOv8/v11)

最新YOLO。検出・セグメンテーション・ポーズ推定・分類をワンパッケージで。TFLite/ONNX export可。

こんな用途に使える

›工場ラインの製品検査を低コストで自動化
›農業用ドローンの害虫・病害検出
›駐車場の空き状況リアルタイムモニタリング

バックナンバー

過去のリソースまとめをアーカイブとして公開しています

2025-05最新

2025年5月号

Qwen3-0.6B、MedPsy-1.7B など超軽量LLMが続々登場。Gemma 4 Browser ExtensionでブラウザAIエージェントも現実に。

モデル 9件 / プロジェクト 10件

更新履歴

2025-05

-Qwen3-0.6B、MedPsy-1.7B、DeepSeek-R1-Distill-Qwen-1.5B を新規追加
-Gemma 4 Browser Extension を急上昇に追加
-Phi-4-mini、Gemma 3-1B の情報を更新
-ハードウェア動向にQualcomm AI Engine(Snapdragon X)を追加