🗺️

奥行き推定

写真から相対深度マップを生成し、元画像との比較やPNG保存ができます。

ブラウザで実行 — 入力データと通信条件は各デモ内に表示🟡 📦 約100MB⚙️ Depth Anything V2 Small⚖️ Apache 2.0

QUICK START

使い方

1
モデルを読み込む
初回だけ約100MBのモデルを取得します。
2
写真を選ぶ
手前と奥が写った鮮明な写真が適しています。
3
奥行きを推定する
処理が終わるまでこの画面を開いて待ちます。
4
比較して保存する
境界を動かし、配色を選んでPNGを保存します。

画像ピクセルは推論のために外部送信しません。ページ表示、利用状況の計測、未キャッシュのモデル取得には通信が発生します。

深度マップの読み方

色は画面内の相対値

このデモはモデル出力の最小値から最大値までを画像ごとに配色します。別の写真との色の直接比較はできません。

暖色や白ほど出力値が高い

多くの画像では手前側が高い値になります。これはメートルやセンチメートルを示す値ではありません。

境界に注目する

元画像との比較境界を動かすと、人物、車、建物などの輪郭をどこまで分離できたか確認できます。

目的に合うデモを選ぶ

3つのデモは同じものではありません。必要な出力で選んでください。

奥行き推定

写真全体の前後関係を深度マップとして確認し、画像で保存します。

写真の寸法概算 →

写真内の既知寸法を基準に、同一平面上の長さを比例推定します。深度差の警告も確認できます。

Depth Anything V2 Small

Depth Anything V2はNeurIPS 2024で発表された単眼深度推定モデルです。このデモはSmallモデルをFP32でブラウザ実行し、写真の各画素に相対的な深度値を割り当てます。

24.8M

パラメータ数

約100MB

FP32モデルファイル

最大512px

入力の長辺

相対深度

出力の種類

公式リポジトリモデル仕様使用モデルのファイル

精度を確認しやすい写真

適した条件

・手前から奥まで複数の距離帯が写っている
・被写体の輪郭が鮮明で、明るさが十分にある
・道路、廊下、室内など遠近の手掛かりが多い

誤差が出やすい条件

・ガラス、鏡、水面などの反射や透過がある
・暗所、強い逆光、手ぶれ、輪郭の弱い領域
・入力縮小で消える細い物体や小さな段差

限界

・出力は相対深度です。実際の距離や寸法は出ません。
・前後順序や物体境界を誤る場合があります。
・1枚の画像だけでは、カメラの焦点距離や物体の実寸を一意に決められません。
・写真ごとに表示範囲を正規化するため、異なる写真の色を数値比較できません。
・安全判断、施工検査、測量、医療判断にはこのデモの出力を使えません。
・実距離が必要な場合は、カメラ較正、既知寸法、LiDAR、ステレオカメラなどが必要です。

RTX A6000 FINE-TUNING

A6000でファインチューニングすると何が変わるか

A6000を使うだけで精度や統計的有意性が上がるわけではありません。48GBのVRAMを使い、対象現場の画像と正解深度で高解像度学習や複数回の再学習を実行しやすくなる点に価値があります。

改善を狙える領域

現場固有の棚、床、通路、照明、カメラ位置に合わせ、深度の順位、輪郭、欠損しやすい物体への適合を狙えます。

A6000の役割

高解像度入力、十分なバッチサイズ、複数の乱数シードによる学習を実行しやすくします。GPU性能は主に学習時間と試行可能数に効きます。

保証できないこと

正解深度の品質が低い場合や、独立評価用データと学習データが似すぎる場合は、現場での改善を示せません。

汎用モデルとファインチューニングモデルの比較条件

実測前

現在は正解深度付きの独立評価用データがないため、改善率と統計的有意差は未検証です。比較時はモデル以外の条件を固定し、次の表で評価します。

比較項目	汎用モデル	ファインチューニングモデル
入力	同じ独立評価用画像	同じ独立評価用画像
前処理	同じ解像度と正規化	同じ解像度と正規化
推論	同じ端末と設定	同じ端末と設定
相対深度の主要指標	2点の前後順序正解率	2点の前後順序正解率
実距離モデルの指標	AbsRel、RMSE、δ1	AbsRel、RMSE、δ1
境界評価	輪郭付近の誤差	輪郭付近の誤差
再現性	固定条件で記録	3つ以上の乱数シードを個別に報告
モデル選択	検証用データだけを使用	検証用データだけを使用

相対深度では前後順序正解率を主指標にします。正解深度を使って実距離モデルを学習する場合だけAbsRel、RMSE、δ1を評価します。相対値と未整合のメートル値は同じ表で比較しません。主要指標と実務上必要な最小改善幅を学習前に固定し、同じ独立評価用データに対する差を現場または動画単位で集計します。改善量の95%信頼区間が0を上回り、かつ最小改善幅を満たした場合に、統計的かつ実務的な改善として報告します。独立評価用データはモデル選択に使いません。

A6000は複数の乱数シードで学習し、結果のばらつきを確認しやすくします。統計的な検出力は独立評価用データの量と多様性で決まり、GPUだけでは上がりません。現場、撮影日、動画をまたいだデータ漏れを防ぎ、良い学習結果だけを選ばず全結果を報告します。

RTX A6000の公式仕様

現場データで適合評価する

学習前に用途、許容誤差、撮影条件、正解深度の取得方法を決めます。ブラウザデモの見た目だけではファインチューニングの効果を判定しません。

活用事例を見る →

活用事例

画像編集

被写体と背景の前後関係を使い、奥行きに応じたぼかしや色補正のマスクを作れます。

映像制作

2D素材へ視差表現を加えるための下絵として使えます。自然な3D変換には追加の補正が必要です。

ロボット開発の試作

障害物の前後関係を調べる初期検証に使えます。安全制御には測距センサーとの統合が必要です。

現場写真の確認

段差や凹凸が深度マップに現れるかを確認できます。寸法検査や測量の代わりにはなりません。

画像解析の前処理

物体検出や領域分割へ相対深度を加え、画面内の前後関係を判断する手掛かりにできます。

単眼深度の学習

同じ写真を2種類の配色で比較し、単眼画像から推定できる情報とできない情報を確認できます。

深度推定に使えるエッジAI機材

ブラウザで処理の流れを確認した後、カメラと推論端末を組み合わせた検証へ進めます。

🧰 構成の目安（用途で選ぶ・全部を合算する必要はありません）

最安構成約¥35,000〜

Raspberry Pi 5 ＋ AI Camera（IMX500）。カメラ側でAI推論する分ホスト負荷が低く、まず試すのに最適。

安定構成約¥60,000〜

NVIDIA Jetson Orin Nano ＋ Webカメラ。GPUで複数カメラ・高精度モデルも安定処理。

価格は目安（変動あり）。下のカードから用途に合うものを選んでください（全点を揃える必要はありません）。

大型構成もっと大きなモデルを本格的に動かすなら（高性能ミニPC）

大きなモデルの生成・推論や複数モデルの常時稼働には、Pi/Jetsonより大容量メモリ・高性能CPU/GPUを積める高性能ミニPCが快適です。

大型エッジAI・ローカル用PC（GMKtec）を見る →

👑 まずこの1台

📷おすすめ目安 ¥13,000

Raspberry Pi AI Camera（IMX500）

Sony IMX500搭載のAI処理内蔵カメラ。カメラ側でAI推論を実行し、ホストの負荷が極めて低い。

楽天で見る Amazonで見る

🖥️定番目安 ¥22,000

Raspberry Pi 5

エッジAIの定番ボード。8GB RAMモデルでAI推論からカメラ制御まで幅広く対応。

楽天で見る Amazonで見る

⚡高性能目安 ¥55,000

NVIDIA Jetson Orin Nano

最大67 TOPSのAI性能。複数カメラの同時処理や高精度モデルの実行に最適なエッジAIボード。

楽天で見る Amazonで見る

🔌目安 ¥13,000

Google Coral USB Accelerator

既存のPCやRaspberry PiにUSB接続するだけでAI推論を高速化。4 TOPSのEdge TPU搭載。

楽天で見る Amazonで見る

🎥目安 ¥5,000

4K Webカメラ（AI対応）

高解像度のWebカメラでAI認識の精度が向上。オートフォーカス・広角対応モデルがおすすめ。

楽天で見る Amazonで見る

📸目安 ¥5,500

Raspberry Pi カメラモジュール V3

12MPセンサー搭載の公式カメラモジュール。HDR対応・オートフォーカスで高品質な映像入力が可能。

楽天で見る Amazonで見る

※ 上記リンクはアフィリエイトリンクです（購入で当サイトに収益が発生する場合があります）。価格は目安で、最新価格・在庫はリンク先でご確認ください。構成は用途の一例です。

このデモを「実機」で使うには？

実測データで最適な機種を選び、つまずいたら原因→対処をたどれます。

🎯 機種を選ぶ

条件から最適構成を診断

✓ 実測を見る

何がどれだけ動くか検証DB

🔧 動かない時は

症状→原因→対処

業務への導入を検討中の方へ：このデモのような、入力に近い端末で処理する仕組みの設計・開発相談はLink Fieldへ無料で送れます。

🤝 導入の相談をする

奥行き推定

使い方

モデルを読み込む

写真を選ぶ

奥行きを推定する

比較して保存する

深度マップの読み方

色は画面内の相対値

暖色や白ほど出力値が高い

境界に注目する

目的に合うデモを選ぶ

奥行き推定

写真の寸法概算 →

物体検出＋相対深度 →

Depth Anything V2 Small

精度を確認しやすい写真

適した条件

誤差が出やすい条件

限界

A6000でファインチューニングすると何が変わるか

改善を狙える領域

A6000の役割

保証できないこと

汎用モデルとファインチューニングモデルの比較条件

現場データで適合評価する

活用事例

画像編集

映像制作

ロボット開発の試作

現場写真の確認

画像解析の前処理

単眼深度の学習

深度推定に使えるエッジAI機材

Raspberry Pi AI Camera（IMX500）

Raspberry Pi 5

NVIDIA Jetson Orin Nano

Google Coral USB Accelerator

4K Webカメラ（AI対応）

Raspberry Pi カメラモジュール V3

関連ガイド

関連デモ

このデモを「実機」で使うには？