姿勢ランドマーク検出ガイド

瞑想のポーズをとっている女性。ポーズがワイヤーフレームでハイライト表示され、四肢と胴体の位置が示されます。

MediaPipe Pose Landmarker タスクを使用すると、画像または動画内の人体のランドマークを検出できます。このタスクを使用すると、体の主要な位置を特定し、姿勢を分析して、動きを分類できます。このタスクでは、単一の画像または動画を処理する ML モデルを使用します。このタスクは、画像座標と 3 次元ワールド座標でボディポーズのランドマークを出力します。

試してみる

使ってみる

このタスクを使用するには、対象プラットフォームの実装ガイドに沿って操作します。以下のプラットフォーム固有のガイドでは、推奨モデルや、推奨構成オプションを含むコード例など、このタスクの基本的な実装について説明します。

タスクの詳細

このセクションでは、このタスクの機能、入力、出力、構成オプションについて説明します。

機能

  • 入力画像の処理 - 処理には、画像の回転、サイズ変更、正規化、色空間の変換が含まれます。
  • スコアしきい値 - 予測スコアに基づいて結果をフィルタします。
タスク入力 タスクの出力
Pose Landmarker は、次のいずれかのデータ型の入力を受け入れます。
  • 静止画像
  • デコードされた動画フレーム
  • ライブ動画フィード
Pose Landmarker は次の結果を出力します。
  • 正規化された画像座標でのポーズ ランドマーク
  • ワールド座標のポーズ ランドマーク
  • 省略可: ポーズのセグメンテーション マスク。

構成オプション

このタスクには、次の構成オプションがあります。

オプション名 説明 値の範囲 デフォルト値
running_mode タスクの実行モードを設定します。モードは次の 3 つです。

IMAGE: 単一画像入力のモード。

動画: 動画のデコードされたフレームのモード。

LIVE_STREAM: カメラなどからの入力データのライブ配信モード。 このモードでは、resultListener を呼び出して、結果を非同期で受信するリスナーを設定する必要があります。
{IMAGE, VIDEO, LIVE_STREAM} IMAGE
num_poses Pose Landmarker で検出できるポーズの最大数。 Integer > 0 1
min_pose_detection_confidence ポーズ検出が成功と見なされるための最小信頼度スコア。 Float [0.0,1.0] 0.5
min_pose_presence_confidence ポーズランドマーク検出でのポーズ存在スコアの最小信頼度スコア。 Float [0.0,1.0] 0.5
min_tracking_confidence ポーズ トラッキングが成功とみなされるための最小信頼スコア。 Float [0.0,1.0] 0.5
output_segmentation_masks Pose Landmarker が検出されたポーズのセグメンテーション マスクを出力するかどうか。 Boolean False
result_callback Pose Landmarker がライブ配信モードの場合に、ランドマークの結果を非同期で受信するように結果リスナーを設定します。実行モードが LIVE_STREAM に設定されている場合にのみ使用できます。 ResultListener N/A

モデル

ポーズ ランドマークは、一連のモデルを使用してポーズ ランドマークを予測します。最初のモデルは画像フレーム内の人間の存在を検出し、2 つ目のモデルは身体上のランドマークを特定します。

次のモデルは、ダウンロード可能なモデル バンドルにまとめられています。

  • ポーズ検出モデル: いくつかの重要なポーズ ランドマークを使用して、身体の存在を検出します。
  • ポーズ ランドマークモデル: ポーズの完全なマッピングを追加します。モデルは、33 個の 3 次元ポーズランドマークの推定値を出力します。

このバンドルは MobileNetV2 に似た畳み込みニューラル ネットワークを使用しており、オンデバイスのリアルタイム フィットネス アプリ用に最適化されています。BlazePose モデルのこのバリアントは、3D 人間形状モデリング パイプラインである GHUM を使用して、画像または動画内の個人の完全な 3D ボディポーズを推定します。

モデル バンドル 入力シェイプ データ型 モデルカード バージョン
Pose Landmarker(Lite)ポーズ検出器: 224 x 224 x 3
ポーズ ランドマーク: 256 x 256 x 3
float 16 info 最新
Pose Landmarker(完全版)ポーズ検出器: 224 x 224 x 3
ポーズ ランドマーク: 256 x 256 x 3
float 16 info 最新
ポーズ ランドマーク(負荷が高い)ポーズ検出器: 224 x 224 x 3
ポーズ ランドマーク: 256 x 256 x 3
float 16 info 最新

ポーズ ランドマークモデル

ポーズ ランドマーク モデルは、次の体の部分のおおよその位置を表す 33 個の体のランドマークの位置を追跡します。

0 - nose
1 - left eye (inner)
2 - left eye
3 - left eye (outer)
4 - right eye (inner)
5 - right eye
6 - right eye (outer)
7 - left ear
8 - right ear
9 - mouth (left)
10 - mouth (right)
11 - left shoulder
12 - right shoulder
13 - left elbow
14 - right elbow
15 - left wrist
16 - right wrist
17 - left pinky
18 - right pinky
19 - left index
20 - right index
21 - left thumb
22 - right thumb
23 - left hip
24 - right hip
25 - left knee
26 - right knee
27 - left ankle
28 - right ankle
29 - left heel
30 - right heel
31 - left foot index
32 - right foot index

モデルの出力には、各ランドマークの正規化された座標(Landmarks)とワールド座標(WorldLandmarks)の両方が含まれます。