MediaPipe人体姿势估计模型

945 阅读1分钟

MediaPipe 是 Google 推出的开源多媒体框架,其中包含了一些预训练模型和工具,可以用于人体姿态估计等应用。以下是一个基本的示例,展示如何使用 MediaPipe 的人体姿势估计模型:

python复制代码
import cv2
import mediapipe as mp

# 加载模型
mp_pose = mp.solutions.pose
pose = mp_pose.Pose()

# 打开摄像头
cap = cv2.VideoCapture(0)

while True:
    # 读取摄像头图像
    ret, image = cap.read()

    # 处理图像,进行姿势估计
    results = pose.process(image)

    # 绘制姿势估计结果
    if results.pose_landmarks is not None:
        mp_drawing = mp.solutions.drawing_utils
        annotated_image = image.copy()
        mp_drawing.draw_landmarks(
            annotated_image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS)

        # 显示结果
        cv2.imshow('MediaPipe Pose', annotated_image)

    # 按 'q' 键退出循环
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()

在代码中,我们首先加载了 MediaPipe 中的人体姿势估计模型,并通过打开摄像头来捕获实时视频帧。然后,我们对每个视频帧进行姿势估计,并将结果绘制在原始图像上。最后,我们显示绘制后的图像,并在按下键盘上的 'q' 键时退出循环。

请注意,这只是一个基本的示例,并且可能需要根据你的具体情况进行调整,例如更改摄像头的索引、更改绘图参数、将输出结果保存到文件等。如果您遇到问题或需要更多帮助,请参阅 MediaPipe 的官方文档和社区支持资源。