Tensorflow Lite Posenet أو تقدير Pose هو مهمة استخدام نموذج ML لتقدير وضع الشخص من صورة أو مقطع فيديو عن طريق تقدير المواقع المكانية لمفاصل الجسم الرئيسية (النقاط الأساسية).
يشير تقدير الوضع إلى تقنيات رؤية الكمبيوتر التي تكتشف الأشكال البشرية في الصور ومقاطع الفيديو ، بحيث يمكن للمرء ، على سبيل المثال ، تحديد مكان ظهور مرفق شخص ما في الصورة. من المهم أن تكون على دراية بحقيقة أن تقدير الوضع هو مجرد تقديرات لمكان وجود مفاصل الجسم الرئيسية ولا يتعرف على من في صورة أو مقطع فيديو.
يأخذ نموذج PoseNet صورة كاميرا معالجة كمدخلات وإخراج معلومات حول نقاط المفاتيح. تتم فهرسة نقاط المفاتيح المكتشفة بواسطة معرف الجزء ، مع درجة ثقة بين 0.0 و 1.0. تشير درجة الثقة إلى احتمال وجود نقطة أساسية في هذا الموضع.
معايير الأداء
يختلف الأداء بناءً على جهازك وخطوة الإخراج (خرائط الحرارة ونواقل الإزاحة). نموذج PoseNet هو حجم صورة ثابت ، مما يعني أنه يمكنه التنبؤ بمواضع الوضع في نفس مقياس الصورة الأصلية بغض النظر عما إذا تم تصغير حجم الصورة أم لا. هذا يعني أنك تقوم بتكوين النموذج للحصول على دقة أعلى على حساب الأداء.
تحدد خطوة الإخراج مقدار تصغير الإخراج بالنسبة لحجم صورة الإدخال. يؤثر على حجم الطبقات ومخرجات النموذج.
كلما زادت خطوة الإخراج ، قلت دقة الطبقات في الشبكة والمخرجات ، وبالتالي دقتها. في هذا التطبيق ، يمكن أن يكون لخطوة الإخراج قيم 8 أو 16 أو 32. بمعنى آخر ، ستؤدي خطوة الإخراج البالغة 32 إلى أسرع أداء ولكن أقل دقة ، بينما ستؤدي 8 إلى أعلى دقة وأبطأ أداء. قيمة البداية الموصى بها هي 16.