تخمین ژست

تخمین ژست

تخمین ژست بدن یکی از مسائل اساسی در بینایی کامپیوتر است که بیش از 15 سال است مورد مطالعه قرار گرفته است. دلیل اهمیت آن فراوانی برنامه هایی است که می توانند از چنین فناوری بهره مند شوند. به عنوان مثال، تخمین ژست بدن امکان استدلال سطح بالاتری را در زمینه تعامل با کامپیوتر و تشخیص فعالیت انسان فراهم می آورد. تخمین ژست بدن کاربردهای بسیار جالبی دارد و به وفور در شناخت اکشن، انیمیشن، شخصیت های بازی و غیره مورد استفاده قرار می گیرد. همچنین یکی از پایه های اصلی ساخت و ساز برای فناوری ردیابی حرکت (MoCap) است. فناوری MoCap برای برنامه های مختلف از شخصیت های انیمیشنی تا آنالیز بالینی آسیب شناسی راه رفتن کاربردهای فراوانی دارد.

بینایی کامپیوتر:

آیا می دانید چشم انسان چگونه اجسام را می بیند؟ فرض کنید توپی به سمت شما پرتاب می شود ابتدا تصویر توپ از عدسی چشم گذشته و روی شبکیه شکل می گیرد. سپس مقداری تجزیه و تحلیل ابتدایی صورت گرفته و نتیجه به سمت مغز ارسال می گردد، جایی که قشر بصری به آنالیز دقیق و عمیق آن خواهد پرداخت. در مرحله بعدی، نتیجه آنالیز قشر بصری به دیگر بخش های کورتکس مغز ارسال شده و با تمام دانسته های کنونی فرد مقایسه می گردد، تا شی مشاهده شده از نظر ابعاد دسته بندی شود. در نهایت مغز تصمیم می گیرد که عکس العملی مناسب انجام دهد مثلا شخص دست را بالا آورده و توپ را بگیرد. تمامی مراحل فوق در کسری از ثانیه و تقریباً بدون هیچ تلاش آگاهانه از سوی انسان انجام می شود.

بینایی کامپیوتر حوزه ای از علوم کامپیوتر است که همانند بینایی انسان دارد سعی دارد تا هر آنچه که چشم انسان قادر به دیدن، شناسایی و تجزیه و تحلیل اشیا می باشد همین استنباط نیز با مشاهده تصاویر و فیلم ها از طریق کامپیوتر حاصل شود.

تخمین ژست:

تخمین ژست بدن، روند برآورد و ارزیابی پیکربندی بدن از یک تصویر یا فیلم واحد می باشد. تصور کنید که بتوانید هر حرکت کوچک شخص را ردیابی و بدون معطلی آن را تجزیه و تحلیل نموده و عکس العملی نسبت به آن حرکت انجام دهید. این کار پیش شرط اساسی برای بسیاری از وظایف بینایی کامپیوتر مانند شناخت عملکرد انسان، ردیابی، تعامل انسان با کامپیوتر و نظارت تصویری است. این فناوری دستاوردهای عظیمی خواهد داشت برنامه های کاربردی ممکن است شامل نظارت ویدئویی، کمک به زندگی، سیستم های پیشرفته کمک به راننده و آنالیز ورزشی باشد.

تخمین ژست بدن
تخمین ژست بدن

انواع مدل های شناسایی ژست ها:

اسکلت ژست بدن نشانگر جهت گیری شخص در قالب گرافیکی است. در حقیقت، مجموعه ای از مختصات است که می تواند برای توصیف ژست فرد به یکدیگر متصل شود. هر مختصات موجود در اسکلت به عنوان یک قسمت یا یک مفصل یا به عنوان نقطه کلیدی شناخته می شود. یک ارتباط صحیح بین دو نقطه مختصات به عنوان یک جفت شناخته می شود. توجه داشته باشید که همه ترکیبات قسمت جفت معتبر ایجاد نمی کنند.

در طی این سالها رویکردهای مختلفی برای تخمین ژست بدن ارائه شده است. ابتدایی ترین روش ها معمولاً تخمین تنها یک ژست مجزا در تصویر بود. این روش ابتدا قسمت های جداگانه بدن را مشخص می کند و به دنبال آن پیوندهایی جهت ژست ایجاد می شود. به طور طبیعی این روش در بسیاری از سناریوهای زندگی واقعی کمتر به کار می آیند چراکه امروزه تصاویر شامل چندین نفر هستند. از طرفی تخمین تعداد چند نفر از وضعیت یک نفر دشوار است زیرا مکان و تعداد افراد موجود در یک تصویر ناشناخته است.

به طور معمول می توانیم با استفاده رویکردهای زیر اقدام به شناسایی ژست ها نماییم که عبارتند از:

  • رویکرد ساده این است که ابتدا یک فرد ردیابی شود، سپس تخمین قسمت های بدن و اندازه آن مشخص گردد. این روش به عنوان رویکرد بالا به پایین شناخته شده است.
  • رویکرد دیگر، تشخیص همه قسمت های بدن هر شخص در تصویر است و پس از آن گروهبندی قطعات متعلق به افراد به طور مجزا انجام می شود. این روش به عنوان روش پایین به بالا شناخته شده است.

در چند دهه گذشته، تلاش های بسیاری برای ساختن الگوهایی استوار جهت تخمین ژست بدن انسان در شرایط کنترل شده و کنترل نشده انجام شده است. روش های معمول شامل مدل های سازه های تصویری، مدل های سلسله مراتبی و مدل های غیردرختی است.

مدل سازه های تصویری:

با بررسی همبستگی های مکانی بین قسمت هایی از بدن و درج سینماتیک از زوج اندام متصل به یکدیگر، یک چارچوب گرافیکی با ساختار درختی را ایجاد می کند.

مدل تصویری تخمین ژست
مدل تصویری تخمین ژست
مدل سلسله مراتبی:

بیانگر روابط بین قسمت ها در مقیاسهای مختلف در یک ساختار سلسله مراتبی است و منجر به ردیابی روابط مرتبه بالا در بین قطعات و توصیف تعداد نمایی از نقاط قابل قبول می شود.

مدل سلسله مراتبی تخمین ژست
مدل سلسله مراتبی تخمین ژست
مدل غیر درختی:

این مدل از حلقه هایی برای تقویت ساختار درخت با لبه های اضافی استفاده می کنند که به خوبی می تواند تقارن، انسداد و روابط را ردیابی کند.

مدل غیردرختی تخمین ژست
مدل غیردرختی تخمین ژست

کاربردهای تخمین ژست بدن:

تخمین ژست بدن در زمینه های بی شماری کاربرد دارد که برخی از آنها عبارتند از:

شناخت فعالیت:
  • پیگیری تغییرات در وضعیت فرد در طی یک دوره زمانی می تواند برای فعالیت، ژست و راه رفتن مورد استفاده قرار گیرد.
  • جهت برنامه هایی برای تشخیص اینکه فرد سقوط کرده است یا بیمار است.
  • برنامه هایی که به طور مستقل می توانند رژیم های تمرینی و تکنیک های ورزشی را آموزش دهند.
  • برنامه هایی که می توانند سبب افزایش امنیت و نظارت شوند.
  • ایجاد برنامه هایی که می توانند تمام نشانه های زبان بدن را درک کنند و به عنوان سیگنال هایی برای باند فرودگاه، پلیس راهنمایی و رانندگی و غیره به کار گرفته شوند.
ردیابی حرکت و واقعیت افزوده:

یک برنامه محبوب جهت تخمین ژست بدن برنامه های CGI است. گرافیک، استایل، توسعه حرکات فانتزی، تجهیزات و آثار هنری می توانند در صورت تخمین ژست بدن بر روی سایر افراد اعمال شوند. با پیگیری و ردیابی از انواع مختلف ژست انسان، گرافیک های بدست آمده می توانند به طور طبیعی بر روی شخص دیگری اعمال گردند.

نمونه بصری خوب از آنچه قابل مشاهده است، ایموجی ها می باشند. اگرچه موارد فوق فقط ساختار یک چهره را دنبال می کند، اما این ایده می تواند به عنوان نکات کلیدی یک فرد استخراج شود. همین مفاهیم را می توان برای ارائه عناصر واقعیت افزوده (AR) استفاده کرد که می توانند حرکات شخص را تقلید کنند.

آموزش ربات ها:

به جای برنامه ریزی دستی ربات ها برای دنبال کردن مسیرها، می توان ربات ها را طوری تنظیم نمود تا حرکت ژست بدن انسان ها را شناسایی و دقیقا همان عمل را انجام دهند. یک مربی انسانی می تواند تنها با نشان دادن حرکات، برخی از اقدامات خاص را به ربات ها آموزش دهد. سپس روبات می تواند نحوه حرکت مفصل های خود را برای انجام همان عمل محاسبه و به کار بندد.

ردیابی حرکات ژست برای کنسول های بازی:

یکی از کاربردهای محبوب تخمین ژست بدن جهت ردیابی حرکت افراد و به کار بردن آن در بازی های تعاملی است. به طور رایج، Kinect از برآورد سه بعدی ژست با استفاده از داده های حسگر IR برای ردیابی حرکت بازیکنان انسانی و استفاده از آن برای ارائه عملکرد شخصیت های مجازی استفاده می کند.

کاربردهای تخمین ژست
کاربردهای تخمین ژست

چالش های تخمیمن ژست بدن:

با وجود سالها تحقیق در مورد تخمین ژست بدن هنوز هم مسائلی وجود دارند که تا حدی حل نشده باقی مانده اند. از مهمترین چالش ها می توان به تغییر شکل ظاهری انسان در تصاویر، تغییر در جسم انسان ، انسداد جزئی به دلیل خود مفصل سازی و لایه بندی اشیا در صحنه ، پیچیدگی ساختار اسکلتی انسان و بزرگ بودن ابعاد ژست اشاره نمود.

گام های بزرگی در زمینه تخمین ژست بدن برداشته شده است که این امکان را می دهد تا در برنامه های بیشماری که با آن سازگار است، خدمت رسانی بهتری انجام شود. علاوه بر این، تحقیقات در زمینه های مرتبط مانند ردیابی ژست ها می تواند بهره وری تولیدی آن را در چندین زمینه افزایش دهد.

مقالات مرتبط: