تشخیص حرکت | Gesture Recognition

تشخیص حرکت | Gesture Recognition

فناوری تشخیص حرکت یا Gesture Recognition Technology که به عنوان یک رابط میان انسان و ماشین دیجیتال شناخته می شود، رابط کاربری است که اطلاعات مربوط به وضعیت یک فرآیند را به کاربران ارائه می دهد. فناوری تشخیص ژست می تواند دستورالعمل های اپراتور را بپذیرد و اجرا کند. معمولاً چنین اطلاعاتی در قالب گرافیکی بنام GUI که مخفف رابط کاربری گرافیکی است، نمایش داده می شود. همانطور که از نام Gesture Recognition مشخص است، تشخیص حرکت نوعی رابط محاسباتی است که به رایانه ها امکان می دهد حرکات انسان را تشخیص داده و آنها را به یک جریان داده تبدیل کند، سپس این اطلاعات می تواند برای اهداف دیجیتالی مختلف مورد استفاده قرار گیرد.

Gesture چیست؟

بر طبق تعریف دیکشنری Oxford، حرکت عضوی از بدن به خصوص دست یا سر جهت بیان اندیشه یا منظور خود را gesture می نامند. تعریف Kurtenbach و Hulteen (دو محقق آمریکایی) از gesture عبارت است از: حرکت دادن بدن به نحوی که حاوی مفهوم و اطلاعاتی می باشد. Gestures راههای ارتباطی هستند، حرکات بدن یعنی حرکات فیزیکی انگشتان، دست ها، بازوها، سر، چهره یا قسمت های مختلف بدن با هدف انتقال اطلاعات و تعامل با محیط زیست هستند. حرکات ناخودآگاه حدود 90٪ از ژست انسان را تشکیل می دهند. مردم حتی هنگام صحبت کردن با تلفن نیز از ژست استفاده می کنند، حتی افراد نابینا نیز این حرکات را به طور ناخودآگاه انجام می دهند. در همه فرهنگ ها، انجام حرکات مرتبط با گفتار طبیعی و رایج است.

سه نقش اصلی حرکات بدن انسان ها عبارتند از:

  • برقراری ارتباط حاوی اطلاعات معنی دار
  • جهت مدیریت محیط زندگی
  • جهت کشف محیط زیست از طریق تجربه کردن حواس

تکنولوژی Gesture Recognition چیست؟

Gesture Recognition به عنوان یک نوع بیومتریک رفتاری طبقه بندی می شود. بر خلاف دستگاههای لمسی، دستگاههای Gesture Recognition بدون لمس کنترل می شوند. اگرچه تشخیص حرکت ژست نیز نوعی از رابط های کاربری بدون تماس است اما بر اساس گفته ها، بسیاری از دستگاه هایی که از Gesture Recognition پشتیبانی می کنند نیز از صفحه نمایش لمسی پشتیبانی می کنند.

در حالی که انواع مختلفی از تکنولوژی تشخیص حرکت ژست وجود دارد، همه آنها بر پایه شناخت حرکت انسان به عنوان یک فرم ورودی عمل می کنند. این دستگاه یک یا چند سنسور یا دوربین دارد که حرکت کاربر را نظارت می کند. هنگامی که حرکتی را تشخیص دهد که با دستوری مطابقت دارد، با خروجی مناسبی نسبت به آن دستور پاسخ می دهد. این دستورات ممکن است شامل دستوراتی نظیر بازگشایی قفل دستگاه، راه اندازی یک برنامه، کم و زیاد کردن صدا و غیره باشد.

سیستم های تشخیص حرکت می توانند یک سیستم بدون لمس یا یک سیستم مبتنی بر لمس باشند. بنابراین، با استفاده از کنترل های تشخیص حرکت، نیاز به تعامل با دستگاه های فیزیکی، به ویژه ماوس، صفحه کلید و دکمه ها، برای کاربران کاهش می یابد. ترکیب سایر فناوری های پیشرفته رابط کاربری نظیر تشخیص صدا و گفتار و تشخیص چهره، می تواند تجربه کاربری جذاب تری را ایجاد نماید. در حقیقت، به جای ضربه زدن به صفحه کلید یا ضربه زدن روی صفحه لمسی، سیستم تشخیص حرکت، حرکات انسان را به عنوان منبع اصلی داده ورودی تشخیص و درک می کند.

Gesture Recognition ویدیو نحوه تشخیص و شناسایی حرکات انسان با تکنولوژی

نحوه کارکرد تکنولوژی Gesture recognition

تکنولوژی Gesture Recognition روز به روز در حال تبدیل شدن به محبوبیت بیشتری است. Gesture Recognition تفسیر ریاضی حرکت انسان توسط یک دستگاه محاسباتی است. ژست ها اغلب جهت دستورات ورودی استفاده می شود. شناخت حرکات به عنوان ورودی، به کامپیوتر ها امکان دسترسی بیشتر جهت ناتوانی های جسمی ارائه می دهد و تعاملات را در یک فضای بازی یا واقعیت مجازی سه بعدی طبیعی تر می کند.

تکنولوژی Gesture از چندین حالت اساسی پیروی می کند تا دستگاه به بهترین وجه عملکرد خود را انجام دهد که عبارتند از:

  • صبر کردن: در این حالت، دستگاه در انتظار کاربر است که حرکتی را انجام دهد تا ورودی جهت شروع فرآیند انجام شود.
  • جمع آوری: پس از اینکه حرکتی انجام شد، دستگاه اطلاعاتی را که به آن حرکت مربوط می شود جمع آوری می کند.
  • اداره کردن: در این حالت، سیستم داده های کافی از کاربر جمع آوری کرده و وارد مرحله پردازش می گردد.
  • اجرا: در این حالت سیستم عملی را انجام می دهد که توسط کاربر درخواست داده شده است که عمل متناسب با آن حرکت انجام پذیرد.

دستگاه های مبتنی بر تشخیص حرکت معمولاً همگی این مراحل را دنبال می کنند اما بسته به پیکربندی آنها و کاری که قرار است انجام دهد ممکن است مدت زمان آن از دستگاهی به دستگاه دیگر متفاوت باشد. کار اساسی سیستم تشخیص ژست را می توان از طریق شکل زیر درک کرد:

نحوه کارکرد سیستم تشخیص حرکت
نحوه کارکرد سیستم تشخیص حرکت

حرکات دست و بدن را می توان توسط کنترل کننده ای که حاوی شتاب سنج و ژیروسکوپ است، به منظور تشخیص خمیدگی، چرخش و شتاب حرکت تقویت کرد. همچنین می توان دستگاه محاسباتی به همراه دوربین نصب کرد تا نرم افزار در دستگاه بتواند ژست های خاص را شناسایی و تفسیر کند. به عنوان مثال یک حرکت دست ممکن است برنامه ای را خاتمه دهد.

طبقه بندی Gestures:

حرکات ژست را متناسب با کاربردهای زیر می توان طبقه بندی نموده و به کار برد:

حرکات پیشگیرانه

اقدام های پیشگیری هنگامی رخ می دهد که دست به حرکتی خاص انجام می دهد و جهت کنترل یک شی خاص مورد استفاده قرار می گیرد. نمونه هایی از این ژست ها می تواند شامل استفاده از روشنایی برای منزل باشد. به عنوان مثال تشخیص حرکت دست به هنگام نزدیک شدن به سوییچ منبع نور می تواند فرمان روشن شدن لامپ باشد. همچنین تکرار مجدد این فرمان نشانه دستور خاموش شدن لامپ می باشد. بنابراین حرکت دست جهت کنترل دستگاه می تواند به عنوان یک حرکت پیشگیرانه استفاده می شود.

عملکرد های مبتنی بر حرکات بدن

عملکردهای مرتبط با ژست حرکاتی هستند که از اجزای طبیعی بدن نظیر بازو، دست و سایر اعضا استفاده می کنند تا ارتباطی مناسب با حرکت انجام شده برقرار نمایند. به عنوان مثال، حرکت دادن دست به همراه آرنج به صورت دایره ای وار که روبروی فن قرار دارد می تواند به این منظور صورت پذیرد که وی قصد روشن کردن فن را دارد. چنین حرکاتی در واقع بیان کننده یک دستور است که می تواند با یک عملکرد خاص همراه باشد. احساس غم و اندوه می تواند از طریق چهره صورت، موقعیت سر در جهت پایین و شانه های خمیده رو به پایین منتقل شود. حرکت "ایست یا توقف" را می توان با کمک یک دست بلنده شده با کف دست رو به جلو و یا با تکان های شدید هر دو دست در بالای سر بیان کرد.

حرکات حساس به متن

حرکات حساس به متن، حرکات طبیعی دست هستند که جهت پاسخ دادن به رویدادها مورد استفاده قرار می گیرد. این حرکات حساس می توانند جهت نشان دادن بله/خیر یا پذیرش/عدم پذیرش و یا بیانگر پسندیدن/نپسندیدن باشند. این حرکات در مواردی نظیر پاسخ دادن یا رد تماس های تلفنی، پیام های صوتی و پیامک ها می توانند مورد استفاده قرار گیرند.

حرکات گفتار طبیعی

حرکات گفتار طبیعی، حرکاتی است که فرد به طور معمول از دستان خود در هنگام گفتگو استفاده میکند و متناسب با نوع مکالمه خود حرکت خاصی را جهت بیان منظور خود بروز می دهد. به عنوان مثال اگر یک فرد دست خود را در مقابل چهره خود به حالت باد زدن تکان داد سیستم gesture recognition می تواند این را تشخیص دهد و تفسیر کند که فرد خیلی احساس گرما می کند و می خواهد خنک شود.

انواع تکنولوژی های مورد استفاده در تشخیص حرکت Gesture Recognition

انواع فناوری تشخیص حرکت عبارتند از سیستم های راداری کوچک، دوربین ها و سنجش میدان الکتریکی.

  1. سیستم های راداری

    Soli یکی از پروژه های گروه پیشرفته فناوری گوگل است که یک فناوری تشخیص حرکت مبتنی بر رادار است و از سنسورهای کوچک با سرعت بالا و تکنیک های تجزیه و تحلیل داده ها برای تشخیص حرکات ظریف با دقت بسیار ظریف تر از اندازه میلی متر استفاده می کند. به عنوان مثال، Soli به کاربران اجازه می دهد تا با مالیدن انگشت شست و سبابه به یکدیگر در الگوهای از پیش تعریف شده، دستوراتی را به کامپیوتر صادر کنند.

  2. تکنولوژی های مبتنی بر دوربین و بینایی

    تکنولوژی تشخیص حرکت مبتنی بر دوربین، از دوربین هایی برای ضبط و هدایت حرکات انسان استفاده می کند. برای ترجمه حرکات انسان می توان از هر دو دوربین 2D و 3D به همراه بینایی کامپیوتر استفاده کرد. روش های تشخیص ژست مبتنی بر بینایی عبارتند از:

    • تکنیک های مبتنی بر مدل

      برخی از سیستم ها حرکات ژست را از طریق مجموعه ای از موقعیت های حساس پیگیری می کنند. وقتی یک ژست از طریق موقعیتهای حساس دقیقا مشابه حرکات ذخیره شده عمل می کند، سیستم آن را به خوبی تشخیص خواهد داد. سایر سیستم ها آن قسمت از بدن را که در حال جابجایی است ردیابی می کنند، ماهیت حرکت را محاسبه می کنند و سپس ژست را تعیین می کنند. سیستم ها معمولاً این کار را با استفاده از مدل سازی آماری برای مجموعه ای از حرکات انجام می دهند.

    • روش های مبتنی بر تصویر

      تکنیک های مبتنی بر تصویر ژست افراد را با گرفتن تصاویری از آنان در حین حرکت تشخیص می دهد. سیستم این تصاویر را به نرم افزار کامپیوتر فرستاده آن را در پایگاه داده جستجو نموده و ژست را شناسایی می کند.

  3. حسگرهای میدان الکتریکی

    امواج الکتریکی در نزدیک میدان ها توسط بارهای الکتریکی تولید می شود و به صورت سه بعدی 3D در اطراف سطح حامل بار الکتریکی منتشر می شود. وقتی ولتاژ متناوب اعمال می شود، نتیجه نیز متناوب است. زمانی که طول موج متناوب بسیار بزرگتر از هندسه الکترون باشد، نتیجه یک میدان الکتریکی نیمه ایستا است که می تواند برای حس اشیا رسانا مانند بدن انسان استفاده شود. به عنوان مثال، هنگامی که دست اپراتور به حالت بستن می باشد، حرکت موج جمع شدن دست از طریق رسانایی بدن انسان به زمین منتقل می شوند.

کاربردهای تکنولوژی Gesture Recognition

در حالی که نیاز ابتدایی تکنولوژی Gesture Recognition فقط برای بهبود تعامل کامپیوتر و انسان بود، با گسترش استفاده از کامپیوترها و دستگاه های دیجیتال کاربرد این تکنولوژی نیز به سرعت فراگیر شد. در حال حاضر کاربردهای Gesture Recognition عبارتند از:

در کنترل بازی های ویدئویی

با ورود نسل 6 کنسول بازی ویدئویی مانند Xbox با سنسور Kinect و سونی PS3 با کنترل حسگر حرکت، استفاده از تکنولوژی تشخیص حرکت به طور گسترده ای اجرا گردید. در سونی PS3، کاربران نیز باید کنترل کننده را به گونه ای حرکت دهند تا عمل آنان دقیقا به کاراکتر بازی منتقل گردد. در بازی X-Box اغلب کاربر کنترل کننده اصلی است و باید تمام حرکات فیزیکی را که شخصیت های بازی می خواهد انجام دهد، خودش آن را انجام داده تا این حرکت به بازی منتقل گردد. به عنوان مثال، اگر فوتبال بازی کردن در هر یک از کنسول های بازی باشد، باید یک بازی فوتبال را تقلید کرد. سنسور Kinect دارای یک دوربین است که حرکت کاربر را دریافت و پردازش می کند تا شخصیت بازی دقیقا همان عمل را انجام دهد.

کاربرد فناوری تشخیص حرکت در بازی های ویدئویی
کاربرد فناوری تشخیص حرکت در بازی های ویدئویی

کمک به مشکلات جسمی

افرادی که از لحاظ بینایی آسیب دیدگی دارند یا در عملکردهای حرکتی خود اختلال دارند، می توانند از دستگاههای ورودی مبتنی بر ژست کمک بگیرند تا در هنگام دسترسی به کامپیوتر دچار مشکل نگردند.

سایر کاربردها

  • تکنولوژی Gesture Recognition تقریبا در هر مکانی که از دستگاه های هوشمند استفاده می کنند از محبوبیت بالایی برخوردار است. در کنترل ترافیک هواپیما، این تکنولوژی می تواند به جزییات هر بخش نظیر اطلاعات مکان هواپیمای نزدیک به فرودگاه کمک کند. در جرثقیل، این تکنولوژی می تواند به جای کنترل از راه دور استفاده شود به طوری که جمع آوری و رها کردن بار در مکان های دشوار می تواند به آسانی صورت پذیرد.
  • امروزه تلویزیون های هوشمند با استفاده از فناوری gesture recognition در حال ساخت هستند که دیگر کاربر نیازی به کنترل ریموت نخواهد داشت و به او این امکان را می دهد تا کاربر از دست های خود برای تغییر کانال یا تنظیم میزان صدا استفاده کند. همچنین Qualcomm اخیرا دوربین های هوشمندی را که مبتنی بر تکنولوژی تشخیص حرکت هستند، راه اندازی کرده است. این دوربين ها قبل از گرفتن تصوير، نزديکترين شی را تشخيص داده و خود را طبق الزامات مورد نیاز تنظيم خواهد کرد.
  • تبلت ها نیز با استفاده از این تکنولوژی می توانند دستورات کاربر را از طریق حرکات دست وی جهت پخش کردن موزیک یا جستجوی آنها تفسیر و اجرا نمایند. فناوری Gesture Recognition همچنین می تواند مورد استفاده روبات ها قرار گیرد تا از طریق آن بتوانند حرکات انسانی را درک نموده و بر اساس آن عمل مربوطه را انجام دهند.

مزایای تکنولوژی Gesture Recognition:

تکنولوژی Gesture Recognition درب ها را به یک دنیای کاملا جدید از امکانات باز می کند. به جای محدود شدن به اشکال ورودی سنتی، کاربران می توانند فرم های ورودی مبتنی بر حرکت یا ژست را تجربه کنند. علاوه بر گوشی های هوشمند و تبلت ها، Gesture Recognition در خودرو، کنسول های بازی ویدیویی، رابط دستگاه های شخصی و غیره یافت می شود. شما دست یا انگشت خود را در مقابل سنسور حرکت می دهید و بر اساس حرکت انجام شده پاسخ مناسبی می دهد. با توجه به رویکرد بدون تماس بودن، دستگاه از سایش کمتری برخوردار است و عمر طولانی تری خواهد داشت.

استفاده از سیستم تشخیص ژست در خودرو
استفاده از سیستم تشخیص ژست در خودرو

چالش های پیش روی تشخیص ژست :

  • تاخیر در تشخیص

    یكی از چالش های مهم در تشخیص حرکت ژست این است كه پردازش حرکت می تواند با کمی مکث انجام شود و باعث ایجاد تاخیر غیرقابل قبول برای بازی های ویدئویی و سایر برنامه های مشابه شود. علاوه بر چالش های فنی جهت پیاده سازی سیستم تشخیص ژست، چالش های اجتماعی نیز وجود دارد. مثلا حرکات باید ساده، بصری و قابل قبول باشند.

  • توانمندی

    برخی از سیستم های تشخیص Gesture ممکن است به علت نور پس زمینه ناکافی و نویزهای پس زمینه موجود از دقت و بهینگی آنها به هنگام تشخیص حرکت کاسته شود.

در طی چند سال آینده، به رسمیت شناختن تکنولوژی gesture recognition به طور عمده در برنامه های کاربردی به طور گسترده ای فراگیر خواهد شد زیرا برنامه های کاربردی با تکنولوژی تشخیص حرکت برای بشر خدمات فروانی را به ارمغان خواهد آورد.

سایر مقالات: