Gesture Recognition Technology

Gesture Recognition Technology

از زمانی که انقلاب کامپیوتری آغاز شد، همیشه تلاش شده است تا تعامل انسان و کامپیوتر بهبود یابد. کامپیوترها در حال حاضر به یک بخش جدایی ناپذیر از زندگی ما تبدیل شده اند، از این رو استفاده از آنها برای ما باید به راحتی صحبت کردن با افراد بدون مشکل باشد. پیش از این، نحوه ارتباط انسان با این دستگاه های هوشمند، از طریق صفحه کلید یا ماوس بود. اما اکنون تلاش می شود تا تعامل انسان و دستگاههای دیجیتال تا آنجا که ممکن است بسیار طبیعی تر نظیر تعامل انسان ها با یکدیگر جلوه نماید.

امروزه فناوری در نهایت به این بعد رسیده است که دستان ما کار را به عهده بگیرند و ارتباط مستقیمی با کامپیوتر یا تلویزیون برقرار نمایند. به عنوان مثال، برای حذف یک پوشه یا فایل از کامپیوتر، کف دست خود را بر روی آن قرار دهید و آن را مانند یک کاغذ در سطل زباله پرتاب کنید. حتی در هنگام استفاده از اجاق مایکروویو برای پخت کیک، حرکت دادن دست ها می تواند به عنوان فرمانی جهت انجام عملیات خاص به مایکرویو ارسال شوند.

این جای خوشحالی است که تکنولوژی صفحه نمایش لمسی محبوب است اما انتظار می رود که به زودی با تکنولوژی Gesture recognition جایگزین شود. در حالی که بعضی از ما ممکن است فکر کنیم که این کارها یک دیدگاهی از آینده نه چندان دور باشد، برخی از افراد استفاده از تکنولوژی Gesture Recognition را تا به امروز تجربه کرده اند.

Gesture چیست؟

بر طبق تعریف دیکشنری آکسفورد، حرکت عضوی از بدن به خصوص دست یا سر جهت بیان اندیشه یا منظور خود را gesture می نامند. تعریف Kurtenbach و Hulteen (دو محقق آمریکایی) از gesture عبارت است از: حرکت دادن بدن به نحوی که حاوی مفهوم و اطلاعاتی می باشد. Gestures راههای ارتباطی هستند، حرکات بدن یعنی حرکات فیزیکی انگشتان، دست ها، بازوها، سر، چهره یا قسمت های مختلف بدن با هدف انتقال اطلاعات و تعامل با محیط زیست هستند. حرکات ناخودآگاه حدود 90٪ از ژست انسان را تشکیل می دهند. مردم حتی هنگام صحبت کردن با تلفن نیز از ژست استفاده می کنند حتی افراد نابینا نیز این حرکات را به طور ناخودآگاه انجام می دهند. در همه فرهنگ ها، انجام حرکات مرتبط با گفتار طبیعی و رایج است.

سه نقش اصلی حرکات بدن انسان ها عبارتند از:

  • برقراری ارتباط حاوی اطلاعات معنی دار
  • جهت مدیریت محیط زندگی
  • جهت کشف محیط زیست از طریق تجربه کردن حواس

تکنولوژی Gesture Recognition چیست؟

Gesture Recognition به عنوان یک نوع رابط کاربری بدون تماس طبقه بندی می شود. بر خلاف دستگاههای لمسی، دستگاههای Gesture Recognition بدون لمس کنترل می شوند. اگرچه تشخیص حرکت ژست نیز نوعی از رابط های کاربری بدون تماس است اما بر اساس گفته ها، بسیاری از دستگاه هایی که ازGesture Recognition پشتیبانی می کنند نیز از صفحه نمایش لمسی پشتیبانی می کنند.

در حالی که انواع مختلفی از تکنولوژی تشخیص حرکت ژست وجود دارد، همه آنها بر پایه شناخت حرکت انسان به عنوان یک فرم ورودی عمل می کنند. این دستگاه یک یا چند سنسور یا دوربین دارد که حرکت کاربر را نظارت می کند. هنگامی که حرکتی را تشخیص دهد که با دستوری مطابقت دارد، با خروجی مناسبی نسبت به آن دستور پاسخ می دهد. این دستورات ممکن است شامل دستوراتی نظیر بازگشایی قفل دستگاه، راه اندازی یک برنامه، کم و زیاد کردن صدا و غیره باشد.

نحوه کارکرد تکنولوژی Gesture recognition:

تکنولوژی Gesture Recognition روز به روز در حال تبدیل شدن به محبوبیت بیشتری است. Gesture Recognition تفسیر ریاضی حرکت انسان توسط یک دستگاه محاسباتی است. ژست ها اغلب جهت دستورات ورودی استفاده می شود. شناخت حرکات به عنوان ورودی، به کامپیوتر ها امکان دسترسی بیشتر جهت ناتوانی های جسمی ارائه می دهد و تعاملات را در یک فضای بازی یا واقعیت مجازی سه بعدی طبیعی تر می کند.

تکنولوژی Gesture از چندین حالت اساسی پیروی می کند تا دستگاه به بهترین وجه عملکرد خود را انجام دهد که عبارتند از:

  • صبر کردن: در این حالت، دستگاه در انتظار کاربر است که حرکتی را انجام دهد تا ورودی جهت شروع فرآیند انجام شود.
  • جمع آوری: پس از اینکه حرکتی انجام شد، دستگاه اطلاعاتی را که به آن حرکت مربوط می شود جمع آوری می کند.
  • اداره کردن: در این حالت، سیستم داده های کافی از کاربر جمع آوری کرده و وارد مرحله پردازش می گردد.
  • اجرا: در این حالت سیستم عملی را انجام می دهد که توسط کاربر درخواست داده شده است که عمل متناسب با آن حرکت انجام پذیرد.

دستگاه هایی مبتنی بر تشخیص حرکت معمولاً همگی این مراحل را دنبال می کنند اما بسته به پیکربندی آنها و کاری که قرار است انجام دهد ممکن است مدت زمان آن از دستگاهی به دستگاه دیگر متفاوت باشد. کار اساسی سیستم تشخیص ژست را می توان از طریق شکل زیر درک کرد:

نحوه کارکرد سیستم تشخیص حرکت
نحوه کارکرد سیستم تشخیص حرکت

حرکات دست و بدن را می توان توسط کنترل کننده ای که حاوی شتاب سنج و ژیروسکوپ است، به منظور تشخیص خمیدگی، چرخش و شتاب حرکت تقویت کرد. همچنین می توان دستگاه محاسباتی به همراه دوربین نصب کرد تا نرم افزار در دستگاه بتواند ژست های خاص را شناسایی و تفسیر کند. به عنوان مثال یک حرکت دست ممکن است برنامه ای را خاتمه دهد.

طبقه بندی Gestures:

حرکات ژست را متناسب با کاربردهای زیر می توان طبقه بندی نموده و به کار برد:

حرکات پیشگیرانه:

اقدام های پیشگیری هنگامی رخ می دهد که دست به حرکتی خاص انجام می دهد و جهت کنترل یک شی خاص مورد استفاده قرار می گیرد. نمونه هایی از این ژست ها می تواند شامل استفاده از روشنایی برای منزل باشد. به عنوان مثال تشخیص حرکت دست به هنگام نزدیک شدن به سوییچ منبع نور می تواند فرمان روشن شدن لامپ باشد. همچنین تکرار مجدد این فرمان نشانه دستور خاموش شدن لامپ می باشد. بنابراین حرکت دست جهت کنترل دستگاه می تواند به عنوان یک حرکت پیشگیرانه استفاده می شود.

عملکرد های مبتنی بر حرکات بدن:

عملکردهای مرتبط با ژست حرکاتی هستند که از اجزای طبیعی بدن نظیر بازو، دست و سایر اعضا استفاده می کنند تا ارتباطی مناسب با حرکت انجام شده برقرار نمایند. به عنوان مثال، حرکت دادن دست به همراه آرنج به صورت دایره ای وار که روبروی فن قرار دارد می تواند به این منظور صورت پذیرد که وی قصد روشن کردن فن را دارد. چنین حرکاتی در واقع بیان کننده یک دستور است که می تواند با یک عملکرد خاص همراه باشد. احساس غم و اندوه می تواند از طریق چهره صورت، موقعیت سر در جهت پایین و شانه های خمیده رو به پایین منتقل شود. حرکت "ایست یا توقف" را می توان با کمک یک دست بلنده شده با کف دست رو به جلو و یا با تکان های شدید هر دو دست در بالای سر بیان کرد.

حرکات حساس به متن:

حرکات حساس به متن، حرکات طبیعی دست هستند که جهت پاسخ دادن به رویدادها مورد استفاده قرار می گیرد. این حرکات حساس می توانند جهت نشان دادن بله/خیر یا پذیرش/عدم پذیرش و یا بیانگر پسندیدن/نپسندیدن باشند. این حرکات در مواردی نظیر پاسخ دادن یا رد تماس های تلفنی، پیام های صوتی و پیامک ها می توانند مورد استفاده قرار گیرند.

حرکات گفتار طبیعی:

حرکات گفتار طبیعی، حرکاتی است که فرد به طور معمول از دستان خود در هنگام گفتگو استفاده میکند و متناسب با نوع مکالمه خود حرکت خاصی را جهت بیان منظور خود بروز می دهد. به عنوان مثال اگر یک فرد دست خود را در مقابل چهره خود به حالت باد زدن تکان داد سیستم gesture recognition می تواند این را تشخیص دهد و تفسیر کند که فرد خیلی احساس گرما می کند و می خواهد خنک شود.

انواع مختلف تکنولوژی Gesture Recognition در حال استفاده عبارتند از:

  • تکنولوژی های مبتنی بر بینایی:

    روش های تشخیص ژست مبتنی بر بینایی عبارتند از:

    • تکنیک های مبتنی بر مدل:

      برخی از سیستم ها حرکات ژست را از طریق مجموعه ای از موقعیت های حساس پیگیری می کنند. وقتی یک ژست از طریق موقعیتهای حساس دقیقا مشابه حرکات ذخیره شده عمل می کند، سیستم آن را به خوبی تشخیص خواهد داد. سایر سیستم ها آن قسمت از بدن را که در حال جابجایی است ردیابی می کنند، ماهیت حرکت را محاسبه می کنند و سپس ژست را تعیین می کنند. سیستم ها معمولاً این کار را با استفاده از مدل سازی آماری برای مجموعه ای از حرکات انجام می دهند.

    • روش های مبتنی بر تصویر:

      تکنیک های مبتنی بر تصویر ژست افراد را با گرفتن تصاویری از آنان در حین حرکت تشخیص می دهد. سیستم این تصاویر را به نرم افزار کامپیوتر فرستاده آن را در پایگاه داده جستجو نموده و ژست را شناسایی می کند.

  • حسگرهای میدان الکتریکی:

    نزدیکی یک قسمت و یا کل بدن انسان توسط حسگر میدان های الکتریکی اندازه گیری می شود. این اندازه ها می توانند جهت بدست آوردن فاصله یک دست یا قسمت دیگر از بدن نسبت به شی مدنظر مورد استفاده قرار گیرند. استفاده از این حسگرها طیف گسترده ای از برنامه های کاربردی را برای صنایع تسهیل می کند.

کاربردهای تکنولوژی Gesture Recognition:

در حالی که نیاز ابتدایی تکنولوژی Gesture Recognition فقط برای بهبود تعامل کامپیوتر و انسان بود، با گسترش استفاده از کامپیوترها و دستگاه های دیجیتال کاربرد این تکنولوژی نیز به سرعت فراگیر شد. در حال حاضر کاربردهای Gesture Recognition عبارتند از:

در کنترل بازی های ویدئویی:

با ورود نسل 6 کنسول بازی ویدئویی مانند X-Box با سنسور Kinect و سونی PS3 با کنترل حسگر حرکت، استفاده از تکنولوژی تشخیص حرکت به طور گسترده ای اجرا گردید. در سونی PS3، کاربران نیز باید کنترل کننده را به گونه ای حرکت دهند تا عمل آنان دقیقا به کاراکتر بازی منتقل گردد. در بازی X-Box اغلب کاربر کنترل کننده اصلی است و باید تمام حرکات فیزیکی را که شخصیت های بازی می خواهد انجام دهد، خودش آن را انجام داده تا این حرکت به بازی منتقل گردد. به عنوان مثال، اگر فوتبال بازی کردن در هر یک از کنسول های بازی باشد، باید یک بازی فوتبال را تقلید کرد. سنسور Kinect دارای یک دوربین است که حرکت کاربر را دریافت و پردازش می کند تا شخصیت بازی دقیقا همان عمل را انجام دهد.

تصویر نمایشی از کاربرد تکنولوژی Gesture Recognition در بازی های ویدئویی
تصویر نمایشی از کاربرد تکنولوژی Gesture Recognition در بازی های ویدئویی
کمک به مشکلات جسمی:

افرادی که از لحاظ بینایی آسیب دیدگی دارند یا در عملکردهای حرکتی خود اختلال دارند، می توانند از دستگاههای ورودی مبتنی بر ژست کمک بگیرند تا در هنگام دسترسی به کامپیوتر دچار مشکل نگردند.

سایر کاربردها:
  • تکنولوژی Gesture Recognition تقریبا در هر مکانی که از دستگاه های هوشمند استفاده می کنند از محبوبیت بالایی برخورداراست. در کنترل ترافیک هواپیما، این تکنولوژی می تواند به جزییات هر بخش نظیر اطلاعات مکان هواپیمای نزدیک به فرودگاه کمک کند. در جرثقیل، این تکنولوژی می تواند به جای کنترل از راه دور استفاده شود به طوری که جمع آوری و رها کردن بار در مکان های دشوار می تواند به آسانی صورت پذیرد.
  • امروزه تلویزیون های هوشمند با استفاده از فناوری gesture recognition در حال ساخت هستند که دیگر کاربر نیازی به کنترل ریموت نخواهد داشت و به او این امکان را می دهد تا کاربر از دست های خود برای تغییر کانال یا تنظیم میزان صدا استفاده کند. همچنین Qualcomm اخیرا دوربین های هوشمندی را که مبتنی بر تکنولوژی تشخیص حرکت هستند، راه اندازی کرده است. این دوربين ها قبل از گرفتن تصوير، نزديکترين شی را تشخيص داده و خود را طبق الزامات مورد نیاز تنظيم خواهد کرد.
  • تبلت ها نیز با استفاده از این تکنولوژی می توانند دستورات کاربر را از طریق حرکات دست وی جهت پخش کردن موزیک یا جستجوی آنها تفسیر و اجرا نمایند. فناوری Gesture Recognition همچنین می تواند مورد استفاده روبات ها قرار گیرد تا از طریق آن بتوانند حرکات انسانی را درک نموده و بر اساس آن عمل مربوطه را انجام دهند.

مزایای تکنولوژی Gesture Recognition:

تکنولوژی Gesture Recognition درب ها را به یک دنیای کاملا جدید از امکانات باز می کند. به جای محدود شدن به اشکال ورودی سنتی، کاربران می توانند فرم های ورودی مبتنی بر حرکت یا ژست را تجربه کنند. علاوه بر گوشی های هوشمند و تبلت ها، Gesture Recognition در خودرو، کنسول های بازی ویدیویی، رابط دستگاه های شخصی و غیره یافت می شود. شما دست یا انگشت خود را در مقابل سنسور حرکت می دهید و بر اساس حرکت انجام شده پاسخ مناسبی می دهد. با توجه به رویکرد بدون تماس بودن، دستگاه از سایش کمتری برخوردار است و عمر طولانی تری خواهد داشت.

استفاده از سیستم تشخیص ژست در خودرو
استفاده از سیستم تشخیص ژست در خودرو

چالش های پیش روی تشخیص ژست :

  • تاخیر در تشخیص:

    یكی از چالش های مهم در تشخیص حرکت ژست این است كه پردازش حرکت می تواند با کمی مکث انجام شود و باعث ایجاد تاخیر غیرقابل قبول برای بازی های ویدئویی و سایر برنامه های مشابه شود. علاوه بر چالش های فنی جهت پیاده سازی سیستم تشخیص ژست، چالش های اجتماعی نیز وجود دارد. مثلا حرکات باید ساده، بصری و قابل قبول باشند.

  • توانمندی:

    برخی از سیستم های تشخیص Gesture ممکن است به علت نور پس زمینه ناکافی و نویزهای پس زمینه موجود از دقت و بهینگی آنها به هنگام تشخیص حرکت کاسته شود.

در طی چند سال آینده، به رسمیت شناختن تکنولوژی gesture recognition به طور عمده در برنامه های کاربردی به طور گسترده ای فراگیر خواهد شد زیرا برنامه های کاربردی با تکنولوژی تشخیص حرکت برای بشر خدمات فروانی را به ارمغان خواهد آورد.

سایر مقالات: