پنجشنبه, ۱۳ اردیبهشت, ۱۴۰۳ / 2 May, 2024
مجله ویستا

ارتباط با کامپیوتر بدون صفحه کلید و ماوس


گزارش وضع هوا توسط كارشناس هواشناسی كه معمولا در قسمت انتهایی اخبار پخش می شود, برای همه ما صحنه ای آشناست. در این نوع گزارش ها معمولا پشت صفحه كارشناس یا گوینده نقشه جغرافیایی یا هوا شناسی كشور یا منطقه قرار گرفته و كارشناس هواشناسی نیز با اشاره به نقاط مختلف نقشه وضعیت آب و هوایی آن منطقه را توضیح می دهد. تصویری كه در پشت سر كارشناس قرار می گیرد لزوما تصویر ثابتی نبوده و می تواند یك انیمیشن یا حتی فیلم ماهواره ای از تغییرات آب و هوایی ۲۴ ساعت گذشته باشد. سؤالی كه برای برخی از افرادی كه چندان با مسائل سینمایی آشنایی ندارند. ممكن است پیش بیاید, اینست كه چگونه پشت سر كارشناس هوا شناسی یك تصویر متحرك پخش می شود؟ جواب این سؤال خیلی ساده است. برای تهیه این گونه برنامه ها یا گزارش ها معمولا گزارشگر یا بازیگر را در یك استادیو نیز به رنگ آبی یكدست نقاشی شده اند. بازیگر یا كارشناس هوا شناسی با اشاره به دیوار آبی رنگ كه فاقد هر گونه نقشه ای است, شروع به ارائه توضیحات می كند. در مرحله بعدی فیلم گرفته شده وارد دستگاه میكسر می شود. فیلم یا عكس مربوط به نقشه هوا شناسی هم وارد ورودی دوم همین دستگاه می شود. دستگاه Mixer هم كه معمولا یك دستگاه دیجیتال است قسمت هایی از فیلم اول كه آبی رنگ می باشند را با فیلم دوم پوشش داده و یا باصطلاح آنها را میكس می كند. خروجی این دستگاه همان چیزی است كه بینندگان روی صفحه تلویزیون مشاهده می كنند.هر چند دستگاه های میكسر دارای ریز پردازنده و سایر ادوات دیجیتال بوده و داخل خود یك كامپیوتر جمع و جور و مخصوص به خود دارند, ولی عمل میكس را می توان با كامپیوتر های معمولی و به روش های نرم افزارهایی نیز انجام داد. گاهی اوقات لازم است تا در حین ارائه توضیحات توسط كارشناس هوا شناسی, نقشه پشت سر عوض شده, زوم شده و یا اطلاعات خاصی به نقطه ای از نقشه اضافه و یا از آن حذف شود. در حال حاضر تنها روش این كار روش دستی است بدین معنی كه كارگردان یا دستیار وی با هماهنگی بازیگر یا كارشناس هواشناسی, فیلمی كه وارد دستگاه میكسر می شود را زوم كرده یا عوض می كند. خب این روش بخصوص با تكنولوژی هایی كه امروزه در دسترس می باشند, ممكن است قدری ابتدایی و مضحك به نظر برسد. اگر شما هم جزء افرادی هستید كه همین عقیده را دارید, باید اذعان كرد كه شما هم طرز تفكری شبیه دو مبتكر جوان یعنی چارلز كوهن (Charles Cohen) و جین فالك (Gene Foulk) دارید. سال ها پیش این دو نفر به این فكر افتادند تا نرم افزاری طراحی كنند تا مفهوم حركت انسان را درك كرده و عكس العمل نشان دهد. این نرم افزار با بررسی فریم های فیلمی كه بطور مستقیم توسط دوربین های دیجیتال به كامپیوتر مخابره می شوند, قادر به درك حركات انسانی بوده . عكس العمل های مناسب از خود نشان می دهد. بعنوان مثال زمانی كه كارشناس هواشناسی به منطقه یا شهری روی نقشه اشاره می كند. نرم افزار مربوطه نقشه را روی همان منطقه یا شهر زوم می كند. تمام این كار نیز بطور اتوماتیك انجام می گیرد. بعبارت بهتر می توان ادعا كرد كه كارشناس هوا شناسی می تواند به كامپیوتر دستور بدهد كه چه عملی را باید انجام دهد, بدون اینكه از صفحه كلید, ماوس یا وسایل مشابهی استفاده كرده باشد. این نرم افزار كه طوفان ژست (Gesture Storm) نامیده می شود, مراحل تست و اجرای آزمایشی را پشت سر گذاشته و حدود یك سال است كه ( از دسامبر سال ۲۰۰۳) توسط تلویزیون محلی اورلاندو در ایالت فلوریدای آمریكا مورد استفاده قرار می گیرد. نرم افزار Gesture Storm یكی از اولین نرم افزارهایی است كه فقط به وسیله یك دوربین و بدون هیچ وسیله اضافه دیگری به كاربر اجازه می دهد تا با كامپیوتر ارتباط برقرار كند. متخصصان تكنولوژی اطلاعات (IT) بر این باورند كه این نرم افزار و نرم افزارهای مشابه آن هنوز در شروع راه هستند. راهی كه آینده خوبی برای آن پیش بینی می شود. بر مبنای پیش بینی های نه چندان بدبینانه در آینده ای نه چندان دور نرم افزارهای زیادی وجود خواهند داشت كه برای كار با آنها نیازی به صفحه كلید یا ماوس وجود نداشته و صرفا با قرار گرفتن جلوی كامپیوتر مجهزبه Webcam بتوان با آنها ارتباط برقرار كرد. Gesture Storm هر چند یكی از اولین نرم افزارهایی است كه قادر به درك حركات و ژست كاربر می باشد ولی تنها نرم افزار در این زمینه هم نیست. جدیدا شركت سونی برای دستگاه های پلی استیشن ۲ دستگاهی به نام Eye Toy ارائه كرده است. این محصول شامل یك دوربین دیجیتالی ارزان قیمت و یك نرم افزار ویژه تشخیص حركات انسانی می باشد. علاقه مندان بازی های كامپیوتری می توانند با خرید این محصول و اضافه كردن آن به دستگاه پلی استیشن خود, بطور واقعی و بدون استفاده از دسته بازی به بازی كردن بپردازند. یكی از بازی هایی كه بوسیله این سیستم می توان به آن پرداخت, بازی كاراته است. هر ضربه دست یا پایی كه شما جلوی دوربین بزنید عینا توسط شخصیتی كه داخل بازی وجود دارد نیز زده خواهد شد و بدین ترتیب شما خواهید توانست تا یك مبارزه واقعی را تجربه كنید. بازی های كامپیوتری با مجهز شدن به تكنولوژی تشخیص حركات انسانی مهیج تر می شوند. یكی از كاربردهای نرم افزارهایی مانند Gesture Storm كه قادر به تشخیص حركات و ژست های انسانی هستند, می تواند بازی های كامپیوتری باشد. بازی های كامپیوتری بنا به دو دلیل می توانند استفاده كننده خوبی از این تكنولوژی باشند. یكی از این دلایل طیف استفاده كنندگان و كاربران این نرم افزارها ( بازی ها) می باشد. از آنجائیكه كاربران بازی های كامپیوتری عموما افراد كم سن و سال و یا نا آشنا با كامپیوتر هستند, استفاده از واسط هایی (interfaces) مانند صفحه كلید یا ماوس برای این طیف سخت و نا مانوس می باشد. در حال حاضر حداقل سن بازیكنان بازی های كامپیوتری به حدود ۴ سال تقلیل پیدا كرده است و بنابراین استفاده از واسط هایی مانند دوربین و نرم افزارهای تشخیص حركات دست و پا و برای این طیف بسیار مناسب بوده و پیش بینی می شود تا با استقبال خوبی مواجه شود.دلیل دیگری كه الگوریتم های تشخیص ژست در بازی های كامپیوتری كاربرد خوبی پیدا كرده اند, اینست كه نفس عملكرد و نوع كاربری این رده از نرم افزارها ( یعنی بازی های كامپیوتری) به نوعی است كه آن را كاملا مناسب برای استفاده از این تكنولوژی می كند. فروش بیش از ۵۰۰,۰۰۰ هزار دستگاه Eye Toy در آمریكا و ۲,۰۰۰,۰۰۰ دستگاه در اروپا شاهدی است بر این مدعا. سونی به همراه Eye Toy یك سی دی شامل ۱۲ بازی هم به خریداران ارائه می دهد تا كاربران بتوانند این ۱۲ بازی را با قرار گرفتن روبروی دوربین دستگاه پلی استیشنشان بازی كنند. در یكی از این بازی ها كه بی شباهت به بازی های قدیمی آتاری نیست. بشقاب پرنده هایی از آسمان فرود می آیند كه بازیگر باید با حركت دست هایش آنها را بگیرد. تصور كنید بازی كردن این بازی دیجیتال برای بچه ها تا چه حد می تواند ساده باشد. دوربینی كه در Eye Toy مورد استفاده واقع شده یك دوربین نسبتا ارزان قیمت ( حدود ۵۰ دلار با ۴۵۰,۰۰۰ هزار تومان ) است كه از طریق درگاه USB به قسمت جلوی دستگاه پلی استیشن متصل می شود. نرم افزار تشخیص حركتی هم كه داخل دستگاه اجرا می شود حدود ۱۰ درصد توان پردازشی دستگاه را به خود اختصاص داده و ۹۰ درصد را هم برای كارهای سه بعدی سازی گرافیكی آزاد می گذارد. نسخه فعلی Eye Toy فقط قادر به تشخیص حركت ( motion Detection ) بوده و كلیه بازی هایی كه فعلا روی پلی استیشن اجرا می شوند, از همین الگوریتم ساده برای كنترل بازی استفاده می كنند. سونی قول داده است تا در نسخه های آینده Eye Toy امكانات پیشرفته تر و پیچیده تری را لحاظ كند. تشخیص صورت ( قیافه ), رنگ و نگهداشتن جهت و مسیر حركت دست در فضا از جمله این امكانات خواهند بود.اگر سونی به قولی كه داده عمل كند, در این صورت بازیكنان قادر خواهند بود تا بازی هری پاتر را با ایستادن جلوی تلویزیون و تكان دادن دست ها و پاهایشان بازی كنند. در این حالت بازیكنان با ترسیم شكل های فرضی در فضا به وسیله انگشت هایشان خواهند توانست تا جادوهای مختلفی را اجرا كنند. انجام بازی های گروهی یا چند نفره نیز با این تكنولوژی ها ممكن خواهد شد. عمده مشكلاتی كه هم اكنون Eye Toy را تهدید می كنند عبارتند از سرعت پایین درگاه USB كه این دستگاه به واسطه آن به پلی استیشن وصل می شود و همچنین شلوغ پلوغ بودن اتاقی كه دستگاه بازی در آن قرار می گیرد. اتاق های شلوغ پلوغ به ویژه اگر اشیاء متحركی پشت سر بازیكن قرار داشته باشند, می تواند باعث اختلال در كار نرم افزار تشخیص الگو ( Pattern Recognition ) و تشخیص حركت ( Motion Detection ) شده و بازی به طور اشتباهی كنترل شده یا داستان بازی به مسیر نا خواسته كشیده شود. برای غلبه بر مشكلات فوق سونی وعده داده است تا در سال ۲۰۰۶ میلادی ( یعنی ۱.۵ سال دیگر) نسخه سوم پلی استیشن را وارد بازار كند. پلی استیشن ۳ بجای درگاه USB ۱.۰ دارای درگاه USB ۲.۰ خواهد بود كه تا چهل برابر از USB ۱.۰ سریعتر است. نرم افزارهای پیشرفته تر تشخیص حركت و الگو نیز باعث دقیق تر كار كردن دستگاه و با كیفیت تر شدن بازی ها خواهند شد. از آنجائیكه پلی استیشن ۳ دارای پردازنده های قوی تری خواهد بود, نرم افزار های پیچیده تر كه دارای بار پردازشی سنگین تری هستند نیز خواهند توانست تا براحتی روی این دستگاه ها اجرا شوند.
كاربردهای جدی تر تشخیص حركات انسان یا ژست
هر چند كه تشخیص حركات دست یا بدن یا بطور كلی ژست كاربردهای مهیجی در بازی های كامپیوتری دارند ولی حوزه كاربرد آنها محدود به این مقوله نمی شود. شركت سایبرنت ( Cybernet ) كه یكی از شركت های پیشگام در طراحی و عرضه نرم افزارهای تشخیص حركات اندام های كاربر می باشد بهار امسال (۱۳۸۳ ) موفق شد تا نرم افزاری به نام Navigaze را طراحی كند ( توضیح مترجم: كلمه navigaze از دو كلمه navi كه مخفف navigate می باشد و كلمه gaze تشكیل شده است. كلمه navigate كه در نرم افزار netscape navigator هم استفاده شده است به معنای هدایت هواپیما, كشتی یا كامپیوتر است و كلمه gaze نیز معنی خیره شدن می دهد. بنابراین navigaze باید نرم افزاری باشد كه به وسیله قدرت نگاه بتواند كامپیوتر را هدایت و كنترل كند.). كاربر پس از نصب نرم افزار navigaze و فعال كردن دوربین یا Webcam قادر خواهد بود تا با خیره شدن به نقطه ای از مانیتور مكان نما را به آن نقطه هدایت كند. برای كلیك كردن روی آیكونی یا اجرا كردن برنامه ای كافیست تا دو بار پلك هایش را به هم بزند و در صورتیكه بخواهد پنجره ای را اسكرول دهد كافیست تا سرش را در همان جهت حركت داده یا بچرخاند. جالب توجه آنكه شركت سایبرنت تكنولوژی تشخیص حركات های اندام را همانند بسیاری دیگر از تكنولوژی ها از یك تكنولوژی نظامی مربوط به ۶ سال پیش گرفته است. سال ۱۹۹۸ ارتش آمریكا پروژه ای تعریف و اجرا كرد تا یك فرمانده نظامی با حركت دست ها, پاها و حتی سر خود بتواند یك ستون نظامی مجازی را رهبری و هدایت كند. هدف ارتش آمریكا از اجرای این پروژه تربیت و آموزش افسران و درجه داران بود. آنها به واسطه این سیستم قادر بودند تا با در اختیار گرفتن یك دسته از سربازان مجازی و در یك محیط مجازی ( جنگل, دشت یا باطلاق ) گروه خود را به سمت هدف های از پیش تعیین شده رهبری كرده و نتایج مثبت یا منفی دستورات صادر شده را ببینند. تشخیص ژست یا حركت های دست, پا و سر هر چند واسط خوبی برای انتقال فرامین به كامپیوتر می باشد ولی همان طوری كه از ظاهر قضیه نیز برمی آید, حوزه عملكرد آن كاملا محدود بوده و خیلی از جاها نمی توان از این تكنولوژی برای انتقال اطلاعات به كامپیوتر استفاده كرد. بعنوان یك مثال بارز بعید بنظر می رسد كه یك تایپیست یا برنامه نویس بتواند از این تكنولوژی ( هر چقدر هم كه كامل و پیشرفته شده باشد ) برای انجام كار خود استفاده كند. عده ای از مهندسین خوش فكر در ایالات متحده آمریكا با توجه به مزایا و معایب این تكنولوژی و تكنولوژی های قدیمی تر همچون استفاده از صفحه كلید توانسته اند این دو تكنولوژی را به همدیگر پیوند داده و دستگاهی به نام صفحه كلید مجازی ( Virtual Keyboard ) بسازند. تصویر این صفحه كلید در شكل ۲ دیده می شود. این صفحه كلید كه می تواند همراه PDA ها و كامپیوترهای دستی ( Palmtop ) مورد استفاده قرار گیرد از مكانیزم ساده ای بر خوردار است. یك منبع نوری كوچك شبیه چراغ قوه روی PDA قرار دارد كه سایه ( تصویر) حاصل از این منبع نوری تصویری از صفحه كلید به رنگ مثلا قرمز می باشد. بنابراین با روشن كردن این منبع نوری تصویری به شكل صفحه كلید روی میز تشكیل می شود. كاربر با استفاده از همین صفحه كلید و روی تصویر كلید های مربوطه تایپ می كند و دوربین كوچكی كه كنار منبع نوری قرار گرفته است موقعیت و طرز حركت انگشتان دست را حس كرده و كد كاراكتر تایپ شده را به كامپیوتر می فرستد. صفحه كلید مجازی دقیقا مثل یك صفحه كلید واقعی است فقط با توجه به اینكه كلید های آن از هوا تشكیل شده اند, بسیار نرم تر است. صفحه كلید مجازی حجم و وزن ندارد و از این رو برای استفاده در كامپیوترهای فوق العاده كوچك همانند PDA ها و Palmtop ها كاملا مناسب است. از آنجائیكه دوربین صفحه كلید های مجازی با سرعت ۵۰ فریم در ثانیه تصویر برداری می كنند, حتی سریع ترین تایپیست های دنیا نیز می توانند با این صفحه كلید ها كار كرده و با حد اكثر سرعت ممكنه عمل تایپ را انجام دهند. در ضمن روش تصویر برداری دوربین صفحه كلید های مجازی نسبت به روش تصویر برداری دستگاه هایی همچون Eye Toy پیشرفته تر شده است. در صفحه كلید های مجازی تصویر برداری بجای نورمرئی با نور مادون قرمز (IR) انجام می پذیرد, بدین ترتیب شلوغ پلوغ بودن پشت صحنه, میز یا ... دیگر نمی تواند روی تكنیك تشخیص موقعیت یا حركت تاثیر منفی بگذارد.
راه آینده
Eye Toy, gesture storm و صفحه كلید مجازی همه و همه دستگاه هایی هستند كه بر مبنای تشخیص رفتار و حركات اندام های مختلف انسان نظیر دست ها, پاهام سر و چشم ها ساخته شده و در مقیاس تجاری عرضه شده اند ( فروش Eye Toy فقط در اروپا و آمریكا بالغ بر ۵/۲ میلیون دستگاه بوده است ). اینكه آینده تكنولوژی تشخیص ژست چه خواهد بود و این تكنولوژی تا چه میزانی خواهد توانست به درون زندگی ما انسان ها رسوخ كند سؤالی جدی است كه در حال حاضر فكر متخصصان و سرمایه گذاران را بخود مشغول كرده است. هر چند در مورد آینده این تكنولوژی یا حتی تكنولوژی های دیگر بسختی می توان قضاوت دقیقی داشت, ولی شواهد و قرائن نشان می دهند كه كاربردهای تشخیص ژست روز به روز جدی تر و وسیع تر شده و خواهد شد. یكی از كاربردهایی كه برخی از شركت های نرم افزاری دارند روی آن كار می كنند, انتقال فرمان از شخص ارائه دهنده سمینار به نرم افزار مشهور Power Point است. در صورتیكه این نرم افزار كامل شود, ارائه دهنده یك سمینار براحتی خواهد توانست با اشاره دست, سر یا انگشت خود اسلاید ها را پس و پیش برده و یا آنها را تغییر دهد ( چیزی كه همه ما حد اقل یكبار آن را از ته دل آرزو كرده ایم).
یكی دیگر از استفاده های بالقوه این سیستم می تواند بكارگیری آن در اتومبیل ها جهت كاهش تصادفات باشد. دوربین ایی كه روی داشبورد خودرو نصب می شوند, همواره قیافه و طرز حركات راننده را به یك میكرو كامپیوتر كوچك مخابره می كنند. حال اگر میكروكامپیوتر داخل اتومبیل استنتاج كند كه راننده مست, عصبانی یا هیجان زده است می تواند محدودیت هایی برای حركت خودرو قائل شود یعنی مثلا اجازه ندهد تا راننده با سرعتی بیش از حد تعیین شده رانندگی كند. در حال حاضر مؤسسات تحقیقاتی و دانشگاه های زیادی در دنیا همچون مؤسسه تحقیقاتی جورجیا ( Georgia Institute Of technology ) روی تكنولوژی تشخیص حركات اندام ها و درك مفاهیم آنها كار می كنند و با این كار سهم خود را از تكنولوژی های برتر آینده حفظ كرده و یا آن را بیشتر می كنند.
منبع : شبکه فن آوری اطلاعات ایران