کارت صدای Creative X Fi, اوج تکنوژی صدای دیجیتال

در تاریخ ۱ آگوست سال ۲۰۰۵ کمپانی Creative در کنفرانسی در آلمان نسل جدید پردازنده های صوتی خود را که با نام X-Fi شناخته میشوند معرفی کرد. البته قبل از این تاریخ در ۳۱ می این شرکت تکنولوژی Xtreme Fidelity خود را که زیربنای ساخت پردازنده های صوتی جدید X-Fi است معرفی کرده بود. اما تکنولوژی X-Fi چیست؟

طبق اظهارات مسئولین شرکت Creative، تکنولوژی Xtreme Fidelity تکنولوژی است که خصوصیاتی چون پشتیبانی از صدای ۲۴ بیتی با نرخ نمونه برداری ۱۹۶ کیلوهرتز با خروجی صدای بسیار شفاف که دارای نسب سیگنال به نویز (SNR) حداقل ۱۱۰dB است را به همراه مشخصه های جدیدی چون CMSS-۳D یاCreative Multi Speaker Sound با پشتیبانی از صدای فراگیر برای هدفون ها و بلندگو های چند کاناله و تکنولوژی جدید ۲۴bit Crystalizer را در یک پردازنده واحد ادغام نموده است. عمده ترین تکنولوژی های به کار رفته در X-Fi ، تکنولوژی ۲۴bit Crystalizer و تکنولوژی CMSS-۳D میباشند که میتوانند صدای فشرده شده ۱۶ بیتی را در زمان واقعی به صدای ۲۴ بیت تبدیل نموده و آنرا به بهترین نحوی بر روی انواع هدفون ها و بلندگو ها با هر مشخصه و پیکره بندی پخش نمایند.

صدای ۲۴ بیتی چیست؟ برای درک بهتر صدای دیجیتال باید در ابتدا نگاهی به مشخصه های صدا داشته باشیم. صدا در جهان اطراف ما (مانند تمامی چیزهای دیگر) دارای کمیت آنالوگ است. به همین خاطر برای ضبط، پخش و یا اندازه گیری آن باید از ابزار های آنالوگ استفاده کرد. اما کامپیوترها نمیتوانند با مقادیر آنالوگ کار کنند. به همین خاطر برای ایجاد تغییر یا ذخیره صدا بر روی کامپیوتر باید کمیت های آنالوگی مانند صدا را به کمیت های دیجیتال تغییر داد. همانطور که میدانید صدا به صورت موجی منتقل میشود. برای تبدیل صدا به صورت دیجیتال در هر ثانیه تعداد زیادی نمونه از روی این موج گرفته شده و کمیت های عددی هر یک به صورت دیجیتال ذخیره میگردد. مهمترین مساله در کیفیت صدای ذخیره شده تعداد نمونه های اندازه گیری شده در هر ثانیه و مقادیر این نمونه ها میباشد.

هرچه تعداد نمونه ها بیشتر و مقادیر عددی آنها دقیق تر باشد صدای دقیق تری را میتوان توسط آنها باز تولید نمود. برای مثال یک صدای دیجیتال با کیفیت ۱۶ بیت و نرخ نمونه برداری ۴۸ کیلوهرتز صدایی است که هر یک از نمونه های آن دارای مقدار عددی بین یک و ۶۵۵۳۶ بوده و ۴۸۰۰۰ نمونه در ثانیه از آن تهیه شده است. بدیهی است اگر کیفیت به ۲۴ بیت افزایش یابد و نرخ نمونه برداری مثلا تا حد ۱۹۶ کیلوهرتز بالا برود، ۱۹۶۰۰۰نمونه در ثانیه بدست خواهد آمد که هریک دارای مقدار عددی بین یک و ۱۶۷۷۷۲۱۶ خواهد بود. همانطور که میبینید، از روی مقادیر دیجیتال دقیق تر میتوان صدای دقیق تری را باز تولید کرد و صدای ۲۴ بیت از تعداد نمونه های بسیار بیشتری نسبت به صدای ۱۶ بیت استفاده میکند. پس میتوان نتیجه گرفت که حرکت به سوی کد گذاری ۲۴ بیت صدا یک حرکت رو به جلو برای ایجاد صدایی با کیفیت بسیار بالا است.

پردازنده های صوتی قدیمی تر خانواده Creative Sound Blaster Live از یک پردازنده EMU۱۰k استفاده میکردند که دارای یک Mixer (ترکیب کننده) سخت افزاری برای MIDI و یک پردازنده افکت داخلی بود. این پردازنده صوتی در زمان خود یک پردازنده صوتی پیشرو بود. البته در آن زمان اساسی ترین نیاز یک کارت صدای حرفه ای یک سخت افزار MIDI و یک بانک حافظه به همراه آن به علاوه محدوده وسیعی از افکتها با کیفیت بالا بود. امروزه با وجود پردازش صدای ۳۲ بیت و واحد های ایجاد افکت بسیار حرفه ای قابل برنامه ریزی، کاملا مشخص است که این پردازنده ها دیگر از رده خارج شده اند. بزرگترین مشکل معماری پردازنده های صوتی از این دست معماری ثابت و غیر قابل انعطاف آنهاست. از زمان ظهور EMU۱۰K، نیاز های مصرف کنندگان تا حد زیادی تغییر کرده است. در حقیقت شنوندگان به ۳ دسته عمده تقسیم شده اند:

۱) کاربران دفتری و عادی که نیازهای شان به خوبی توسط پردازنده های صدای نرم افزاری موجود بر روی مادربرد ها تامین میشود.

۲) علاقه مندان به بازی که بیشتر از اینکه نیاز به صدای با کیفیت بالا داشته باشند علاقه مند به یک صدای سه بعدی خوب در بازی ها هستند که البته فشار زیادی را بر روی سیستم وارد نکره و نرخ فریم آسیب نرساند.

۳) موسیقی دانها و علاقه مندان به موسیقی که از کامپیوتر به عنوان یک کتابخانه موسیقی دیجیتال استفاده میکنند .

آنها به کارتهای صوتی نیاز دارند تا توانایی ضبط و پخش آهنگ ها و موسیقی ها را با بالاترین کیفیت داشته باشد. نسل های قبلی کارتهای صدای Creative با پشتیبانی از انواع جلوه های صوتی محیطی و افکتهای مختلف نیازهای علاقه مندان به بازی ها را تامین میکردند اما در زمینه ایجاد صدای های با کیفیت بالا با مشکلاتی مواجه بودند. این کارتها قادر نبودند تا به خوبی نمونه های مختلف را با کیفیت های متفاوت به یکدیگر تبدیل نمایند. عدم تبدیل صحیح فرکانسهای مختلف میتوانست به کیفیت صدا آسیب برساند. به همین دلیل علاقه مندان به موسیقی ناچار به استفاده از نرم افزارهای مختلف برای تبدیل فرکانسها میشدند. از سوی دیگر با توجه به قیمت بسیار بالای محصولات Creative ، این شرکت شروع به از دست دادن بازار محصولات ارزان قیمت و واگذار کردن آن به کد کننده های صوتی نرم افزاری مانند AC۹۷ نمود. پیشرفت اینترنت و به اشتراک گذاری فایلها، کامپیوتر ها را به انباری برای ذخیره کردن انواع موسیقی ها در فرمت های فشرده شده ای مانند MP۳ تبدیل نموده است. از آنجاییکه این فایلها با نرخ نمونه برداری ثابتی ذخیره و پخش میشوند، مصرف کنندگان عادی به سمت محصولات ارزان قیمت تری حرکت میکنند که دارای حداقل مشخصات سخت افزاری غیر ضروری باشد.به همین دلیل Creative به یک پردازنده صوتی جدید نیاز داشت تا عاری از تمامی مشکلات ذکر شده باشد.

در حقیقت Creative توسعه X-Fi را از ۵ سال پیش و درست از زمان عرضه اولین سری از کارتهای صدای Audigy آغاز نموده بود. معماری X-Fiطبق مشخصه های اعلام شده از طرف Creative، پردازنده X-Fi حاوی ۵۱ میلیون ترانزیستور است که با پروسه ۱۳۰ نانومتری تولید شده و در فرکانس ۴۰۰ مگاهرتز کار میکند. پردازنده جدید توانایی پردازش بیش از ۱۰,۰۰۰ MIPs (میلیون دستورالعمل در ثانیه) را دارا میباشد. به بیانی دیگر این پردازنده صوتی ۲۴ بار قوی تر از پردازنده صوتی نسل قبل Creative یعنی Audigy میباشد. قلب این پردازنده از ۴ DSP (پردازنده سیگنال دیجیتال) که به صورت ۴ پردازنده صوتی مستقل تشکیل شده است که از معماری با نام TIMD (جریانهای بهم پیوسته چند داده ای) استفاده میکنند. هر یک از پردازنده ها توانایی اداره ۲ رشته از دستورالعمل های SIMD (یک دستورالعمل چند داده) را دارند که میتواند در هر زمان دو جریان داده استریو را پردازش نماید. علاوه بر این انبوهی از مشخصه ها از جمله جلوه های ویژه صوتی، فیلتر ها و دستورالعملهای مربوط به اکولایزر ها نیز پشتیبانی شده اند. گذشته از این توانایی های بسیار بالایی برای ترکیب انواع ورودی ها تا حداکثر ۴۰۹۶ سیگنال مستقل به صورت کاملا سخت افزاری که برای ترکیب پارامترهای مختلف مخصوصا در بازی ها به کار میروند نیز مورد پشتیبانی قرار گرفته اند. پردازنده دارای ۴ گذرگاه ورودی خروجی I۲S برای اتصال درگاه های دیجیتال و آنالوگ میباشد که ۸ کانال ورودی و ۸ کانال خروجی را تامین مینماید.

گذشته از این دارای پروتکل های اختصاصی برای انتقال صدای ۸ کاناله آنالوگ بر روی یک سیم است. بعلاوه میتوانیم تا ۳۲ کانال در نرخ نمونه برداری ۴۸ کیلوهرتز، ۱۶ عدد برای ۹۶ کیلوهرتز و ۸ عدد برای ۱۹۲ کیلوهرتز را به صورت همزمان مورد استفاده قرار دهیم. مشخصات X-Fi پردازش صدا HRTF و هدفون ها بر مبنای تکنولوژی هایی است که از شرکتهای مختلف خریداری شده اند. با استفاده از این تکنولوژی ها میتوان تا حداکثر ۱۲۸ منبع صدای سه بعدی را پردازش کرد. با پشتیبانی از EAX۵.۰ میتوان انواع جلوه های محیطی مانند انعکاس ها و طنین های مختلف را بر روی حداکثر تا ۱۲۸ صدای موجود در صحنه پیاده سازی نمود. این توانایی سبب میشود تا علاوه بر امکان استفاده از تعداد بیشتری از اصوات در یک زمان، بتوان افکتها و تغییرات مختلف را بدون نیاز به پردازش نرم افزاری بر روی آنها اعمال کرد. این خصوصیات مخصوصا در بازی هایی که از Dolby PrologicII/IIx پشتیبانی میکنند بیشتر خودنمایی میکند. علاوه بر اینX-Fi میتواند تمامی این جلوه ها را بر روی هدفون ها نیز پیاده سازی کند. به بیان دیگر برای لذت بردن از جلوه های مختلف صوتی دیگر نیاز به بلندگو های چند کاناله گران قیمت نخواهید داشت. بر خلاف پردازنده های صوتی قدیمی تر، X-Fi میتواند از افکتهای مختلف در حالت های ۲۴bit/۹۶KHz و ۲۴bit/۱۹۲KHz نیز پشتیبانی کند. طراحی چیپ نیز به گونه ای است که اجازه میدهد بدون نیاز به راه اندازی مجدد سیستم بتوان بین حالتهای مختلف سوئیچ نمود.

این باعث میشود تا بتوان از حداکثر منابع سیستم به بهترین نحو استفاده کرد. X-Fi بر خلاف تمامی معماری های موجود برای طراحی پردازنده ها (از جمله پردازنده های گرافیکی) از یک معماری حلقوی قابل برنامه ریزی استفاده کرده است. این تکنولوژی مخصوصا در هنگام تقسیم سیگنالها بسیار موثر است. با استفاده از ۴۰۹۶ کانال، صدا میتواند بین عناصر مختلف پردازشی مانند کنترل کننده حافظه، ترکیب کننده صوتی، پردازنده سیگنال دیجیتال و واحد تبدیل SRC جا به جا شود. با توجه به آنچه گفته شد معماری جدید X-Fi دارای نوآوری های عمده زیر است: معماری حلقوی. پردازنده سیگنال دیجیتال (DSP) چهار گانه با طراحی جدید. SRC برای تبدیل نرخ های مختلف نمونه برداری با کیفیت بسیار بالا. ترکیب کننده (Mixer) سخت افزاری، موتور Tank مخصوص افکت ها، موتور فیلتر گذاری، پشتیبانی از DMA (دسترسی مستقیم به حافظه).

پردازش همزمان سخت افزاری و نرم افزاری مهمترین تکنولوژی های X-Fi پس از آشنایی با مشخصات و انواع کارتهای خانواده X-Fi نگاه کوتاهی خواهیم داشت به مهمترین تکنولوژی های ارائه شده توسط کارتهای صدای X-Fi. اگر به خاطر داشته باشید گفتیم که مهمترین تکنولوژی های معرفی شده از طرف Creative عبارتند از :۲۴bit Crystalizer، CMSS-۳D و X-RAM . پس از معرفی اولین کارتهای صدای ۲۴ بیتی توسط Creative و به همراه پردازنده های Audigy بسیاری از متخصصین و صاحب نظران در باره کاربردی بودن این تکنولوژی تردید داشتند. از آنجایی که تمامی MP۳ ها و CD های صوتی موجود در بازار (که ۹/۹۹ درصد مقادیر صدای ضبط شده دیجیتال در دنیا را تشکیل میدهند) به صورت ۱۶ بیت ضبط شده اند، عملا استفاده از یک پردازنده صوتی که قادر به کد گشایی ۲۴ بیتی باشد نخواهد توانست بهبودی را در عملکرد ایجاد کند. این مساله نه به خاطر ضعف در این تکنولوژی بلکه به دلیل مشخصات ذاتی نمونه برداری دیجیتال رخ میدهد.

یک نمونه دیجیتال هر قدر هم که دقیق باشد نخواهد توانست خروجی آنالوگ اولیه را به صورت کاملا دقیق بازسازی نماید چون در حین نمونه برداری همیشه مقداری از مقادیر آنالوگ نادیده گرفته میشوند. به بیان دیگر برای تهیه یک نمونه دیجیتال کاملا دقیق از روی یک موج آنالوگ باید بی نهایت نمونه به تعداد بینهایت بار در ثانیه از روی موج اصلی استخراج شود که این کار غیر ممکن است. پس در صورتی که داده ها به صورت ۱۶ بیتی کد گذاری شده باشند عملا مقدار زیادی از داده های میانی از بین رفته اند. هرچند این داده های میانی از دید ما در مواقع عادی تاثیری بر کیفیت خروجی نمونه ها نخواهد داشت اما این مساله نه به دلیل دقیق بودن مقادیر نمونه برداری شده بلکه به علت ضعف در سیستم ادراکی ما (در اینجا سیستم شنوایی) میباشد که دارای دقت زیادی نیست. با توجه به موارد ذکر شده بازار یابان Creative به سرعت تکنولوژی را اختراع کردند تا بتواند این نقیصه را پنهان کند. هرچند آنها مدعی هستند که با استفاده از این تکنولوژی میتوان مقادیر میانی از دست رفته را باز تولید نمود و حتی صدای با کیفیت تری از CD های صوتی را بدست آورد، اما افزایش کیفیت جز در موارد اندکی رخ نخواهد داد، چون با توجه به ماهیت صدا حدس زدن مقادیری که هرگز اندازه گیری نشده اند بسیار مشکل و حتی غیر ممکن است. CMSS-۳D برای حل کردن یکی از عمده ترین مشکلات نسلهای جوان و ابتدایی کارتهای صوتی چند کاناله طراحی شده است.

حتما تا به حال با اشخاصی مواجه شده اید که یک سیستم صدای حرفه ای به همراه بلندگو های چند کاناله را تهیه کرده اند و هنگام تماشای فیلمهای DVD از آن بسیار راضی هستند، اما هنگام پخش موسیقی متوجه میشوند که صدا تنها از دو کانال جلویی پخش میشود! یا شاید خودتان هنگام تماشای یک فیلم DVD که تنها دارای صدای ۱/۵ کاناله است بر روی یک بلندگوی عادی استریو متوجه این موضوع شده باشید که برخی از صدا ها، مثلا صدای صحبت کردن اشخاص خیلی کم و نا واضح است و یا اصلا به گوش نمیرسد! تکنولوژی CMSS-۳D یا صدای فراگیر چند کاناله Creative برای حل این مشکل طراحی شده است. CMSS-۳D با تبدیل صداهای چند کاناله به دو کانال و بالعکس انعطاف پذیری بینهایت بالایی را برای کار با پیکره بندی های مختلف بلندگو ها و هدفون ها ایجاد میکند.

با استفاده از این تکنولوژی میتوان امکانات زیر را بدست آورد: صدای فراگیر در هدفون ها (CMSS-۳D Headphone) صدای فراگیر در بلندگو های استریو (CMSS Virtual) تبدیل صدای استریو به صدای چند کاناله (CMSS-۳D Surround) صدای سه بعدی از چند منبع(CMSS-۳D Interactive) صدای سه بعدی از چند منبع (CMSS-۳D Interactive) : گذشته از دنیای فیلم و موسیقی، تکنولوژی CMSS-۳D میتواند در بازی ها نیز مورد استفاده قرار بگیرد. در این حالت میتوان صدای ۵.۱ کاناله در بازی را با استفاده CMSS-۳D Headphone را تبدیل به صدای فراگیر در هدفون ها نمود. بر خلاف کارتهای صدای ۱۰ سال گذشته Creative از یک واحد حافظه که نام X-RAM را روی آن گذاشته است علاوه بر ذخیره سازی نمونه های MIDI، برای ذخیره سازی صدا در بازی ها نیز استفاده نموده است. مشکل کمبود حافظه برای پردازش نمونه های صوتی در بازی ها همیشه وجود داشته است. برای این منظور توسعه دهندگان اغلب مجبور بودند از صدای های با کیفیت پایین، مثلا از صداهایی که به صورت ۸ بیت و نرخ نمونه برداری ۱۱ کیلوهرتز کد گذاری شده بودند، استفاده نمایند.

این مساله به صورت جدی به کیفیت صداهای مورد استفاده آسیب میرساند. برخی از توسعه دهندگان نیز از فرمت های حذفی مانند OGG یا MP۳ برای ذخیره صدا ها استفاده مینمودند که میتوانست هنگام کد گشایی بار زیادی را بر روی پردازنده اصلی سیستم اعمال کرده و کارایی کلی سیستم را کاهش دهد. حافظه تعبیه شده بر روی کارت صوتی مزایای زیر را به همراه دارد: حفظ حافظه اصلی سیستم، ایجاد دسترسی سریعتر به حافظه مورد نیاز پردازنده صوتی، عدم نیاز به فشرده سازی و در نتیجه از فشردگی خارج کردن فایلهای صوتی، امکان استفاده از صداهای با نرخ نمونه برداری و کیفیت بالا در بازی ها، جلوگیری از ایجاد فشار بر روی پردازنده و در نتیجه افزایش کارایی در بازی ها. در حال حاظر تنها یک بازی با پشتیبانی از X-RAM در دسترس است: UT۲۰۰۴ X-Fi Edition که البته در حال حاظر برای عموم مصرف کنندگان در دسترس نیست.

پیشنهاد میکنیم حتما نگاهی به نتایج ارائه شده توسط Creative بیندازید: همانطور که میتوانید ببینید، در ساده ترین حالت استفاده از X-RAM توانسته است تا کارایی را ۲۰ درصد افزایش دهد که برابر با ارتقاء به یک کارت گرافیک جدید میباشد. علاوه بر این کیفیت صدا نیز به نحو قابل توجهی افزایش خواهد یافت. البته به احتمال قوی در آینده تعداد بیشتری از بازیها از این تکنولوژی پشتیبانی خواهند نمود و این مساله ارزشهای این تکنولوژی را بیش از پیش آشکار خواهد کرد.