چهارشنبه, ۱۲ اردیبهشت, ۱۴۰۳ / 1 May, 2024
مجله ویستا

تاریخچه صدا و فرمت های صوتی


تاریخچه صدا و فرمت های صوتی

کسانی که تقریبا از ۱۵ سال پیش با کامپیوتر سرکار داشتند حتما به یاد می آورند که در آن زمیان تنها صدایی که از یک کامپیوتر مثلا ۲۸۶ حارج میشد یک BIP ساده بود

● تاریخچه صدا در کامپیوتر و دلایل برای به وجود آمدن کارت های صدا

کسانی که تقریبا از ۱۵ سال پیش با کامپیوتر سرکار داشتند حتما به یاد می آورند که در آن زمیان تنها صدایی که از یک کامپیوتر مثلا ۲۸۶ حارج میشد یک BIP ساده بود. دقیقا شبیه همین بوق کوتاهی که بعد از روشن کردن کامپیوتر شنیده می شود. تا مدت ها کامپیوتر های شخصی سخت افزاری برای تولید صدا نداشتند و البته در محیط DOS کاربران نیازی به وجود صدا احساس نمیکردند.(لازم به ذرک است که در همان زمان کامپیوترهای مثل AMIGA و COMMODORE صدا و تصویر بسیار قابل قبولی ارائه میکردند).

احساس نیاز به صدا وقتی در بین کاربران ایجاد شد که بازی های کامپیوتری با بازار آمدند.با پیشرفت این بازی ها هم کاربران و هم تولید کنندگان بازی ها دیافتند که بدون سیستم صوتی مناسب بازی ها موفقیت چندانی نخواهند داشت.اینجا بود که شرکت های مختلف دست به کار شدند و ابزارهایی جانبی مختلفی را برای تولید صدا در کامپیوتر طراحی کردند.تا مدت ها بر سر یافتن استاندارد صدا بین شرکت های تولید کننده احتلاف وجود داشت.تا این که همه بر استاندارد SOUNDBLASTER از شرکت CRATIVE به توافق رسیدند.اولین کارتهای صوتی کارت هایی با ابعاد بزرگ کیفیت پایین و قیمت هایی بالا بودند.در این کارتهای صوتی SOUNDBLASTER ۱۶ BIT حدود ۸۰۰۰۰۰ هزار ریال قیمت داشتند.

به تدریج با پیشرفت تکنولوژی قیمت ها کاهش یافت و کیفیت صداهای تولید شده بهتر بود.کارت های اولیه کارت های ۸ بیتی بودند که فقط میتوانستند صدای مونو را تولید کنند.با ورود کارت های ۱۶ بیتی صدها استریو شد و کیفیت صدا نیز افزایش یافت.سپس از کارتهای صوتی ۳۲ و ۶۴ بیتی نیز وارد بازار شد.این روند تا کنون هم ادامه دارد.به طوری که در حال حاضر کارت های صوتی حرفه ای ۱۲۸ بیتی بیش از ۶ کانال صوتی رو پشتیبانی میکند و داشتن خروجی دیجیتال کیفیت صدای بسیار بالایی رو ارائه می دهند.کارت های صوتی معمولی نیز قیمتی در حد صفر دارند.زیرا کارت های صوتی اکنون به بردهای اصلی کامپیوتر وصل شدند و نیازی به خرید جداگانه آن نیست.

البته متناسب به نیاز میتونان آن را برای فعالیت هایی چون SOUND EDIT OR VIDEO خریداری کرد که خوب همیشه قیمت های بالایی خواهند داشت و وجه تمایز این گونه کارت ها در قابلیت های مختلفی است که آن را نسبت به کارت های معمولی در رده های بالاتری قرار میدهد.

● آشنایی با فرمت های صدا

تا قبل از ورود کامپیوتر به عرصه جهانی صدا به صورت فرمت صوتی وجود نداشت.اگر چه با کیفیت به روش واحدی ذخیره و خوانده میشد.ولی با ورود کامپیوتر فایل های صوتی نیز فرمت ها و قالب های مختلفی پیدا کردند.در کامپیوتر فرمت یک فایل به معنی نوع ذخیره سازی اطلاعات و نحوه خواندن آنها است.برای مثال در فرمت MIDI اصلاعات مربوط به هرساز به همراه پروزه ها نت ها و سایر اطلاعات جداگانه ذخیره می شود.ولی در فرمت WAV اطلاعات صوتی به صورت طول موج های صدا ذخیره میشود و صدا ها قابل تفکیک نیستند.به همین دلیل برنامه های خاصی به وجود دارند که میتوانند فرمت های MIDI را به نت های موسیقی تبدیل کنند.ولی در فرمت WAV تمام طول موج ها ذخیره می شوند بنابراین در فرمت های WAV حجم نسبت به فایل های MIDI بسیار بیشتر است.در حال حاضر علم موسیقی و صدا و سخت افزار بسیار پیشرفت کردند و اکثر برنامه هایی که موجود هستند بیشتر فرمت های صوتی را پخش میکنن.

به عنوان مثالی کوتاه میتوان از فرمت های WMA - RA - MP۳ - WAV - MID و غیره نام برد

● مفاهیم کلی در مبحث صدا

ما در اینجا شما را با برخی از اصطلاحات در صدا آشنا می کنیم :

▪ مونو(mono ) :

به صداهای گفته می شود که از یک کانال ضبط شده و از یک کانال هم پخش می شوند.

این صداها قابلیت تفکیک ندارند و اگر حتی از یک سیستم استریو پخش شوند کیفیت آنها تفاوت چندانی نخواهد کرد.

▪ استریو ( stereo ):

صداهای استریو صداهای هستند که در دو کانال مجزا ضبط شده و پخش می شوند.

مثلا در یک کنسرت ممکن است صدای چندابزار در کانال چپ و صدای چند ابزار دیگر در کانال راست ضبط شود.

صداهای استریو تفکیک پذیری بیشتری دارند و برای مثال می توان دور شدن و نزدیک شدن منبع صدا را هم در آنها شبیه سازی کرد.

▪ صداهای چند کاناله( multi channel ):

این صداها در واقع در چند کانال مختلف ضبط شده و پخش می شوند.

برای مثال ممکن است در یک فایل موسیقی صدای هر ابزار در یک کانال ضبط شده باشد.

این استاندارد توانائی بسیار خوبی را برای ویرایش های بعدی در اختیار ما قرار می دهد.

چون صداها تفکیک شده است ما می توانیم هر صدا را جداگانه ویرایش کنیم یا مثلا شدت صدای یکی از بزارها را بیشتر کنیم.

هنگام شنیدن نیز اگر از ابزار پخش چند کاناله استفاده کنیم صدا بیشتر کنیم . هنگام شنیدن نیز اگر از ابزار پخش چند کاناله استفاده کنیم صدا بسیار طبیعی تر شنیده خواهد شد.

▪ دالبی( dolby surround ) :

دالبی در واقع یک نوع استاندارد برای صداهای چند کاناله است.

سیستم دالبی پیش از این در سینما کاربرد داشت ولی اکنون با پیشرفت تکنولوژی دیجیتال در ویدیوها و کامپیوترها هم قابل اجرا است.

سیستم دالبی یک یک سیستم صدای محیطی است و بیشتر در فیلمها و اخیراً در بازی های کامپیوتری رواج یافته است.

برای مثال در فیلمها هنگامی که یک اتومبیل از پشت به صحنه نزدیک می شود صدای آن نیز از بلندگوهای پشتی شنیده میشود و با تغییر مکان اتومبیل صدا نیز به بلندگو های جانبی یا جلوی منتقل می شود و به این صورت صداها بسیار واقعی تر شنیده می شوند.

● فرمت DVD-A

فرمت DVD-A یا بعبارت دیگر DVD-Audio بهمراه فرمت SACD برای Audiophile ها با کیفیت صدای بالاتر از ۱۶ بیت ارائه شده است. همانطور که از نام این فرمت پیداست اطلاعات صدا بر روی یک دیسک DVD ذخیره میگردد و نوع کدینگ اطلاعات همانند CD-Audio معمولی PCM میباشد البته با فرکانس نمونه برداری بالاتر و تعداد بیت های بیشتر. بشکلهای مختلف بر اساس تعداد بیت و فرکانس نمونه برداری میتوان اطلاعات را بر روی DVD ذخیره نمود که بالاترین کیفیت آن برای حالت استریو ۲۴bit با فرکانس ۱۹۲khz میباشد. یعنی در بهترین حالت هر ۵ میکرو ثانیه (۱۹۲۰۰۰/۱) یکبار از سیگنال آنالوگ نمونه برداری شده و به ۲۴ بیت اطلاعات تبدیل میشود. برای سیستمهای دالبی ۵.۱ که تعداد کانالها ۶ میباشد از حداکثر فرکانس ۹۶khz استفاده میشود. میتوان از روش فشرده سازی Meridian بدون از دست دادن کیفیت MLP نیز برای بالا بردن تعداد کانالها استفاده نمود. تعدادی از سازندگان سیستم های صوتی در سراسر دنیا تنها از SACD پشتیبانی میکنند و عده ای هم مانند Meridian تنها از DVD-A و تعدادی هم مانند Linn از هردو فرمت. دستگاهی که همه فرمت ها را پشتیبانی کند Universal Player نامیده میشود. تعداد آلبوم های تولید شده برای هر دو فرمت تاکنون خیلی زیاد نبوده و معلوم نیست این Digital War به کجا بیانجامد.

● فرمت HDCD

مخفف High Definition Compatible Digital که بدست آقایان Keith Johnson و Pflash Pflaumer برای بهبود ۱۶ بیت معمولی طراحی شده است. این فرمت هم اکنون متعلق به شرکت مایکروسافت میباشد و در برابر DSD سونی قرار گرفته. اکثر چیپ های تبدیل دیجیتال به آنالوگ این فرمت رو پشتیبانی میکنند و بسیاری از سورس های دیجیتال مانند ۳۹۰ لوینسون هر دو فرمت ۱۶ بیت و HDCD رو پشتیبانی میکنند.

بعد از ۱۶ بیت فرمتهای زیادی اومد و متاسفانه بجای استاندارد سازی یک فرمت خوب هر شرکتی فرمت خودش رو به بازار ارایه کرد. همچنان اکثر کاربران مجبورند برای پشتیبانی همه فرمتها چند تا سورس دیجیتال داشته باشند چرا که یک دستگاه اصولا همه فرمتها رو پشتیبانی نمیکنه و اگر هم این کار رو بکنه با همه فرمتها صدای خوبی نمیده.

● فرمت DSD

شرکت سونی و فیلیپس برای بهتر نمودن وضعیت دیجیتال در سال ۱۹۹۹ میلادی این فرمت را ارایه نمودند و دیسکهای نوری این فرمت را SACD نامیدند (Super Audio CD). این فرمت در اکثر استودیوها مورد استفاده قرار میگیرد و در بازار دنیا تا این لحظه کمتر از ۴۰۰۰ آلبوم با این فرمت عرضه شده است. این فرمت بهمراه فرمت DVD-A با کیفیت ترین فرمتها بشمار میروند و از نظر بعضی ها SACD نسبت به سایر فرمتها بخاطر نوع کدینگ Musical تر میباشد. من هیچ تجربه ای برای مقایسه این دو فرمت نداشتم اما میدونم SACD خیلی بهتر از CD معمولیست . پروسه تبدیل سیگنال به دیجیتال DSD (مخفف Direct Stream Digital) بوده و در اینحالت دیتای دیجیتال معادل یک بیت با فرکانس بازبینی ۲.۸۲۲۴ مگا هرتز میباشد.

● فرمت فشرده MP۳

مخفف MPEG-۱ Audio Layer ۳ میباشد. این فرمت برای فشرده سازی اطلاعات موسیقی بکار میره (فشرده سازی همراه با کاهش کیفیت) و کیفیت بالایی نداره اما بخاطر کم حجم بودن و راحتی انتقال از طریق اینترنت خیلی مورد توجه قرار گرفته. کیفیت این فرمت هم بسته به انتخاب نوع کدینگ فرق میکنه. رنج کیفیت از ۳۲ تا ۳۲۰ کیلو بیت در ثانیه متغییره و بطور معمول از ۱۲۸ کیلو بیت در ثانیه استفاده میشه و بر روی اینترنت از طریق شبکه های Peer to Peer (مانند برنامه های kazaa یا eMule) آلبومهای زیادی قابل دسترسی هست. ویکی پدیا اطلاعات بیشتری داره میتونید به اونجا هم نگاهی بندازید.درک تفاوت همه اونها برای گوش کاملا امکانپذیر هست

● دیجیتال ۱۶ بیت Red-Book

اولین فرمت دیجیتال برای رکورد ۱۶ بیت بود با فرکانس بازبینی ۴۴.۱ کیلو هرتز. معنی جمله بالا اینه که از یک سیگنال آنالوگ برای تبدیل به داده های دیجیتال در بازه های زمانی کوچک (عکس فرکانس بازبینی) نمونه برداری میکنند و اندازه دامنه سیگنال نمونه برداری شده را به ۱۶ بیت اطلاعات تقریب میزنند.فواصل زمانی عکس مقدار فرکانس نمونه برداریست و معنی ۴۴.۱ کیلوهرتز اینست که در فواصل زمانی ۲۲ میکرو ثانیه از سیگنال نمونه برداری میشود. هرچقدر فرکانس نمونه برداری و تعداد بیت های تقریب بیشتر باشد سیگنال بشکل دقیقتری به دیجیتال تبدیل میشود. اطلاعات بیشتر اینجا است.

از نظر تئوری چون گوش انسان بیشتر از ۲۰ کیلو هرتز نمیشنوه میشه با فرکانس دو برابر حداکثر فرکانس شنوایی، سیگنال رو نمونه برداری کرد و مشکلی پیش نیاد اما تعداد بیت های تقریب خیلی مهم هستند و ۱۶ بیت در یک موسیقی شلوغ، خوب از پس استرینگ های صدا بر نمیاد.

اکثر رکوردهای موجود در بازار بر روی سی دی از نوع ۱۶ بیت ۴۴.۱ کیلو هرتز هستند.

از نظر من حتی بهترین رکوردهای ۱۶ بیت که با پیشرفته ترین متد ها در استودیوهای خوب دنیا به دیجیتال تبدیل شدند ارزش Musicality خوبی ندارند.البته احتمالا الان این وضعیت تغییر کرده....!



همچنین مشاهده کنید