وقتی صوت خالصی را میشنویم همبلندی و هم زیر و بمی آن را ادراک میکنیم. همانطور که رنگ کیفیت اصلی نور است زیر و بمی نیز کیفیت اصلی صوت است که بر مقیاسی از زیر تا بم در تغییر است. درست همانطور که بسامد نور، رنگ را تعیین میکند، زیر و بمی نیز با بسامد صوت تعیین میشود. بهتدریج که بسامد افزایش مییابد صدا ریزتر میشود. همانطور که در مورد طول موج نور دیدیم در مورد تمیز بسامدهای متفاوت صوت نیز آدمی از توانائی خوبی برخوردار است. جوانان میتوانند بسامدهائی بین ۲۰ تا ۲۰۰۰۰ هرتز (سیکل در ثانیه) را بشنوند و کمترین تفاوت محسوس (جِیاندی) برای آنان در مورد صوتهای ۱۰۰ هرتزی کمتر از ۱ هرتز است و برای صوتهای ۱۰۰۰۰ هرتزی مقدار آن به ۱۰۰ هرتز میرسد.
اما چیزی شبیه به آمیزش رنگها در شنوائی وجود ندارد. وقتی دو یا چند صوت با بسامدهای متفاوت بهطور همزمان بهصدا درآیند، اگر بسامدهای آنها از هم فاصله کمی داشته باشند، میتوانیم زیر و بمی هریک از صوتها را بشنویم. وقتی بسامدها بههم نزدیک باشند احساس پیچیدهتری بهوجود میآورند، اما در هر حال بهعنوان صوت خالص واحدی احساس نمیشوند. در مورد دیدرنگ، آگاهی از اینکه آمیختن سه نور مختلف، منتهی به احساس رنگ واحدی میشود، فکر وجود سه نوع گیرنده را پیش آورد. فقدان پدیدهٔ مشابهی در مورد صوت به این نکته اشاره دارد که اگر هم گیرندههای اختصاصی برای بسامدهای مختلف صوت وجود داشته باشند تعداد آنها باید فوقالعاده زیاد باشد.
نظریههای ادراک زیر و بمی
همانند دیدرنگ، در مورد شنوائی نیز دو نظریه برای تبیین نحوهٔ تبدیل بسامدها به زیر و بمی عرضه شده است.
نظریهٔ اول توسط لرد راترفورد (Lord Rutherford)، فیزیکدان انگلیسی، بهسال ۱۸۸۶ بهمیان آمد. راترفورد بیان داشت که: الف- هر موج صوتی، تمامی غشاء پایه را به ارتعاش وامیدارد، و میزان ارتعاش متناسب با فراوانی صوت است؛ و ب- میزان ارتعاش غشاء پایه، میزان تکانههای تارهای عصبی را در عصب شنوائی تعیین میکند. بنابراین، صوت ۱۰۰۰ هرتزی موجب میشود غشاء پایه ۱۰۰۰ بار در ثانیه به ارتعاش درآید و این نیز سبب میگردد تارهای عصبی در عصب شنوائی ۱۰۰۰ تکانه در ثانیه شلیک کنند. مغز نیز این هزار تکانه در ثانیه را به زیر و بمی خاصی تعبیر میکند. چون، در این نظریه، زیر و بمی تابع تغییرات صوت برحسب زمان شناخته میشود، آن را نظریهٔ زمانی (temporal theory) صوت و گاهی نظریهٔ بسامدی (frequency theory) صوت نامیدهاند.
فرضیهٔ راترفورد بهزودی با مشکل بزرگی روبهرو شد. بررسیها نشان داد که سرعت شلیک تارهای عصبی حداکثر حدود ۱۰۰۰ تکانه در ثانیه است. پس چگونه زیر و بمی صوتی را که بسامد آن از ۱۰۰۰ هرتز بیشتر است ادراک میکنیم؟ ویور (Weaver) (۱۹۴۹) راهی برای نجات نظریهٔ زمانی پیشنهاد کرد. استدلال او این بود که بسامدهای بیش از ۱۰۰۰ هرتز ممکن است توسط چند گروه تار عصبی رمزگردانی شوند، به این ترتیب که هر گروه با سرعتی متفاوت از گروههای دیگر شلیک کند. مثلاً اگر گروهی نورون با سرعت ۱۰۰۰ تکانه در ثانیه شلیک کنند و سپس یکهزارم ثانیه بعد گروه دیگری نورونها نیز با سرعت ۱۰۰۰ تکانه شروع به شلیک کنند، مجموع سرعت تکانهها برای این دو گروه نورون برابر با ۲۰۰۰ تکانه در ثانیه خواهد بود. تأییدی بر این نظریهٔ زمانی، حاصل این کشف بود که حتی اگر نورونها به تمامی چرخههای موج صوتی معینی پاسخ ندهند، الگوی تکانههای عصبی در عصب شنوائی از شکل موجی صوت محرک پیروی میکند (روز - Rose، براگ - Brugge، آندرسون - Anderson، و هایند - Hind در ۱۹۶۷).
هرچند از بسامد تقریباً ۴۰۰۰ هرتزی به بالا پاسخ تارهای عصبی منطبق بر شکل موجی نیست، با این حال میتوانیم زیر و بمی را در سطح بسامدهای بسیار بالاتر نیز بشنویم. از این یافته چنین برمیآید که لااقل برای بسامدهای صوتی بالا باید نظام دیگری برای رمزگردانی کیفیت زیر و بمی وجود داشته باشد.
نظریهٔ دوم در زمینهٔ ادراک زیر و بمی به سال ۱۶۸۳ برمیگردد. در آن سال ژزف گیشار دوورنی (Joseph Guichard Duverney)، کالبدشناس فرانسوی، این نظر را پیش کشید که بسامد صوتی بهطور مکانیکی بهکمک پدیدهٔ تشدید (fesonance) به زیر و بمی رمزگردانی میشود (گرین - Green و ویر - Wier در ۱۹۸۴). برای درک بیشتر این نظریه بهتر است ابتدا مثالی از تشدید بدهیم. وقتی کنار پیانو به دوشاخهٔ صوتی ضربهای وارد شود، همان زه پیانو که برای بسامد دو شاخهٔ صوتی تنظیم شده است شروع به ارتعاش میکند. گفتن اینکه گوش نیز بههمین ترتیب عمل میکند در واقع به این معنی است که گوش ارای ساختاری است شبیه به ساز زهی که قسمتهای مختلف آن برای بسامدهای مختلف صوت تنظیم شدهاند، طوریکه وقتی صوتی با بسامد معینی به گوش میرسد قسمت مربوط به آن در ساختار گوش شروع به ارتعاش میکند. بعدها اثبات شد که این نظر اصولاً درست است و آن ساختار، غشاء پایه است.
در قرن نوزدهم، هرمان فون هلمهولتس برمبنای نظریهٔ تشدید، نظریهٔ مکانی (place theory) ادراک زیر و بمی را ارائه کرد. برمبنای این نظریه، وقتی مکانی خاص در طول غشاء پایه پاسخ دهد، احساس زیر و بمی معینی را موجب میشود. این واقعیت که نقاط متعددی روی غشاء پایه وجود دارند سازگار با این نظر است که در دریافت زیر و بمی، گیرندههای متعددی در کار هستند. توجه کنید که نظریهٔ مکانی بر آن نیست که ما بهوسیلهٔ غشاء پایه میشنویم، بلکه اشاره به این دارد که مکانهائی از غشاء پایه که بیشتر از مکانهای دیگر به ارتعاش درمیآیند، تعیین میکنند که کدام تارهای عصبی فعال شوند، و این نیز بهنوبهٔ خود تعیین میکند که ما چه نوع زیر و بمی را بشنویم. در اینجا با نوعی دستگاه حسی سروکار داریم که در آنها رمزگردانی کیفیت محرک، تابع فعال شدن عصبهای معینی است.
تا سال ۱۹۴۰ مشخص نبود که غشاء پایه واقعاً چگونه به ارتعاش درمیآید. در این زمان گیورگفون بکسی (Georg von Békésy) ارتعاش غشاء پایه را از طریق ایجاد سوراخهای ریزی در حلزون گوش خوکچههای هندی و اجساد انسانی، اندازه گرفت. یافتههای بکسی به تغییراتی در نظریهٔ مکانی انجامید: غشاء پایه مانند پیانو که زههای مجزا دارد عمل نمیکند، بلکه بیشتر شبیه ملافهای است که آن را از یک گوشه گرفته تکان دهند. به بیان دقیقتر، بِکِسی نشان داد تمام غشاء پایه در پاسخ به بیشتر بسامدها بهحرکت درمیآید، ولی مکان بیشترین حرکت را بسامد صوت خاصی که بهصدا درآمده تعیین میکند. بسامدهای بالا موجب ارتعاش انتهای غشاء پایه میشوند و بهتدریج که بسامد افزایش مییابد محل حداکثر ارتعالش در جهت روزنهٔ بیضی تغییر مکان میدهد (بکسی، ۱۹۶۰). بهخاطر این تحقیق و پژوهشهای دیگر در مورد شنوائی، فونبکسی در سال ۱۹۶۱ جایزهٔ نوبل دریافت داشت.
همانند نظریههای زمانی، نظریههای مکانی نیز بسیاری از پدیدههای ادراک زیر و بمی را تبیین میکنند ولی نه همهٔ آنها را. نارسائی اساسی نظریههای مکانی در بررسی صوتهائی با بسامدهای پائین نمایان میشود. در پاسخ به بسامدهای کمتر از ۵۰ هرتز، تمامی قسمتهای غشاء پایه تقریباً به یک اندازه به ارتعاش درمیآیند، و این بدان معنی است که تمامی گیرندهها فعال میشوند، با این نتیجه که تمیز بین بسامدهای کمتر از ۵۰ هرتز غیرممکن میشود، در حالیکه ما عملاً قادر به تمیز بسامدهای پائینتر تا حدود ۲۰ هرتزی نیز هستیم.