یکشنبه, ۳۱ تیر, ۱۴۰۳ / 21 July, 2024
مجله ویستا

آیا پردازنده ها نیازی به حافظه L۳ Cache دارند


آیا پردازنده ها نیازی به حافظه L۳ Cache دارند

بررسی تفاوت پردازنده های Phenom II و Athlon II

در پردازنده‌های جدید استفاده از حافظه‌ اختصاصی پرسرعت برای پردازنده‌های چند هسته‌ای رواج زیادی یافته که این حافظه به صورت اشتراکی برای تمامی هسته‌ها در دسترس است. در این حالت حافظه پرسرعت لایه سوم می‌تواند سرعت دسترسی به اطلاعاتی که زیاد مورد استفاده پردازنده قرار می‌گیرند را افزایش ‌دهد و هسته‌ها مجبور به تبادل اطلاعات با حافظه‌های کندتر (همان حافظه اصلی RAM) نیستند.

تمامی این مطالب حداقل در حد یک تئوری مقبول اعتبار دارند. پردازنده‌های جدید Athlon II X۴ تولید AMD که در واقع همان پردازنده‌های Phenom II X۴ بدون حافظه L۳ Cache‌ به شمار می‌روند به نوعی دلیلی بر عدم اهمیت حافظه‌های لایه سوم در همه موارد هستند.

برای اکتشاف میزان اهمیت حافظه‌های لایه سوم تصمیم گرفتیم این دو پردازنده را در موارد مختلف مقایسه کنیم، اما پیش از اینکه بخواهیم در نتایج به دست آمده دقیق شویم لازم است ابتدا نیم‌نگاهی به نحوه عملکرد حافظه Cache و برخی نکات ابتدایی داشته باشیم.

عملکرد کلی حافظه Cache بسیار ساده است، این حافظه‌ها در حقیقت وظیفه همزمان‌سازی دسترسی به اطلاعات را بر عهده دارند و در نقش یک بافر، اطلاعات مورد نیاز را در خود نگهداری می‌کنند تا پردازنده نیازی به مراجعه به فواصل دورتر و منابع حافظه کندتر نداشته ‌باشد. معماری رایانه‌های امروزی به شکلی ‌است که پردازنده شامل سه مرحله حافظه Cache پیش از رسیدن و دسترسی به حافظه اصلی سیستم (RAM) است.

لایه دوم و به ویژه لایه سوم تنها به عنوان بافر ایفای نقش نمی‌کنند. آن‌ها همچنین وظیفه جلوگیری از توقف عملکرد و تبادل داده پردازنده در زمان افزایش ترافیک تبادل اطلاعات و داده‌ها میان هسته‌ها را بر عهده دارند.

اثربخشی حافظه Cache در کارکرد سیستم به میزان پاسخگویی‌های موفق آن به درخواست‌ها بستگی دارد، اگر به اطلاعاتی نیاز باشد که روی Cache وجود دارند این یک موفقیت برای حافظه به حساب می‌‌آید و اگر این داده‌ها روی این حافظه موجود نباشند سیستم به حافظه‌های ثانویه دیگر مراجعه می‌کند. مراجعه به این حافظه‌ها و در واقع عدم موفقیت حافظه Cache سبب کندی پردازش می‌شود، همانطور که موفقیت حافظه Cache قدرت و توان پردازش را افزایش می‌دهد.

میزان بیشتر حافظه Cache می‌تواند داده‌های بیشتری را آماده پردازش (Buffer) کند، اما ظرفیت بیشتر حافظه با افزایش زمان تاخیر دسترسی به اطلاعات آن نیز همراه خواهد بود. از آنجایی که این حافظه میزان زیادی از ترانزیستورهای پردازنده را درگیر می‌کند، بنابراین بسیار مهم است که نسبت مناسبی میان اندازه ترانزیستورها، مصرف انرژی، توان پردازشی و میزان تاخیرها در این مورد برقرار باشد.

● حافظه‌های لایه اول، دوم و سوم...

تمامی پردازنده‌های امروزی به حافظه‌های اختصاصی مجهز هستند. این حافظه‌ها اطلاعات و ساختار ضروری آن‌ها جهت پردازش را در خود نگهداری می‌کنند. ابتدایی‌ترین نوع این حافظه‌ها که حافظه‌های لایه اول یا L۱ Cache نیز خطاب می‌شوند اولین‌بار در پردازنده‌های ۴۸۶DX مشاهده شدند. در حال حاضر میزان حافظه استاندارد L۱ Cache در پردازنده‌های AMD، ۶۴ کیلوبایت حافظه L۱ Cache برای هر هسته است در حالی که اینتل فقط از ۳۲ کیلوبایت حافظه L۱ Cache برای هر یک از هسته‌ها بهره می‌گیرد.

حافظه‌های L۱ Cache در پردازنده‌ ۴۶۸DX اینتل معرفی شدند و تا به امروز جزء لاینفک پردازنده‌ها به شمار می‌روند.

حافظه‌های لایه دوم (L۲ Cache) از زمان پردازنده‌های Pentium III به بعد در تمامی پردازنده‌ها قابل مشاهده هستند، هرچند که در پردازنده‌های Pentium pro نیز به شکل دیگری به ‌کار گرفته شده بودند. پردازنده‌های امروزی تا ۶ مگابایت حافظه L۲ Cache روی ساختار اصلی خود دارند. برای مثال، این میزان را می‌توانید در پردازنده‌های دوهسته‌ای Core۲ Duo اینتل مشاهده می‌کنید که به صورت اشتراکی میان دو هسته استفاده می‌شود. حافظه‌های L۲ Cache به طور معمول بین ۵۱۲ کیلوبایت تا ۱ مگابایت برای هر هسته استفاده می‌شوند. پردازنده‌هایی با حافظه L۲ Cache کمتر، به طور معمول پردازنده‌های کمی ارزان قیمت‌تر هستند.

اما پردازنده‌های چهارهسته‌ای طراحی و معماری کنونی را با خود به ارمغان آوردند. در این میان شرکت AMD توانست با قرار دادن دو هسته به صورت مجتمع، کنترل‌کننده حافظه را نیز به درون پردازنده منتقل کند، در حالی که اینتل از قرار دادن دو هسته جداگانه درون یک بسته، اولین دوهسته‌ای خود را معرفی کرد.

حافظه Cache اختصاصی برای اولین‌بار در پردازنده‌های سری Core۲ Duo اینتل استفاده شد که از حافظه L۲ Cache اشتراکی برای دو هسته استفاده می‌کرد. اما باز این AMD بود که موفق شد اولین پردازنده چهارهسته‌ای واقعی را -که چهار هسته به صورت مجتمع در یک پردازنده مستقر کرده ‌بود- در پردازنده‌های چهارهسته‌ای Phenom معرفی کند. اینتل نیز این‌بار با ترکیب دو پردازنده دوهسته‌ای در کنار یکدیگر اولین پردازنده چهارهسته‌ای خود را معرفی کرد.

تاریخچه حافظه‌های L۳ Cache به سال ۱۹۹۵ بازمی‌گردد، اما پردازنده‌های Phenom محصول شرکت AMD اولین پردازنده‌های دسکتاپی بودند که از حافظه L۳ Cache‌ در آن‌ها استفاده می‌شد. پردازنده‌های ۶۵ نانومتری Phenom X۴ به همراه ۲ مگابایت حافظه L۳ Cache اشتراکی همچنین پردازنده‌های ۴۵ نانومتری PhenomII X۴ نیز به همراه ۶ مگابایت حافظه L۳ Cache اشتراکی تولید و عرضه شدند. پردازنده‌های Core i۷ و Core i۵ نیز به ۸ مگابایت حافظه L۳ Cache اختصاصی تجهیز شده‌اند.

● مقایسه پردازنده‌های AthlonII X۴‌ و PhenomII X۴

در این بررسی که میان دو پردازنده متفاوت از AMD شکل گرفته بیشترین دقت متوجه میزان بازدهی حافظه L۳ Cache در پردازنده‌های چهارهسته‌ای مدرن این شرکت است.

در یک سمت پردازنده Athlon II X۴ ۶۲۰ قرار دارد که به نوعی شاید بتوان آن‌ را به عنوان ضعیف‌ترین پردازنده چهارهسته‌ای معرفی کرد، اما این پردازنده اولین پردازنده چهارهسته‌ای بود که تا امروز با قیمت زیر ۱۰۰ دلار به بازار عرضه شده ‌است. این پردازنده از توان خوبی برخوردار است که البته همواره نمی‌تواند این کارایی را از خود بروز دهد، زیرا فاقد حافظه L۳ Cache است. برای زورآزمایی با این پردازنده در این رقابت از پردازنده پرقدرت Phenom II X۴ ۹۶۵ استفاده کرده‌ایم.

پردازنده Phenom II X۴ ۹۶۵ پرچمدار نسل جدید پردازنده‌های AMD‌ است در حالی‌که پردازنده Athlon II X۴ ۶۲۰ در مرز ورودی پردازنده‌های چهارهسته‌ای جدید AMD قرار دارد. اما باید توجه داشت که بطن هر دو پردازنده از لحاظ معماری و طراحی مشابه هستند به بیان دیگر هسته‌های پردازشی حافظه‌های L۱ Cache‌ و L۲ Cache‌ به طور کامل مشابه یکدیگرند. در واقع باید گفت تنها تفاوت این دو گروه پردازنده این است که در پردازنده‌های AthlonII حافظه L۳ Cache پردازنده‌های PhenomII‌ غیرفعال شده ‌است.

البته برای ملموس‌تر شدن آزمایش‌های شکل گرفته روی این دو پردازنده فرکانس پردازنده Phenom II X۴ ۹۶۵ را از ۴/۳ به ۶/۲ گیگاهرتز کاهش دادیم تا از این جهت نیز دو پردازنده، فرکانس مشابهی را داشته ‌باشند.

در حالت کلی باید گفت که توان مصرفی و راندمان پردازنده چهارهسته‌ای -که فاقد حافظه L۳ Cache است- به طور قطع بهتر خواهد بود.

در تست‌های انجام شده در بنچ‌مارک‌های PCMark Vantage و SiSoftware Sandra ۲۰۰۹ تنها تفاوت کمی به نفع پردازنده Phenom II X۴ ۹۶۵ مشاهده می‌شود که می‌توان آن ‌را به حافظه ۶ مگابایتی L۳ Cache آن نسبت داد. در تست حافظه PCMark، این پردازنده ۱۲ درصد کارایی بهتری دارد در حالی که در مجموع نتایج تست‌های بنچ‌مارک Sandra، این تفاوت به ۸ درصد کاهش می‌یابد.

در آزمایش‌های پردازنده بنچ‌مارک ۳DMark Vantage نیز فقط ۵ درصد تفاوت کارایی مشاهده می‌شد، این در حالی ‌است که نتایج کارایی GPU‌ در سیستم‌های مجهز به هر دو گونه پردازنده به طور کامل مشابه بود.

در بازی‌ها و نرم‌افزارهای گرافیکی نیز تفاوت کارایی میان ۸ تا ۲۰ درصد و گاهی اوقات نیز نتایج مشابهی مشاهده می‌شود. برای مثال، در تست‌های شکل گرفته در نرم‌افزار Photoshop CS۴ هیچ‌گونه تفاوت کارایی مشاهده نشد!

در مجموع باید گفت که کارایی پردازنده‌های AthlonII‌ در مقابل پردازنده‌های PhenomII‌ ما را به وجد آورد! زیرا با توجه به تفاوت‌های میان این دو پردازنده، به خصوص تفاوت قیمت آن‌ها استفاده از پردازنده‌های AthlonII‌ -به ویژه برای آن دسته از کاربرانی که نیم‌نگاهی نیز به هزینه خرید پردازنده دارند- به شدت توصیه می‌شود! اما نباید از کارایی و قابلیت‌های بالای پردازنده‌های PhenomII نیز به آسانی گذشت. در کل مشخص است که کارایی مناسب پردازنده‌های AthlonII‌ (نسبت مناسب کارایی به قیمت‌ آن‌ها) دلیل خوب نبودن پردازنده‌های PhenomII‌ نیست، تمام!