جمعه, ۱۳ مهر, ۱۴۰۳ / 4 October, 2024
مجله ویستا

شیوه فشرده سازی فایل ها


شیوه فشرده سازی فایل ها
اکثر فایل های موجود بر روی اینترنت با استفاده از نرم افزارهایی نظیر WinZip فشرده و بر روی سرویس دهندگان FTP مستقر هستند تا کاربران بتوانند با سرعت مناسب اقدام به دریافت آنها نمایند. فایل های فشرده ZIP یکی از متداولترین و سهل الوصول ترین نوع فایل های فشرده می باشند. با فشرده نمودن فایل ها امکان ارسال سریعتر آنها بر روی اینترنت خصوصاً در مواردیکه سرعت خط ارتباطی کاربران بالا نباشد، فراهم می گردد. پس از دریافت فایل های فشرده با استفاده از نرم افزارهای مربوطه نظیر WinZip می بایست آنها را به حالت اولیه تبدیل (از حالت فشرده خارج گردند) کرد. هدف از فشرده نمودن فایل ها کاهش ظرفیت فایل ها بوده و در زمان استفاده از فایل می بایست مجدداً فایل به حالت اولیه برگردانده شود. در فرآیند فوق بیت هایی از فایل با استفاده از الگوریتم هایی خاص، از فایل حذف و زمینه کاهش ظرفیت فایل فراهم خواهد شد. در زمان استفاده از فایل با استفاده از الگوریتم فشرده سازی عملیات معکوس انجام و فایل به حالت اولیه خود برگردانده خواهد شد. در ادامه به برخی از روش های فشرده سازی اطلاعات اشاره خواهد شد.
● یافتن افزونگی در فایل
اکثرفایل های کامپیوتری (با محتویات متفاوت) دارای افزونگی اطلاعات می باشند. این نوع فایل ها دارای اطلاعات تکراری زیادی می باشند. برنامه های فشرده سازی اطلاعات، اطلاعات تکراری موجود در فایل ها را بر اساس الگوریتم های مربوطه حذف می نمایند. پس از تشخیص اطلاعات تکراری، صرفاً اطلاعات تکراری یک بار در فایل تکرار و و در سایر موارد، از مکانیزمهای خاصی برای عدم تکرار استفاده می گردد. جمله زیر از ۱۷ کلمه، ۶۱ حرف، ۱۶ فضای خالی، یک نقطه و یک dash، تشکیل شده است
زAsk not what your country can do for you ر ask what you can do for your country.س
اگر هر یک از حروف، فضای خالی و حروف خاص، یک واحد از حافظه را اشغال نمایند، مجموعاً ۷۹ واحد از حافظه توسط عبارت فوق استفاده خواهد گردید (۷۹ = ۱ + ۱+ ۱۶ + ۶۱). به منظور کاهش ظرفیت فایل می بایست افزونگی اطلاعات در فایل را بررسی کرد. با مشاهده و بررسی عبارت فوق، نتایج زیر به دست می آید:
▪ کلمه « ask»، دو مرتبه تکرار شده است.
▪ کلمه « what»، دو مرتبه تکرار شده است.
▪ کلمه « your»، دو مرتبه تکرار شده است.
▪ کلمه «country»، دو مرتبه تکرار شده است.
▪ کلمه «can»، دو مرتبه تکرار شده است.
▪ کلمه « do»، دو مرتبه تکرار شده است.
▪ کلمه « for»، دو مرتبه تکرار شده است.
▪ کلمه »you«، دو مرتبه تکرار شده است.
با عدم لحاظ نمودن حروف بزرگ و کوچک درعبارت فوق، مشاهده می گردد که نیمی از اطلاعات موجود در عبارت فوق، زائد و تکراری می باشند. با دقت در عبارت فوق و شیوه افزونگی اطلاعات مشاهده می گردد که با دارا بودن نه کلمه ask,not,what ,your ,country,can ,do,for و you می توان پالایشی مناسبی از عبارت فوق را انجام و در صورت لزوم و با استفاده از نه کلمه فوق، مجدداً عبارت اولیه را ایجاد نمود. در این راستا و بمنظور ایجاد عبارت فوق کافی است به کلمات موجود در بخش اول (نصف عبارت) اشاره و جایگاه و تعداد تکرار هر یک از آنها را در بخش دوم مشخص نمود. در ادامه شیوه فشرده سازی اطلاعات و بازسازی مجدد آنها بررسی می گردد.
● فشرده سازی اطلاعات
اکثر برنامه های فشرده سازی از مدل ها ی متفاوت الگوریتم مبتنی بر دیکشنری ایجاد شده توسط «Lempel و Ziv»، بمنظور کاهش ظرفیت فایل ها، استفاده می نمایند. منظور از دیکشنری در الگوریتم فوق، روش های کاتولوگ نمودن بخش هایی از داده است. سیستم استفاده شده برای سازماندهی دیکشنری متفاوت و در ساده ترین حالت می تواند شامل یک لیست عددی باشد. با مراجعه مجدد به عبارت اشاره شده در بخش قبل، کلمات تکراری را انتخاب و آنها را در لیست مرتب شده ای بصورت زیر ایندکس می نمائیم. پس از ایجاد لیست فوق، می توان در مواردیکه از کلمات در عبارت استفاده می شود، از اعداد نسبت داده شده و متناظر با آنها استفاده کرد.
srco.ir
منبع : روزنامه ابرار اقتصادی