شنبه, ۱ اردیبهشت, ۱۴۰۳ / 20 April, 2024
مجله ویستا

اعداد سخن می گویند


اعداد سخن می گویند

روشی جدید برای کشف تقلب های مالیاتی

زمانی که الکس از برادر زن خود خواست در یک پروژه درسی به او کمک کند، نمی دانست قرار است از چه رازی پرده بردارد. الکس دانشجوی حسابداری در دانشگاه سینت مری در هالیفاکس بود و برای پروژه خود نیاز به یکسری ارقام تجاری مربوط به زندگی واقعی داشت تا روی آنها کار کند و به نظرش رسید فروشگاه برادر زنش که در زمینه فروش سخت افزار کامپیوتر فعالیت می کرد، بهترین مکان برای به دست آوردن این ارقام است.

وی در بررسی اعداد مربوط به فروش سالانه فروشگاه، چیزی که آشکارا عجیب باشد، نیافت ولی آنچه برای پروژه لازم بود انجام داد و عملیات مختصر غریبی را به خواست استاد حسابداری اش مارک نیگرینی اجرا کرد. وی با بررسی رقم اول اعداد نتیجه گرفت که ۹۳ درصد آنها با رقم یک آغاز می شوند. او گزارش خود را تحویل داد و دیگر درباره آن فکر نکرد.

بعداً زمانی که نیگرینی می خواست به پروژه ها نمره دهد به بررسی اعداد پرداخت و دریافت که احتمالاً مشکلی در کار است. گمان او زمانی تقویت شد که به تحلیل الکس در مورد بقیه اعداد نظر افکند. او گفته بود که هیچ یک از اعداد با رقم های ۲ تا ۷ شروع نشده اند و فقط ۴ عدد با رقم ۸ و ۲۱ عدد با رقم ۹ شروع شده اند.

پس از بررسی های بیشتر، نیگرینی دیگر شکی نداشت که برادرزن الکس متقلب است و دست به عددسازی زده است تا بتواند ماموران مالیات و مدیران بانک ها را گمراه کند.

موضوع جالبی بود چون در نگاه اول هیچ چیز شک برانگیزی در ارقام فروش وجود نداشت و اعداد به گونه یی تهیه شده بودند که افزایش یا کاهش ناگهانی، که معمولاً توجه ماموران را به خود جلب می کند، نداشتند. اما اشکال در آنجا بود که این اعداد بیش از حد مرتب بودند و به همین دلیل، عملیاتی که الکس به خواست او انجام داده بود مشکل این ارقام را برملا ساخت.

در اینجا موضوعی وجود داشت که آقای نیگرینی از آن آگاه بود ولی برادرزن الکس نمی دانست و آن این بود که ارقام فروش فروشگاه از یک قانون ریاضی تبعیت می کنند که ۱۰۰ سال پیش کشف شده بود. این قانون «قانون بنفرد» نامیده می شود و در حیطه بسیار گسترده یی (از قیمت سهام تا داده های آماری در مورد ظرفیت حرارتی مواد شیمیایی) کاربرد دارد. حتی انبوهی از اعداد جمع آوری شده از روزنامه نیز از این قانون پیروی می کند، یعنی حدود ۳۰ درصد از این قانون پیروی می کنند، چیزی حدود ۳۰ درصد از این اعداد با رقم یک آغاز می شوند، ۱۸ درصد با رقم ۲ و فقط ۶/۴ درصد با رقم ۹ شروع می شوند.

این قانون به قدری عجیب به نظر می رسد که اکثر مردم در ابتدا نمی توانند آن را باور کنند و در همین چند سال گذشته بوده است که ریاضیدانان توانسته اند توضیح قابل قبولی برای آن بیابند. پس از آن همه سال که قانون بنفرد یک نکته عجیب ریاضی قمداد می شد، اخیراً مورد توجه همه (از ماموران مالیاتی گرفته تا طراحان کامپیوتر) قرار گرفته است و حالا متوجه شده اند که این قانون می تواند به صورت شگفت آوری به حل بعضی مسائل بغرنج کمک کند. امروزه «موسسه حسابرسی داخلی امریکا» دوره های آموزش دوهفته یی در مورد نحوه استفاده از قانون بنفرد در بررسی تقلب ها برگزار می کند و این قانون را بزرگ ترین پیشرفت در این زمینه پس از سال ها می داند. تاریخچه کشف این قانون به شگفت آوری خود قانون است. در سال ۱۸۸۱ منجم امریکایی سایمن نیوکامب در نشریه آمریکن جورنال آو متمتیکس مطلبی درباره نکته عجیبی نوشت که در مورد کتاب های لگاریتم دریافته بود. این کتاب ها در آن زمان به شدت مورد استفاده دانشمندانی بود که به محاسبه می پرداختند. او گفت که صفحات اولیه این کتاب ها بیشتر از صفحات دیگر آن مورد استفاده قرار گرفته و کهنه و کثیف شده اند.

توضیح روشن این مساله مشکل بود. این حرف بدان معنی بود که مردم در محاسبات شان با اعدادی که با رقم یک آغاز می شوند، بیش از اعدادی که با ۸ یا ۹ آغاز می شود، سروکار دارند. نیوکامب فرمول کوچکی ارائه کرد که الگوی مورد استفاده را با تقریب خوبی نشان می داد و آن این بود که میل طبیعت به آرایش اعداد به گونه یی است که نسبت اعدادی که با رقم D شروع می شوند مساوی (۱/D +۱) ۱۰ log است.

چون هیچ استدلال قانع کننده یی برای درستی این قانون ارائه نشد، مقاله نیوکامب توجه کسی را جلب نکرد و «پدیده ورق های کهنه و کثیف» برای حدود نیم قرن به فراموشی سپرده شد. در سال ۱۹۳۸ فیزیکدانی به نام فرانک بنفرد که در شرکت جنرال الکتریک امریکا کار می کرد مجدداً به این موضوع پی برد و به همان قانون نیوکامب رسید. ولی او پا فراتر گذاشت. بنفرد بیش از ۲۰ هزار عدد مربوط به زمینه های مختلف را از سطح آبخیز رودخانه ها گرفته تا اعداد موجود در مجله های قدیمی به کار گرفت و نشان داد همان قانون اولیه و ساده برقرار است، یعنی ۳۰ درصد اعداد با رقم یک، ۱۸ درصد با رقم دو و.... شروع می شوند.

بنفرد نیز شبیه نیوکامب توضیح واقعاً قابل قبولی برای این قانون نداشت ولی شواهد زیادی که او برای نشان دادن وجود این قانون فراهم کرده بود باعث شد از آن به بعد این موضوع با نام او همراه شود.

در اینجا یک سوال اساسی مطرح بود؛ چرا این قانون بر اعداد به دست آمده از این همه منابع مختلف حاکم است؟ حدود یک چهارم قرن طول کشید تا جواب قابل قبولی برای این سوال ارائه شد. در ۱۹۶۱ راجر پینکم ریاضیدانی در دانشگاه راتگرز نیوبرونسویک در ایالت نیوجرسی نخستین گام مهم را با بیان اندیشه جانبی ظریفی برداشت؛ فرض کنید واقعاً قانونی عام، حاکم بر رقم های اعداد حاصل از پدیده های طبیعی از قبیل سطح آبخیز رودخانه و خواص مواد شیمیایی وجود داشته باشد. در این صورت چنین قانونی بدون توجه به واحد اعداد برقرار است. حتی ساکنان سیاره یی دوردست که واحد مساحت شان با هکتار ما فرق دارد، همان توزیعی را برای ارقام سطح آبخیز رودخانه به دست می آورند که ما در محاسبه برحسب هکتار به دست می آوریم ولی اگر هر ۳۳۱/۸۷ هکتار معادل یک واحد آنها باشد چگونه چنین چیزی امکان پذیر است؟

جواب پینکم آن است که توزیع ارقام به واحد آنها وابسته نیست. فرض کنید که اعداد مربوط به سطح آبخیز یک میلیون رودخانه مختلف را برحسب هکتار در دست دارید، حال اگر این اعداد را به واحد مساحت در سیاره مفروض تبدیل کنید اعداد مسلماً تغییر خواهند کرد ولی توزیع کلی ارقام همان الگوی قبلی را خواهد داشت. این خاصیت را «تغییرناپذیری مقیاس» می نامند.

پینکم به صورت ریاضی نشان داد که قانون بنفرد نیز دارای خاصیت تغییرناپذیری مقیاس است و مهم تر اینکه نشان داد قانون بنفرد تنها راه توزیع ارقامی است که دارای این خاصیت هستند. به عبارت دیگر همه قوانین عام مربوط به فراوانی ارقام به قانون بنفرد منتهی می شوند.

کارهای پینکم باعث افزایش مقبولیت این قانون شد و بقیه دانشمندان و افراد را برانگیخت تا این مساله را جدی تر بگیرند و به کاربردهای ممکن آن فکر کنند. اما یک سوال اساسی دیگر باقی ماند. دقیقاً چه نوع از اعداد از قانون بنفرد تبعیت می کنند؟ در پاسخ سریعاً دو قاعده سرانگشتی عرضه شد. اول آنکه نمونه متشکل از اعداد باید به حدی بزرگ باشد که نسبت های پیش بینی شده شانسی برای ظهور داشته باشند. در ثانی اعداد دست چین شده نباشند و اجازه داده شود هر عددی با هر شکلی وارد اطلاعات شود. لازم به ذکر نیست که قیمت ۱۰ نوع نوشابه نمی تواند از قانون بنفرد تبعیت کند چون اولاً این نمونه بسیار کوچک است و دیگر آنکه به دلیل شرایط بازار، قیمت در یک محدوده کوچک و نسبتاً ثابت تغییر می کند.

● اعداد تصادفی

از سوی دیگر اعداد تصادفی از قانون بنفرد پیروی نمی کنند چون طبق تعریف نسبت ارقام در چنین اعدادی یکسان است. این قانون مناسب اعدادی است که نه کاملاً بی قید و ضابطه باشند و نه به شدت مقید.معنای دقیق این امر تا سه سال پیش در پرده ابهام بود. در آن موقع تئودور هیل، ریاضیدانی در دانشگاه صنعتی جورجیا در آتلانتا، نشان داد که منبع واقعی قانون بنفرد کجا است. او دریافت که این منبع طرق گوناگون توزیع اعدادی است که از اندازه گیری های مختلف به دست می آیند. درنهایت تمام چیزهای قابل اندازه گیری در جهان حاصل یک فرآیند یا فرآیند دیگری مثل تکان های تصادفی اتم ها یا ضرورت ژنتیکی است.

ریاضیدانان از مدت ها قبل می دانسته اند که نحوه توزیع مقادیر برای هر یک از اینها از یک قاعده بنیادی ریاضی تبعیت می کند مثلاً قد مدیران بانک ها از منحنی گاوسی، تغییر دمای روزانه از الگوی موجی و شدت و تعداد زمین لرزه ها از قانون لگاریتمی پیروی می کنند.

حال تصور کنید که به درون مخلوطی از این توزیع ها دست برده اید و مشتی از اعداد را بیرون آورده اید. هیل ثابت کرد هر چه تعداد این اعداد بیشتر باشد رقم های آنها تطابق بیشتری با یک قانون ساده و بسیار خاص خواهد داشت. اصطلاحاً به این قانون «توزیع توزیع ها» گفته می شود. آقای هیل به صورت ریاضی نشان داد که این قانون چیزی نیست جز قانون بنفرد.

به نظر می رسد قضیه هیل که در ۱۹۹۶ منتشر شد بالاخره توانسته است علت فراگیری عجیب قانون بنفرد را توضیح دهد زیرا هر چند اعداد توصیف کننده بعضی از پدیده ها از یک توزیع خاص مانند منحنی زنگی شکل تبعیت می کنند ولی اعدادی که بسیاری از پدیده های دیگر از داده های سرشماری گرفته تا قیمت های بازار سهام را توصیف می کنند تابع مخلوطی تصادفی از انواع توزیع ها هستند. صحیح بودن قضیه هیل بدین معنی است که ارقام این داده ها باید از قانون بنفرد پیروی کنند. البته همان طوری که تحقیق ماندگار شخص بنفرد و نیز بررسی های دیگران نشان داده است واقعاً نیز این تبعیت وجود دارد.

مارک نیگرینی استاد سابق پروژه الکس که حالا استاد حسابداری دانشگاه متدیست جنوبی در شهر دالاس است معتقد است قضیه هیل پیشرفت بسیار مهمی است. او می گوید؛«این قضیه روشن می سازد که چرا این پدیده در اکثر زمینه ها ظاهر می شود.»

به علاوه این قضیه به نیگرینی کمک کرده است دیگران را متقاعد سازد که قانون بنفرد چیزی بیش از یک بازی ریاضی است و برای کاربردهای دیگر نیز مفید است. در چند سال گذشته او تلاش خود را معطوف به یکی از کاربردهای جدی قانون بنفرد کرده است؛ تشخیص تقلب.نیگرینی در تز دکترای مهم و راهگشای خود در سال ۱۹۹۲ نشان داد که بسیاری از خصایص اصلی حساب ها از اعداد مربوط به فروش گرفته تا ارقام هزینه، از قانون بنفرد تبعیت می کنند و انحرافات از این قانون به کمک آزمون های متعارف آماری به سرعت مشخص می شود. نیگرینی روش یافتن تقلب را «آنالیز ارقام» نام نهاد. موفقیت این روش باعث جلب علاقه دنیای بازرگانی و فراتر از آن شده است.

بعضی از اولین نمونه ها از جمله ارقام مربوط به فروشگاه برادر زن الکس از پروژه های درسی دانشجویان تحت سرپرستی نیگرینی به دست آمده بود. اما او بعد از مدتی روش آنالیز ارقام را به عنوان وسیله یی برای کشف تقلب های بزرگ تر به کار گرفت. یکی از آخرین موارد مربوط به یک شرکت امریکایی تفریح و مسافرت است که متل های زنجیره یی در سطح کشور دارد. مدیر حسابداری این شرکت به کمک آنالیز ارقام دریافت که ارقام ادعایی مدیر بخش بهداشت شرکت غریب می نماید. او برای تطابق با قانون بنفرد، دو رقم اول پرداخت های بهداشتی را بررسی کرد و آشکار شد که تعداد زیادی از اعداد با ۶۵ آغاز می شود. بدین ترتیب ۱۳ چک خلاف پیدا شد که مبالغی بین ۶۵۰۰ دلار تا ۶۵۹۹ دلار را شامل می شدند و مربوط به جراحی های ساختگی قلب بودند که توسط این مدیر گزارش شده و چک آن در اختیار خودش قرار گرفته بود.به رغم تلاش این مدیر برای مقبول جلوه دادن اعداد، قانون بنفرد مچ او را باز کرد. نیگرینی می گوید؛ «او به دقت سعی کرده بود دعاوی را در مورد کارکنان متل هایی مطرح کند که تعداد کارکنان مسن آنها بیش از معمول بوده است.» وی همچنین می گوید؛ «آنالیز ارقام، تقلب های دیگری را نیز کشف کرده است که در مجموع بر یک میلیون دلار بالغ می شود.»

تعجب آور نیست که امروزه دولت های مرکزی و شرکت های بزرگ تجاری به طور جدی شروع به استفاده از این قانون کرده اند. نیگرینی اظهار می دارد که علاوه بر شرکت هایی که سهام آنها در بورس عرضه می شود، موسسات بزرگ خصوصی، سازمان های تخصصی و دولتی امریکا و اروپا به همراه یکی از بزرگ ترین موسسات حسابرسی دنیا در حال به کارگیری آنالیز ارقام هستند.

● علائم هشداردهنده

مراکز دیگری نیز خواهان به کارگیری این روش برای یافتن تقلب در امور خود شده اند. مارک بویز و همکارانش از «موسسه بین المللی تکامل دارو» در بروکسل معتقدند با استفاده از این قانون می توان داده های مشکوک در آزمایش های کلینیکی را کشف کرد. به علاوه تعدادی از محققان دانشگاهی نیز با نیگرینی تماس گرفته اند تا ببینند آیا این روش می تواند تقلب های انجام شده در گزارش های آزمایشگاه ها را روشن سازد یا خیر.

البته با افزایش کاربرد آنالیز ارقام، متقلبان نیز در مورد توان این روش هوشیارتر خواهند شد. اما نیگرینی مدعی است که آگاهی متقلبان در این زمینه کمک چندانی به آنها نخواهد کرد. او می گوید؛ «مشکل افراد متقلب آن است که آنان تا زمانی که تمامی داده ها را در دست نداشته باشند ایده یی از تصویر کلی ندارند و به علاوه تقلب معمولاً در مورد قسمتی از مجموعه داده ها صورت می گیرد و متقلبان نمی دانند این قسمت به چه صورت و در کجا مورد تحلیل و ارزیابی قرار خواهد گرفت. دیگر اینکه اکثر متقلبان دانشمند نیستند.»نیگرینی مدعی است به هر صورت، کاربرد قانون بنفرد فراتر از کشف این گونه جرائم است. مثلاً می توان مساله انفجار اطلاعات را در نظر گرفت که امروزه تکنولوژی ذخیره سازی اطلاعات در کامپیوتر را با مشکل مواجه کرده است. در این زمینه پتر شاته که ریاضیدانی از دانشگاه فنی بر گاکادمیه فرایبورگ است، قواعدی برای بهینه سازی ذخیره اطلاعات در کامپیوتر ارائه کرده است و در آنجا برای اختصاص فضای دیسک از نسبت های قانون بنفرد استفاده می کند.تد هیل از دانشگاه صنعتی جرجیا بر این باور است که فراگیری قانون بنفرد می تواند برای کسانی چون جمعیت شناسان و تحلیلگران خزانه که نیاز به «واقعیت سنجی» مدل های ریاضی خود دارند، مفید واقع شود. تد هیل می گوید؛ «نیگرینی اخیراً نشان داده است که وضعیت جمعیت نواحی دارای بیش از سه هزار نفر در امریکا به قانون بنفرد بسیار نزدیک است. یعنی از این قانون می توان برای آزمودن مدل های پیشگویی جمعیت استفاده کرد. اگر اعداد پیشگویی شده به قانون بنفرد نزدیک نباشد، باید به فکر مدل ریاضی بود.»هیل و نیگرینی هر دو تاکید می کنند که این قانون کاشف همه تقلب ها نیست. انحراف از پیشگویی های این قانون نیز همیشه به معنی تقلب نیست، شاید مثلاً فقط اعداد گرد شده باشند. هر دو آنها قبول دارند که استفاده از این قانون در موارد مربوط به زندگی واقعی، به دلایل زیادی ممکن است غلط انجام شود. هیل می گوید؛ «من در این باره زیاد ناراحت نیستم چون هر قانون ریاضی و آماری دیگری نیز ممکن است به طور غلط مورد بهره برداری قرار گیرد.»ولی آنها احساس می کنند استفاده های واقعاً ماهرانه و هوشمندانه یی از قانون بنفرد میسر خواهد بود که هنوز کاملاً به تصور در نیامده است. هیل اظهار می دارد؛ «برای من این قانون نمونه یی از یک ایده ریاضی است که می تواند همگان و حتی افراد متخصص را به شگفتی وادارد.»

NewScientist, loJul.۱۹۹۹

عبدالله مصطفایی

مهناز پاک خصال



همچنین مشاهده کنید