علم دینی
آنچه در این پرونده میخوانید دیدگاه صاحب نظران فرهنگستان علوم اسلامی قم در رابطه ی دین و علم می باشد.
 
 
 
 
کد مطلب: 994
گزارشی محتوایی از پایان نامه کارشناسی ارشد
مبانی منطقی استنتاج آماری
محمد حسین علیخانی مهرجردی
تاریخ انتشار : شنبه ۱۱ شهريور ۱۳۹۶ ساعت ۰۹:۰۰
 
در استدلال قیاسی مقدمات زمینه ای قاطع و جامعبرای نتیجه فراهم می آورند ، اما در استدلال استقرایی مقدمات تنها حمایت نسبی برای نتیجه فراهم می کنند. استقرا هم در زندگی روزمره مورد استفاده است و هم ساختار قسمت مهمی از علوم را تشكیل می دهد. با وجود كاربرد وسیع این نوع استدلال در زندگی روزمره و علوم مختلف یك مسئله مهم در مورد استقرا میزان قوت یا اعتبار آن است و این كه چگونه می توان قوت این گونه استدلال را بالا برد.
 
به گزارش پایگاه اطلاع رسانی فرهنگستان علوم اسلامی قم، آقای محمدحسین علیخانی، عضو گروه منطق و روش شناسی، چندی پیش در دانشگاه تربیت مدرس تهران از پایان نامه مقطع ارشد خود با عنوان «مبانی منطقی استنتاج آماری» دفاع کردند. متن زیر گزارشی محتوایی از پایان نامه ایشان می باشد که جهت اطلاع علاقه مندان در سایت قرار می گیرد.



***



مقدمه
به طور کلی در اندیشه بشر دو نوع استدلال به چشم می خورد؛ قیاسی و استقرایی. در استدلال قیاسی مقدمات زمینه ای قاطع و جامعبرای نتیجه فراهم می آورند ، اما در استدلال استقرایی مقدمات تنها حمایت نسبی برای نتیجه فراهم می کنند.
استقرا هم در زندگی روزمره مورد استفاده است و هم ساختار قسمت مهمی از علوم را تشكیل می دهد. با وجود كاربرد وسیع این نوع استدلال در زندگی روزمره و علوم مختلف یك مسئله مهم در مورد استقرا میزان قوت یا اعتبار آن است و این كه چگونه می توان قوت این گونه استدلال را بالا برد.
استدلال استقرایی دارای انواعی است كه درجه قوت هر یك متفاوت است؛ مانند استقرای تعمیمی، شمارشی، تمثیلی، علّی و... .استدلال استقرایی را به طور کلی می توان به دو نوع تقسیم کرد:
۱. استدلالاتی بر اساس این پیش فرض که مجموعه مورد بررسی دارای ویژگی یکنواختی و تجانس است؛به عبارت دیگر فرض بر این است که اعضاء این مجموعه یکسان هستند. مانند یک کیسه برنج که با فرض یکسان بودن برنج های داخل آن مشتی از برنج به عنوان نمونه ارزیابی می شود و نتیجه آن به کل محتوای کیسه تعمیم داده می شود. لذا از آن جا که نتایج حاصل از این نوع استدلال با چنین پیش فرضی پشتیبانی می شود،و بسیاری از مجموعه ها به ویژه مجموعه های انسانی قابلیت چنین پیش فرضی ندارند، میزان قوت این نوع استدلال پایین است.
۲. استدلال هایی که دارای پیش فرض فوق نبوده و نتایج این نوع استدلال توسط محاسبات ریاضیاتی و آماری پشتیبانی می شود. همین امر نقطه برتری این نوع استدلال نسبت به نوع پیشین است و میزان قوت آن را نسبت به استدلال قبل بالاتر می برد.
استنتاج آماری گونه ای از استدلال است که در این نوع اخیر می گنجد. بنا به گفته نورتن بیشتر رویکردهای استقراء آماری به یکی از سه خانواده تعمیم استقرایی، استقراء فرضی و استقراء احتمالی تعلق دارند. هر خانواده بر پایه اصلی بنیان نهاده شده است، فرم استدلایی مخصوص به خود دارد و در زمینه علمی خاص کاربرد دارد.آن چه در این مقاله مورد بررسی خواهد بود تعمیم استقرایی است.
در این نوع از استقرا برای مشخص شدن وجود یك ویژگی در یك مجموعه تعریف شده، تعدادی از اعضاء آن مجموعه به عنوان نمونه به طور تصادفی انتخاب شده و ویژگی مورد نظر در آن ها بررسی می شود. سپس نتیجه حاصل از این بررسی به كل مجموعه تعمیم داده می شود. مثلا ۱۰۰۰ نفر از مردم شهر قم به صورت تصادفی انتخاب شده و قد آن ها اندازه گیری می شود. نتیجه می شود که ۸۰۰ نفر از آن ها (%۸۰)دارای قدی کمتر از۸۰ /۱ متر هستند. از این مقدمه نتیجه گرفته می شود که %۸۰ از مردم شهر قم دارای قدی کمتر از۸۰ /۱ متر هستند. بنابراین در این نوع استقرا چند متغیر مطرح هستند؛اندازه جمعیت مجموعه تعریف شده ( جامعه آماری)، ویژگی مورد بررسی، تعدادی كه به عنوان نمونه باید از مجموعه مورد نظر انتخاب شوند( حجم نمونه).

۱- تشریح روش تعمیم استقرایی
علوم مختلف تجربی و انسانی با گروه های مختلف انسانی و غیر انسانی سروکار دارند که ویژگی یا ویژگی هایی از این گروه ها مورد تحقیق وبررسی این علوم می باشد. بنابراین می توان گفت اطلاعات مربوط به این ویژگی ها بخشی از مواد مورد نیاز این علوم را تشکیل می دهد.گاهی تعداد اعضای این گروه ها آن قدر بزرگ است که به دست آوردن اطلاعات همه اعضا با توجه به مقدورات، از جمله زمان در دسترس، غیرممکن است، یا حداقل به صرفه نیست. همچنین جاهایی هست که نمونه گیری جایگزینی ندارد؛ مثلا کارخانه تولید لامپ می خواهد عمر مفید لامپ هایش را محاسبه کند.برای محاسبه عمر مفید، لامپ باید آن قدر روشن بماند تا بسوزد.در این حالت باید تعداد کمی از لامپ ها انتخاب شود؛ در غیر این صورت لامپی برای کارخانه نمی ماند.
در چنین شرایطی نمونه گیری مطرح می شود؛ یعنی یک بخشی از جمعیت مورد نظر به عنوان نمونه انتخاب شده،ویژگی مورد نظر آن ها اندازه گیری شده وسپس نتیجه حاصل به کل مجموعه تعمیم داده می شود.بنابراین نمونه گیری به عنوان یک روش علمی در خدمت محققان قرار دارد. این بخش به تشریح این روش علمی پرداخته می شود.

۱/۱- اصطلاحات اولیه
جامعه : جامعه بزرگترین مجموعه از موجودات است كه در یك زمان معین مطلوب ما قرار گیرند. مثل جامعه فرهنگیان ایران و ... .
جامعه آماری: تعدادی از عناصر مجموعه مطلوب مورد نظر كه حداقل دارای یك صفت مشخصه باشند.]این تعداد می تواند برابر یا کمتر از تعداد جامعه باشد[
صفت مشخصه: صفتی است كه بین همه عناصر جامعه آماری مشترك و متمایز كننده جامعه آماری از سایر جوامع باشد.مانند صفت معلم بودن یا کارمند بانک مرکزی بودن و ... .
نمونه: نمونه عبارتست از تعداد محدودی از آحاد جامعه آماری كه بیان كننده ویژگی های اصلی جامعه باشد. نمونه انتخاب شده باید تا حد ممكن شبیه جامعه مورد نظر باشد.
پارامتر: شاخص هایی كه از طریق سرشماری ( اندازه گیری تمامی عناصر جامعه آماری ) به دست می آیند از آن جایی که این مقادیر بر ای یک جامعه معین ثابت است به آن پارامتر گفته می شود.
آماره: شاخص هایی كه از طریق نمونه گیری ( اندازه گیری بخشی از جامعه ) به دست می آیند. از آن جایی که نمونه های متفاوتی از یک جامعه می توان گرفت،مقادیر این شاخص ها نیز متفاوت می شود.به همین دلیل به آن ها آماره گفته می شود.
ارزش جامعه ای و ارزش نمونه ای: ارزش جامعه ای مقدار یکی از پارامترهای جامعه است که باید از روی نمونه برآورد شود. ارزش نمونه ای مقدار آماره ای است که از روی نمونه محاسبه می شود. معمولا بین ارزش جامعه ای و ارزش نمونه ای اختلاف است که معرف اشتباه ناشی از نمونه گیری است. حدود این اشتباه قابل محاسبه است.

۲/۱- تشریح پارامترها ، آماره ها و فرمول های مورد نیاز در روش تعمیم استقرایی
روش تعمیم استقرایی شامل محاسباتی است که این محاسبات بر روی پارامترها و آماره هایی خاص انجام می گیرد.این بخش به تبیین این شاخص ها می پردازد.

۱-۲-۱ پارامترهای جامعه
هدف از تعمیم استقرایی، برآورد مقادیر شاخصه هایی از یک جامعه آماری است.این مقادیر برای جامعه پارامتر محسوب می شوند.این قسمت شامل تعاریف آن دسته از پارامترهایی است که در روش تعمیم استقرایی مورد نیاز است.
مجموع کل جامعه:
نشان داده می شود مجموع کل جامعه معمولاً با حرف و برابر مجموع مقادیر یک شاخصه معین برای آن جامعه است. مجموع کل جامعه از فرمول زیر به دست می آید:

میانگین جامعه: میانگین جامعه نسبت به یک شاخصه معین از فرمول زیر به دست می آید:

به عبارت دیگر میانگین همان چیزی است که عموم مردم به نام معدل آن را می شناسند، و از تقسیم مجموع مقادیر بر تعداد آنها بدست می آید.
واریانس و انحراف معیارجامعه: واریانس و انحراف معیار توزیع یک شاخصه در جامعه به این دلیل مورد توجه اند که پراکندگی توزیع را اندازه می گیرند. واریانس جامعه از فرمول زیربه دست می آید:

انحراف معیار جامعه صرفاً ریشۀ دوم واریانس است و از فرمول زیربه دست می آید:

انحراف معیار میزان پراکندگی داده های مربوط به شاخصه مورد نظر را حول میانگین نشان می دهد. هرقدر این عدد بزرگتر باشد پراکندگی داده ها نیز بیشتر است. همچنان که ملاحظه می شود هرقدر داده ها به میانگین نزدیک باشند واریانس و انحراف معیار کوچک شده به طوری که اگر تمام داده ها برابر میانگین باشند واریانس و انحراف معیار برابر صفر می شوند.این حقایق نشان می دهد که این پارامترها شاخص خوبی برای شنجش پراکندگی وتغییر پذیری داده ها نسبت به میانگین می باشند.

۳-۲-۱ آماره های نمونه:
بنا به فرض به طریقی نمونه ای با n عضو از جامعه ای دارای N عضو انتخاب شده است.همانند جامعه می توان مقادیر شاخصه ها را برای نمونه نیز محاسبه کرد. این مقادیر برای نمونه آماره محسوب می شود. این قسمت شامل تعاریف آن دسته از آماره هایی است که در روش تعمیم استقرایی مورد نیاز است.
مجموع نمونه:مجموع نمونه یک معمولاً با حرف x نشان داده می شود و برابر مجموع مقادیر یک شاخصه معین برای آن نمونه است. مجموع نمونه ای از فرمول زیر به دست می آید:

میانگین نمونه: میانگین نمونه نسبت به یک شاخصه معین از فرمول زیر به دست می آید:

واریانس و انحراف معیار نمونه: واریانس نمونه از فرمول زیربه دست می آید:

انحراف معیار نمونه صرفاً ریشۀ دوم واریانس است و از فرمول زیربه دست می آید:

۳/۱- محاسبه دقت احتمالی ارزش جامعه ای
هدف اصلی نمونه گیری برآورد ارزش های جامعه ای است؛ به عبارت دیگر یک ارزش نمونه ای به خودی خوداهمیت چندانی ندارد، بلکه اهمیت آن در چیزی است که درباره ارزش جامعه ای به ما می گوید. معمولا یک ارزش نمونه ای با پارامتر جامعه فرق دارد. اگر پارامتر جامعه معین باشد، این تفاوت مشخص است؛ در این حالت به انحراف ارزش نمونه ای از ارزش جامعه ای «دقت واقعی» می گویند. ولی معمولا ارزش جامعه ای نامعلوم بوده و هدف ما برآورد آن است؛ در این حالت به انحراف ارزش نمونه ای از ارزش جامعه ای «دقت احتمالی» می گویند.

۱-۳-۱ انحراف استاندار برآورد (se)
انحراف استاندارد، شاخصی است عکس دقت احتمالی؛ بدین معنا که هر چقدر مقدار این شاخص کمتر باشد، دقت احتمالی بیشتر است و بالعکس.به عبارت دیگر اگر انحراف استاندارد کوچک باشد،برآوردها یا ارزش های نمونه ای حول میانگینشان فشرده تر هستند. در این حالت انحراف اغلب آن ها از پارامتر مربوطه کمتر بوده و در نتیجه دقت برآوردکننده بیشتر است. مقدار آن برای میانگین جامعه برابر است با:
 
واریانس میانگین به صورت ذیل محاسبه می شود:

V(xi) مساوی S۲ که همان واریانس آماره است می باشد. بنابراین:

انحراف استاندارد برابر جذر واریانس است که می شود:

در نمونه های کوچک باید ضریبn/N -۱ به عنوان عامل تصحیح در فرمول SE اضافه شود:

در صورتی که حجم جامعه نسبت به حجم نمونه بسیار زیاد باشد، آنگاه n/N ناچیز و تقریبا برابر صفر است و بنابراین فرمول مزبور به شکل زیر خلاصه می شود:

این در صورتی است که انحراف معیار جامعه در دست با شد. در این حالت انحراف استاندارد میانگین انحراف اعضای نمونه از میانگین جامعه را نشان می دهد،که مقداری معکوس دقت واقعی است. اما انحراف معیار جامعه معمولا در دست نیست،از این رو باید انحراف استاندار برآورد را به دست آورد.در فرمول انحراف استاندار برآورد انحراف معیار نمونه جایگزین انحراف معیار جامعه می شود:
 
همچنان که ملاحظه می شود، هرقدر مقدار نمونه بیشتر باشد انحراف استاندارد برآورد کمتر می شود تا جایی که اگرn=N شود se(x ̅) برابر صفر و دقت احتمالی حداکثر می شود.لازم به ذکر است که انحراف معیار نمونه نیز با حجم نمونه رابطه عکس دارد؛بنابراین با افزایش حجم نمونه، انحراف استاندارد برآورد هم از جهت مخرج کسر و هم از جهت انحراف معیار کاهش می یابد. نکته دیگر این است که بنابر قضیه حد مرکزی با افزایش حجم نمونه و رسیدن آن به ۵۰ و بالاتر، شکل توزیع نمونه ای به توزیع نرمال تبدیل می شود.

۳-۳-۲ فاصله اطمینان و دقت احتمالی
در صورتی که علاوه بر انحراف استاندار برآورد، بنابر قضیه حد مرکزی، با توجه به بزرگ بودن حجم نمونه از شکل توزیع نرمال استاندارد نمونه نیز با خبر باشیم، آن گاه دقت احتمالی قابل محاسبه است. یکی از متغیرهای مورد نیاز «ضریب اطمینان» است که می گوید به احتمال چند درصد پارامتر مورد نظر در یک ناحیه که به آن «فاصله اطمینان» گفته می شود قرار می گیرد. ضریب اطمینان را بنا بر دقت مورد نیاز ما تعیین می کنیم. اگر میانگین پارامتر مورد نظر (μ) باشد آنگاه:

در این فرمول t متناسب با ضریب اطمینان است که از طریق یک جدول به دست می آید. مثلا اگر ضریب اطمینان مورد نظر %۹۵ باشد آنگاه t=۱/۹۶. tse(x ̅ ) دقت احتمالی است. این بدین معنا است که به احتمال ۹۵% میانگین پارامتر مورد نظر (μ ) در فاصله اطمینان قرار می گیرد؛ و به احتمال ۵% α))خارج از این فاصله که «ناحیه بحرانی» نامیده می شود قرار می گیرد. (۵۳-۵۶:سرایی،۱۳۸۸)

بنابراین هر منحنی طبیعی به سه قسمت تقسیم می شود:ناحیه وسط که سطح اطمینان است و در ناحیه کنار که ناحیه بحرانی نامیده می شوند. زمانی که بخواهیم اندازه یک پارمتر را از روی آماره متناظر آن برآورد کنیم، آماره را مبنا قرار داده و حدود احتمالی را برای یک سطح احتمالی، مثلا۹۵% ، برای آن محاسبه می کنیم؛ بدین طریق فاصله ای یافت می شود که پارامتر مورد نظر به احتمال۹۵% در آن قرار می گیرد.
مثال: فرض کنید بخواهیم حدودطمینان درآمد متوسط افراد ۱۵ سال به بالا با ضریب اطمینان%۹۵ و با اطلاعات زیر تعیین کنیم:



۳-۳-۳ برآورد حجم نمونه
یکی از سوالات مطرح در نمونه گیری حجم نمونه است.همچنان که در بالا هم اشاره شد حجم نمونه کم باعث پایین آمدن دقت می شود. از طرف دیگر حجم نمونه خیلی بالا نیز باعث اتلاف امکانات می شود. بنابراین باید براساس دقت مورد، فرمولی جهت به دست آوردن حجم نمونه متناسب به دست بیاوریم. برای به دست آوردن این فرمول باز می گردیم به محاسبات فاصله اطمینان و ابتدا tse(┤) که نصف فاصله اطمینان یا دقت احتمالی است را d می نامیم. با توجه به فرمول انحراف استاندارد (se):

و از اینجا n به دست می آید: