آمار توصیفی و استنباطی
هنگام تجزیه و تحلیل داده ها، می توان از آمار توصیفی و استنباطی (descriptive and inferential statistics) استفاده کرد. به عنوان مثال، با استفاده آمار توصیفی و استنباطی میتوان نمره های کسب شده توسط 100 دانش آموز برای یک درس، را آنالیز کرد. معمولا در بیشتر تحقیقاتی که بر روی گروههایی از افراد انجام میشود، از آمار توصیفی و استنباطی برای تجزیه و تحلیل نتایج و نتیجهگیری استفاده میکنید. پس آمار توصیفی و استنباطی چیست؟ و چه تفاوت هایی با هم دارند؟
آمار توصیفی (descriptive statistics)
آمار توصیفی اصطلاحی است که به تجزیه و تحلیل دادهها اطلاق میشود که به توصیف، نمایش یا خلاصه کردن دادهها به شیوهای معنیدار کمک میکند، بهطور مثال، ممکن است الگوهایی از دادهها پدیدار شوند. با این حال، آمار توصیفی به ما اجازه نمیدهد فراتر از دادههایی که تحلیل کردهایم نتیجهگیری کنیم یا در مورد فرضیههایی که ممکن است داشته باشیم به نتیجهای برسیم. با این حال آنها راهی ساده برای توصیف داده های ما هستند.
آمار توصیفی بسیار مهم است، زیرا اگر دادههای خام خود را به سادگی ارائه کنیم، تجسم آنچه که دادهها نشان میدهند، دشوار خواهد بود، به خصوص اگر تعداد زیادی از آنها وجود داشته باشد. بنابراین آمار توصیفی ما را قادر میسازد تا دادهها را به شیوهای معنادارتر ارائه کنیم، که امکان تفسیر سادهتر دادهها را فراهم میکند. همچنین ما علاقه مند به توزیع یا گسترش علائم هستیم. آمار توصیفی این امکان را به ما می دهد. نحوه توصیف صحیح داده ها از طریق آمار و نمودارها موضوع مهمی است. به طور معمول، دو نوع آمار کلی وجود دارد که برای توصیف داده ها استفاده می شود:
(1) معیارهای گرایش مرکزی (Measures of central tendency):
اینها روش هایی برای توصیف موقعیت مرکزی توزیع فراوانی برای گروهی از داده ها هستند. در این مورد، توزیع فراوانی صرفاً توزیع و الگوی نمرات کسب شده توسط 100 دانش آموز از کمترین به بالاترین است. ما می توانیم این موقعیت مرکزی را با استفاده از تعدادی آمار از جمله حالت (مُد)، میانه و میانگین توصیف کنیم.
(2) معیارهای گسترش (Measures of spread):
اینها روشهایی برای خلاصه کردن گروهی از دادهها با توصیف میزان پراکندگی مقادیر هستند. به عنوان مثال، میانگین نمره 100 دانش آموز ما ممکن است 14 از 20 باشد. با این حال، همه دانش آموزان نمره 14 را کسب نکرده اند. نمرات برخی پایین تر و برخی دیگر بالاتر از 14خواهند بود. معیارهای گسترش به ما کمک میکنند تا میزان پراکندگی این مقادیر را خلاصه کنیم. برای توصیف این پراکندگی، تعدادی آمار از جمله محدوده (range)، چارک ها (quartiles)، انحراف مطلق (absolute deviation)، واریانس (variance) و انحراف معیار (standard deviation) در دسترس ما است.
هنگامی که ما از آمار توصیفی استفاده می کنیم، بهتر است که گروه داده های خود را با استفاده از ترکیبی از توضیحات جدول بندی شده (به عنوان مثال، جداول)، توصیف گرافیکی (یعنی و نمودارها) و تفسیر آماری (یعنی بحث در مورد نتایج) خلاصه کنیم.
آمار توصیفی اطلاعاتی درباره گروه بلافصل ما از دادهها، ارائه میکند. به عنوان مثال، ما میتوانیم میانگین و انحراف معیار نمرات امتحانی 100 دانشآموز را محاسبه کنیم و این میتواند اطلاعات ارزشمندی در مورد این گروه نفره از 100 دانشآموز ارائه کند. به هر گروه از دادههایی مانند این مثال، که شامل تمام دادههایی است که به آنها علاقه دارید، جمعیت گفته میشود. یک جمعیت می تواند کوچک یا بزرگ باشد، البته تا زمانی که شامل تمام داده های مورد علاقه شما باشد. به عنوان مثال، اگر شما فقط به نمرات امتحانی 100 دانش آموز علاقه مند بودید، 100 دانش آموز نشان دهنده جمعیت شما خواهند بود. آمار توصیفی برای جمعیتها اعمال میشود و ویژگیهای جمعیتها، مانند میانگین یا انحراف معیار، پارامتر نامیده میشوند زیرا کل جمعیت را نشان میدهند (یعنی همه افراد مورد علاقه شما).
آمار استنباطی (inferential statistics)
آمار توصیفی اطلاعاتی درباره گروه بلافصل ما از دادهها، ارائه میکند. به عنوان مثال، ما میتوانیم میانگین و انحراف معیار نمرات امتحانی 100 دانشآموز را محاسبه کنیم و این میتواند اطلاعات ارزشمندی در مورد این گروه نفره از 100 دانشآموز ارائه کند. به هر گروه از دادههایی مانند این مثال، که شامل تمام دادههایی است که به آنها علاقه دارید، جمعیت گفته میشود. یک جمعیت می تواند کوچک یا بزرگ باشد، البته تا زمانی که شامل تمام داده های مورد علاقه شما باشد. به عنوان مثال، اگر شما فقط به نمرات امتحانی 100 دانش آموز علاقه مند بودید، 100 دانش آموز نشان دهنده جمعیت شما خواهند بود. آمار توصیفی برای جمعیتها اعمال میشود و ویژگیهای جمعیتها، مانند میانگین یا انحراف معیار، پارامتر نامیده میشوند زیرا کل جمعیت را نشان میدهند (یعنی همه افراد مورد علاقه شما).
با این حال، اغلب به کل جمعیتی که علاقه مند به بررسی آنها هستید دسترسی ندارید، بلکه فقط به تعداد محدودی داده دسترسی دارید. به عنوان مثال، ممکن است به نمرات امتحانی همه دانش آموزان در ایران علاقه مند باشید. اندازهگیری تمام نمرههای امتحانی همه دانشآموزان در کل بریتایران انیا امکانپذیر نیست، بنابراین شما باید نمونه کوچکتری از دانشآموزان را اندازهگیری کنید (به عنوان مثال، 100 دانشآموز)، که برای نشان دادن جمعیت بزرگتر همه دانشآموزان ایران استفاده میشود. در اینجا ویژگیهای نمونهها، مانند میانگین یا انحراف معیار، پارامتر نامیده نمیشوند، بلکه آمار نامیده میشوند. آمار استنباطی تکنیک هایی هستند که به ما امکان می دهند از این نمونه ها برای تعمیم جمعیت هایی که نمونه ها از آنها استخراج شده اند استفاده کنیم. بنابراین، مهم است که نمونه به طور دقیق جامعه را نشان دهد. فرآیند دستیابی به این امر نمونه گیری نامیده می شود. آمار استنباطی از این واقعیت ناشی می شود که نمونه گیری به طور طبیعی دارای خطای نمونه گیری است و بنابراین انتظار نمی رود که یک نمونه به طور کامل جامعه را نشان دهد. روش های آمار استنباطی عبارتند از (1) برآورد پارامتر(ها) و (2) آزمون فرضیه های آماری.
در ادامه به برخی از سوالات متداول در مورد آمار توصیفی و استنباطی، پاسخ هایی ارائه کرده ایم.
شباهت های آمار توصیفی و استنباطی چیست؟
آمار توصیفی و استنباطی هر دو بر یک مجموعه از داده ها تکیه دارند. آمار توصیفی صرفاً بر این مجموعه از داده ها متکی است، در حالی که آمار استنباطی نیز به این داده ها تکیه می کند تا در مورد یک جمعیت بزرگتر تعمیم یابد.
نقاط قوت استفاده از آمار توصیفی برای بررسی توزیع داده ها چیست؟
به غیر از وضوحی که آمار توصیفی می تواند حجم زیادی از داده ها را روشن کند، هیچ گونه ابهامی در مورد مقادیری که دریافت می کنید وجود ندارد (به جز خطای اندازه گیری و غیره).
محدودیت های آمار توصیفی چیست؟
آمار توصیفی به قدری محدود است که فقط به شما امکان می دهد در مورد افراد یا اشیایی که واقعاً اندازه گیری کرده اید جمع بندی کنید. شما نمی توانید از داده هایی که جمع آوری کرده اید برای تعمیم به افراد یا اشیاء دیگر استفاده کنید. به عنوان مثال، اگر شما دارویی را برای غلبه بر سرطان آزمایش کردید و در بیمارانتان مؤثر بود، نمیتوانید تنها با تکیه بر آمار توصیفی ادعا کنید که این دارو در سایر بیماران سرطانی مؤثر است. اما آمار استنباطی این فرصت را به شما میدهد.
محدودیت های آمار استنباطی چیست؟
دو محدودیت اصلی برای استفاده از آمار استنباطی وجود دارد. اولین و مهمترین محدودیتی که در همه آمار استنباطی وجود دارد، این است که شما دادههایی را درباره جمعیتی ارائه میکنید که به طور کامل اندازهگیری نکردهاید، و بنابراین، هرگز نمیتوانید کاملاً مطمئن باشید که مقادیر/آمارهایی که محاسبه میکنید درست هستند. به یاد داشته باشید، آمار استنباطی مبتنی بر مفهوم استفاده از مقادیر اندازه گیری شده در یک نمونه برای تخمین/استنتاج مقادیری است که در یک جامعه اندازه گیری می شود. همیشه درجه ای از عدم اطمینان در انجام این کار وجود خواهد داشت. محدودیت دوم با محدودیت اول مرتبط است. برخی از تستهای استنباطی، اما نه همه، از کاربر (به عنوان مثال، شما) میخواهد تا حدسهای آموزشی (educated guesses) (بر اساس تئوری) را برای اجرای تستهای استنباطی انجام دهند. باز هم در این روند ابهامی وجود خواهد داشت که بر قطعیت نتایج برخی آمار استنباطی تأثیر خواهد داشت.
مطالب زیر را هم از دست ندهید:
کتاب سنجی (Bibliometrics) و تفاوت آن با علم سنجی (Scientometrics) و اطلاع سنجی (Informetrics)
ایجاد متغیر های ساختگی در SPSS
انواع متغیر و تحقیقات تجربی و غیر تجربی
Afshin Safaee (@afshinsafaee.official)
7 پاسخ