یکشنبه , ۲۶ آبان ۱۳۹۸
صفحه اصلی » آمار » تحلیل آماری قسمت اول
تحلیل آماری
تحلیل آماری

تحلیل آماری قسمت اول

تلفنم زنگ زد. مشغول انجام یک تحلیل آماری برای یک شرکت خصوصی بودم و نمی خواستم تمرکزم بهم بریزد ولی ادامه یافتن زنگ تلفن، مجبورم کرد جواب دهم. خانمی آنطرف خط، خودش را معرفی کرد و گفت که از طریق یکی از شاگردانم در یکی از دوره های تحلیل آماری با من آشنا شده و خط ارتباطی مرا یافته. توضیح داد که مقاله ای از پایان نامه دکتریش برای یک ژورنال فرستاده و داوران بخش آماری آنرا زیر سئوال برده اند.

خواستم که برایم از طرح پژوهی بگوید. توضیح داد که دو گروه داشته یکی آزمایش و گروه دوم کنترل و برای تحلیل آماری از آزمون t-زوجی استفاده کرده است. همین حرف باعث شد که بگویم کارتان غلط بوده است و باید از تحلیل کوواریانس (ANCOVA) یا تحلیل واریانس دو عامله (Two-way ANOVA) باید استفاده می کردید.

کلی دلایل آورد که t-زوجی درست است و در مقالاتی این روش استفاده شده است. ولی نقشه پژوهش آنقدر واضح بود که من چند دلیل برای غلط بودن کار گفتم. در پاسخ گفت که داور نیز دقیقا همان دلایل را ذکر کرده است.

این مکالمه که منجر به تصحیح کار دانشجو و چاپ مقاله وی در ژورنالی با ایمپکت ۴ شد، مرا مجاب کرد تا در یک سلسله از مقالات بعضی معضلات تحلیل آماری را ذکر کنم.

تحلیل آماری چیست؟

اولین سئوالی که در ذهن یک دانشجوی مشغول به فصول سه و چهار پایان نامه مطرح است، اینستکه، تحلیل آماری چیست؟ در پاسخ به این سئوال خیلی ساده باید بگویم، تحلیل آماری روشی ریاضی برای جستجو در داده ها به امید یک کشف یا اثبات است.

تحلیل آماری با مشاهده روابط بین مجموعه های مختلف داده های بدست آمده در تحقیق انجام می شود. تحلیل آماری می تواند پیچیده باشد و من در این نوشتار سعی دارم مباحث پایه ای را – با این فرض که شما هیچ پیش زمینه ای ریاضی ندارید- توضیح دهم.

دو نوع آمار وجود دارد:

آمار توصیفی:

خلاصه های عددی نمونه ها (چیزی که در پژوهش مشاهده می کنیم)

آمار استنباطی:

از نمونه های گرفته شده از جامعه در مورد جامعه استنباط می کنیم (در جامعه چه می تواند یاشد یا مشاهده شود)

تعیین اینکه از کدام نوع آمار استفاده خواهیم کرد قبل از شروع به تجزیه و تحلیل مهم است.

چه زمانی باید از تحلیل آماری استفاده کنیم؟

همیشه ایده کلی در تجزیه و تحلیل آماری اینستکه داده ها طوری خلاصه کردن و تجزیه و تحلیل شوند که مفید واقع شده و به تصمیم گیری کمک کنند.  اگر قرار باشد داده ها را خلاصه و نمودارهای مناسب رسم کنیم، از آمار توصیفی استفاده می کنیم و اگر خواستیم رابطه ای را کشف و درک کنیم و بر اساس آن پیش بینی انجام دهیم، آمار استنباطی به کارمان می آید. استنباط آماری، از طریق طیف وسیعی از آزمون های آماری، می تواند راهی برای تعیین سطح اطمینان در نتیجه گیری ها و استنباط ها باشد.

تجزیه و تحلیل آماری تنها در صورتی باید مورد استفاده قرار گیرد که درک روشنی از دلایل انجام این کار وجود داشته باشد. استفاده از آزمون های آماری (همانطور که در بالا ذکر شده است) در صورتی یافته های ارزشمند ارائه می دهد که بدانیم چگونه به تفسیر نتایج و استفاده از آنها برای تحقیق بپردازیم.

در تحلیل آماری چه چیزهایی باید مورد توجه باشند؟

متغیرها (Variables)

متغیر هر ویژگی یا صفت (Characteristics or Attribute) قابل اندازه گیری در افراد یا اشیاء مختلف است. متغیرهای کمی بر روی مقیاس فاصله ای یا نسبتی اندازه گیری می شوند، در حالیکه متغیرهای کیفی در مقیاس اسمی و ترتیبی (توجه داشته باشید که در SPSS مقادیر فاصله ای و نسبتی با هم گروه بندی می شوند و مقیاس (scale) نامیده می شوند).

قبل از شروع تحلیل آماری باید نوع متغیرها کاملا مشخص و درک شود. اینکه متغیر وابسته است یا مستقل و یا متغیر کنترل، پیوسته است یا گسسته در انتخاب آزمون آماری مناسب نقش مهمی بازی می کنند.

متغیر مستقل به این سوال پاسخ می دهد که «چه چیزی در پژوهش تغییر می کند؟».

از طرف دیگر، متغیر وابسته به این سوال پاسخ می دهد که «چه چیزی را در پژوهش مشاهده یا اندازه گیری می کنیم؟» و متغیر کنترل پاسخ به این سوال است که «چه چیزی را می توانم بین گروههای آزمایش یا مشاهده ثابت نگهداریم؟».

متغیری که می تواند هر عددی را داشته باشد یک متغیر پیوسته (مثلا زمان) نامیده می شود. متغیری که تنها می تواند اعداد کامل (عدد صحیح) را داشته باشد، یک متغیر گسسته نامیده می شود (به عنوان مثال تعداد افراد در یک گروه).

در تحلیل آماری مهم است متغیری که برای تجزیه و تحلیل داده ها در بسته های آماری مانند SPSS داریم را بطور کامل درک کنیم.

برای مطالعه بیشتر مقاله من در سایت دیجی درس ممکن است کمک کننده باشد.

استنباط (Inference)

اگر بخواهیم در تحلیل آماری با آمار استنباطی کار کنیم، ابتدا باید درک درستی از جامعه آماری (مجموعه افراد، اقلام، یا داده ها) و نمونه (زیر مجموعه ای از عناصر گرفته شده از یک جامعه) داشته باشیم.

ما استنباط ها (نتیجه گیری ها) در مورد یک جامعه را بر اساس نمونه گرفته شده از آن انجام می دهیم، به همین دلیل است که باید درک درستی از جامعه و نمونه گیری از آن باید وجود داشته باشد. هر خطایی در تعریف و درک جامعه آماری و نمونه گیری انجام شده، بر استنباطی (نتیجه گیری) که در نهایت بدست خواهیم آورد، تاثیر می گذارد.

دقت کنید که اگر تمام جامعه را مورد بررسی قرار دهیم، استنباط آماری از نمونه بی معنی خواهد بود.

اطمینان و معنی داری

  • فاصله اطمینان یک بازه برآورد شده برای یکی از پارامترهای جامعه است، که بصورت بعلاوه و منها گزارش داده می شود. به عنوان مثال، فرض کنید در یک نظرسنجی در مورد انتخاب روزنامه یا تلویزیون برای آگاهی از اخبار ۵۴ درصد افراد با یک فاصله اطمینان ۴ درصدی تلویزیون را انتخاب کرده اند. بر اساس این فاصله اطمینان می توانید مطمئن باشید که اگر از کل جامعه نظرشان را بپرسید بین ۵۰ تا ۵۸ درصد تلویزیون را انتخاب می کنند. سه عامل تعیین کننده اندازه فاصله اطمینان برای یک سطح اطمینان داده شده است: اندازه نمونه، درصد و اندازه جامعه.
  • سطح اطمینان به شما می گوید که چطور مطمئن شوید که استنتاجی که انجام داده اید، درست است. بسیاری از محققان علوم اجتماعی از سطح اطمینان ۹۵٪ استفاده می کنند که بدین معنی است که می توانید ۹۵٪ مطمئن باشید که نتایجی که بدست آورده اید، صحیح است؛ در حالی که سطح اطمینان ۹۹٪ به این معنی است که می توانید ۹۹٪ از صحت نتایج اطمینان داشته باشید. برای مثال، در مثالی که بالا ذکر کردم، وقتی که سطح اطمینان و فاصله اطمینان را با هم ادغام کنیم، می توان گفت که ۹۵٪ اطمینان داریم که بین ۵۰ تا ۵۸ درصد افراد تلویزیون را انتخاب می کنند.

در آمار، یک نتیجه بدست آمده در صورتی از نظر آماری معنی دار می شود اگر  به احتمال زیاد رخ خواهد داد. در آمار، “معنی داری” به معنای احتمالا درست است.

فاکتورهای موثر در فاصله اطمینان

همانطور که قبلا گفتم، در تحلیل آماری فاصله اطمینان تحت تاثیر سه فاکتور است: اندازه نمونه، درصد اطمینان و اندازه جامعه.

در ادامه می خواهم به تحلیل هر کدام از این فاکتورها بپردازم.

اندازه تمونه

هر قدر نمونه بزرگتری از جامعه انتخاب کنیم، با اطمینان بیشتری می توانیم ادعا کنیم نتایج بدست آمده از نمونه، وضعیت جامعه آماری اصلی را منعکس می کند.

نکته ای که باید توجه کنیم اینستکه رابطه بین فاصله اطمینان و اندازه نمونه خطی نیست. این نکته به این معنی است که با افزایش حجم نمونه، فاصله با نسبت ثابتی دقیق تر می شود و افزایش نمونه بصورت مقادیر کم، دقت را افزایش می دهد.

درصد اطمینان

فاصله اطمینان، درصدی از نمونه را که پاسخ مشابهی را ارائه می دهد، تعیین می کند. با افزایش درصد اطمینان فاصله اطمینان افزایش می یابد. افزایش فاصله اطمینان، خطای نوع اول یا همان آلفا را کم می کند.

حجم جامعه

اندازه یا حجم جامعه به تعداد افراد در گروهی اشاره دارد که ویژگی مشابهی دارند مثلا دختران هفت ساله تهرانی یا واشرهای ۵ میلی متری تولیدی در خط تولید یک کارخانه یا مثلا مجموعه افرادی که در یک شهر زندگی می کنند و یا تعداد افرادی که ویژگی خاصی دارند مانند رنج کشیدن از معلولیت یا ساکنین یک گروه خاص قومی. اندازه یک جامعه بخصوص وقتی تعداد نسبتا کمی در آن عضو هستند، بسیار مهم است.

درباره‌ افشین صفایی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *