آزمون t نمونه تکی با استفاده از SPSS Statistics
مقدمه
از آزمون t نمونه تکی (one-sample t-test) برای تعیین اینکه “آیا یک نمونه از جامعه ای با میانگین خاص آمده است یا خیر” استفاده می شود. این میانگین جمعیت همیشه شناخته نشده است، اما گاهی فرضیه می شود. به عنوان مثال، شما می خواهید نشان دهید که یک روش آموزشی جدید برای دانش آموزانی که برای یادگیری گرامر انگلیسی تلاش می کنند می تواند مهارت های گرامر آنها را به میانگین ملی ارتقا دهد. نمونه شما دانش آموزانی هستند که روش تدریس جدید را دریافت کرده اند و میانگین جمعیت شما میانگین نمره ملی خواهد بود. متناوبا، شما معتقدید که پزشکانی که در بخشهای حوادث و اورژانس (A & E) کار میکنند، علیرغم خطرات (مثلاً خستگی) کار در چنین ساعات طولانی، 100 ساعت در هفته کار میکنند.
این آموزش به شما نشان می دهد که چگونه یک آزمون t نمونه تکی را با استفاده از SPSS Statistics انجام دهید، و همچنین نتایج این آزمون را تفسیر و گزارش کنید. با این حال، قبل از اینکه شما را با این روش آشنا کنیم، باید فرضیات مختلفی را که داده های شما باید رعایت کنند تا یک آزمون t نمونه تکی به شما نتیجه معتبری بدهد، بدانید. در ادامه به این فرضیات می پردازیم.
فرضیات
هنگامی که تصمیم می گیرید داده های خود را با استفاده از آزمون t نمونه تکی تجزیه و تحلیل کنید، ابتدا باید مطمئن شوید که داده هایی که می خواهید تجزیه و تحلیل کنید واقعاً می توانند با استفاده از آزمون t نمونه تکی تجزیه و تحلیل شوند یا نه؟. شما باید این کار را انجام دهید زیرا استفاده از آزمون t نمونه تکی تنها در صورتی مناسب است که داده های شما از چهار فرض پیروی کند. در عمل، بررسی این چهار فرض فقط کمی زمان بیشتری به تجزیه و تحلیل شما میافزاید و باعث می شود کمی بیشتر در مورد دادههای خود فکر کنید، اما کار سختی نیست.
قبل از اینکه شما را با این چهار فرض آشنا کنیم، اگر هنگام تجزیه و تحلیل داده های خود با استفاده از SPSS Statistics، یک یا چند مورد از این فرضیات نقض شد (یعنی برآورده نشد) تعجب نکنید. زمانی که با داده های واقعی کار می کنید، این اتفاق کاملا نرمال است. با این حال، نگران نباشید. حتی زمانی که داده های شما برخی از فرضیات را با شکست مواجه می کند، اغلب راه حلی برای غلبه بر آن وجود دارد. ابتدا اجازه دهید به این چهار فرض نگاهی بیندازیم:
فرض شماره 1:
متغیر وابسته شما باید در سطح فاصله ای (interval) یا نسبتی (ratio) (یعنی پیوسته) اندازه گیری شود. مثال هایی از متغیرهایی که این معیار را برآورده می کنند عبارتند از: زمان مرور درسی (اندازه گیری شده بر حسب ساعت)، هوش (اندازه گیری شده با استفاده از نمره IQ)، نمره امتحان (اندازه گیری از 0 تا 20)، وزن (اندازه گیری شده بر حسب کیلوگرم) و غیره.
فرض شماره 2:
داده ها مستقل هستند (یعنی همبستگی ندارند)، به این معنی که هیچ رابطه ای بین مشاهدات وجود ندارد. این یک فرض مهم برای آزمون t نمونه تکی است. با این حال بیشتر یک موضوع طراحی مطالعه است تا چیزی که بتوانید آن را آزمایش کنید.
فرض شماره 3:
نباید نقاط پرت قابل توجهی وجود داشته باشد. نقاط پرت، نقاط دادهای در دادههای شما هستند که از الگوی معمول پیروی نمیکنند. مشکل پرت ها این است که می توانند روی آزمون t نمونه تکی تأثیر منفی بگذارند و دقت نتایج شما را کاهش دهند. خوشبختانه، هنگام استفاده از SPSS Statistics برای اجرای یک آزمون t نمونه تکی روی داده های خود، می توانید به راحتی نقاط پرت احتمالی را تشخیص دهید.
فرض شماره 4:
متغیر وابسته شما باید تقریباً توزیع نرمال داشته باش.. ما در مورد آزمون t نمونه تکی صحبت می کنیم که فقط به داده های تقریباً نرمال نیاز دارد. شما می توانید نرمال بودن را با استفاده از تست نرمال Shapiro-Wilk که به راحتی برای استفاده از SPSS Statistics تست می شود، تست کنید.
با استفاده از SPSS Statistics می توانید فرضیات شماره 3 و 4 را بررسی کنید. قبل از انجام این کار، باید مطمئن شوید که داده های شما با فرضیات شماره 1 و 2 مطابقت دارند، اگرچه برای انجام این کار به SPSS Statistics نیاز ندارید. هنگامی که به فرضیات شماره 3 و 4 بررسی میکنید، پیشنهاد می کنیم آنها را با این ترتیب گفته شده در این آموزش، آزمایش کنید، زیرا نشان دهنده ترتیبی است که اگر نقض فرضی قابل تصحیح نباشد، دیگر نمی توانید از آزمون t نمونه تکی استفاده کنید. فقط به یاد داشته باشید که اگر آزمون های آماری را بر اساس این فرضیات به درستی اجرا نکنید، نتایجی که هنگام اجرای یک آزمون t نمونه تکی به دست می آورید ممکن است معتبر نباشند.
ابتدا، مثالی را که برای توضیح روش آزمون t نمونه تکی در SPSS Statistics استفاده می کنیم، بیان می کنیم.
مثال و ستاپ در SPSS Statistics
یک محقق در حال برنامه ریزی یک مطالعه مداخله روانشناختی است، اما قبل از هر کاری می خواهد سطح افسردگی شرکت کنندگانش را مشخص کند. او هر یک از شرکتکنندگان را بر روی یک شاخص افسردگی خاص آزمایش میکند، که در آن هرکسی که به نمره 4 دست مییابد سطح «نرمال» افسردگی دارد. نمرات کمتر از این شاخص نشان دهنده افسردگی کمتر و نمرات بالاتر از این شاخص نشان دهنده افسردگی بیشتر است. او 40 شرکت کننده را برای شرکت در این مطالعه استخدام کرده است. نمرات افسردگی در متغیر ثبت می شود. او میخواهد بداند که آیا نمونهاش نماینده جامعه نرمال است یا نه؟ (یعنی آیا آنها از نظر آماری تفاوت معنیداری با 4 دارند یا نه؟).
برای یک آزمون t نمونه تکی، تنها داده های یک متغیر برای ورود به SPSS Statistics وجود دارد: متغیر وابسته، ، که نمره افسردگی است.
روش تست در SPSS Statistics
روش 5 مرحله ای Compare Means > One-Sample T Test… زیر به شما نشان می دهد که چگونه داده های خود را با استفاده از آزمون t نمونه تکی در SPSS Statistics تجزیه و تحلیل کنید، البته در صورتی که چهار فرض گفته شده در بخش قبلی، نقض نشده باشند. در پایان این پنج مرحله، نحوه تفسیر نتایج این آزمون را به شما نشان می دهیم.
مرحله (1)
در منوی اصلی روی
Analyze > Compare Means > One-Sample T Test…
کلیک کنید:
همانطور که در زیر نشان داده شده است، پنجره One-Sample T Test نمایش داده می شود:
مرحله (2)
متغیر وابسته، ، را (با انتخاب آن (با کلیک بر روی آن) و سپس کلیک بر روی دکمه فلش راست )، به کادر Test Variable(s) منتقل کنید. با تغییر مقدار فعلی از “0” به “4”، میانگین جامعه را که نمونه را با آن مقایسه می کنید در کادر Test Value وارد کنید. (اندازههای اثر تخمینی) را انتخاب شده نگه دارید. در نهایت با صفحه زیر مواجه خواهید شد:
مرحله (3)
بر روی دکمه Options کلیک کنید. همانطور که در زیر نشان داده شده است، با کادر محاوره ای One-Sample T Test: Options روبرو خواهید شد:
برای این مثال، فاصله اطمینان 95 درصدی پیشفرض را حفظ کنید و گزینه Exclude cases analysis by analysis را در ناحیه Missing Values انتخاب کنید.
نکته 1: به طور پیش فرض، SPSS Statistics از فاصله اطمینان 95% استفاده می کند (که در SPSS Statistics به عنوان درصد فاصله اطمینان نامگذاری شده است). این معادل با اعلام اهمیت آماری در سطح p <.05 است. اگر میخواهید این را تغییر دهید، میتوانید هر مقدار را از 1 تا 99 وارد کنید. برای مثال، وارد کردن “99” در این کادر منجر به یک فاصله اطمینان 99٪ و برابر با اعلام اهمیت آماری در سطح p <.01 میشود. برای این مثال، فواصل اطمینان 95% پیش فرض را حفظ کنید.
نکته 2: اگر بیش از یک متغیر وابسته را آزمایش میکنید و مقادیر گمشدهای در دادههای خود دارید، باید به دقت فکر کنید که کدامیک از گزینه های Exclude case analysis by analysis یا Exclude cases listwise را در ناحیه – Missing Values – انتخاب کنید. انتخاب گزینه نادرست می تواند به این معنی باشد که SPSS Statistics داده هایی را که می خواهید در آن گنجانده شود از تجزیه و تحلیل شما حذف می کند.
مرحله (4)
بر روی دکمه Continue کلیک کنید. شما به پنجره One-Sample T Test بازگردانده می شوید.
مرحله (5)
برای تولید خروجی روی دکمه OK کلیک کنید.
تفسیر خروجی SPSS Statistics از آزمون t نمونه تکی
SPSS Statistics دو جدول اصلی خروجی را برای آزمون t نمونه تکی تولید می کند که حاوی تمام اطلاعاتی است که برای تفسیر نتایج آزمون t نمونه تکی نیاز دارید.
اگر داده های شما از فرض شماره 3 (یعنی هیچ نقطه پرت قابل توجهی وجود نداشت) و فرض شماره 4 (یعنی متغیر وابسته شما تقریباً به طور نرمال برای هر دسته از متغیر مستقل توزیع شده است) که قبلاً در بخش فرضیات توضیح دادیم، قبول شد. شما فقط باید این دو جدول اصلی را تفسیر کنید. با این حال، باید دادههای خود را برای این فرضیات آزمایش میکردید، و همچنین باید خروجی SPSS Statistics را که هنگام آزمایش برای آنها تولید شد، تفسیر کنید (به عنوان مثال، باید این موارد را تفسیر کنید: (الف) نمودارهای جعبهای (boxplots) که برای بررسی وجود نقاط پرت مهم استفاده کردید را تفسیر کنید. و (ب) خروجی SPSS Statistics برای تست نرمال بودن تست Shapiro-Wilk را نشان می دهد).
به یاد داشته باشید که اگر دادههای شما با هر یک از این فرضیات شکست بخورد، جداول خروجیای که از روش آزمون t نمونه تکی ای (یعنی جداولی که در زیر بحث میکنیم) به دست میآورید را باید متفاوت تفسیر کنید.
با این حال، در این آموزش با فرض اینکه دادههای شما تمام فرضیات مربوطه را برآورده میکنند، ما شما را به نوبه خود از طریق هر یک از دو جدول اصلی راهنمایی میکنیم:
آمار توصیفی (Descriptive statistics)
می توانید با استفاده از جدول One-Sample Statistics، که آمار توصیفی مربوطه را ارائه می دهد، تفسیر اولیه داده ها را انجام دهید:
رایج است آمار توصیفی خود را به جای استفاده از میانگین (ستون “Mean”) و انحراف استاندارد (ستون “Std. Deviation”) با خطای استاندارد میانگین (ستون “Std. Error Mean”) بیان کنید، اگرچه هر دو قابل قبول هستند. می توانید نتایج را با استفاده از انحراف معیار به صورت زیر گزارش کنید:
میانگین نمره افسردگی (0.74 ± 3.72) کمتر از نمره افسردگی «نرمال» جمعیت 4 بود.
با این حال، با اجرای یک آزمون t نمونه تکی، شما علاقه مند هستید که بدانید آیا نمونه ای که دارید (dep_score) از یک جامعه «نرمال» است (که میانگین آن 4.0 است).
آزمون t نمونه تکی
جدول One-Sample Test نتیجه آزمون t نمونه تکی را گزارش می کند. ردیف بالا مقدار جمعیت شناخته شده یا فرضی را نشان می دهد که شما داده های نمونه خود را با آن مقایسه می کنید، همانطور که در زیر مشخص شده است:
در این مثال، میتوانید مقدار نمره افسردگی «نرمال» «4» را که قبلاً وارد کردهاید، ببینید. اکنون باید به سه ستون اول جدول One-Sample Test مراجعه کنید، که اطلاعاتی در مورد اینکه آیا نمونه از جامعه ای با میانگین 4 است (یعنی میانگین ها از نظر آماری به طور قابل توجهی متفاوت هستند) را ارائه می دهد، همانطور که در زیر مشخص شده است:
با توجه به جدول، t-value مشاهده شده (ستون “t”)، درجات آزادی (“df”) و اهمیت آماری (p-value) (“Sig. (2-tailed)”) از آزمون t نمونه تکی قابل مشاهده است. در این مثال، p < 0.05 (p = 0.022) است. بنابراین می توان نتیجه گرفت که میانگین های جامعه از نظر آماری تفاوت معنی داری دارند. اگر p > 0.05، باشد، در این صورت تفاوت بین میانگین جامعه برآورد شده توسط نمونه و میانگین جامعه مقایسه از نظر آماری تفاوت معناداری نخواهد داشت.
توجه: اگر مقدار Sig. (2-tailed) 0.000 باشد، این در واقع به این معناست که p < 0.0005 است. این بدان معنا نیست که سطح معنی داری صفر باشد.
SPSS Statistics همچنین گزارش می دهد که t = -2.381 (ستون “t”) و 39 درجه آزادی (ستون “df”) وجود دارد. برای گزارش نتایج خود باید این مقادیر را بدانید که می توانید به صورت زیر انجام دهید:
نمره افسردگی از نظر آماری به طور معنیداری پایینتر از نمره افسردگی نرمال جمعیت است،
t(39) = -2.381, p = .022
تحلیل آخرین قسمت (یعنی t(39) = -2.381، p = 0.022) به شرح زیر است:
جدول 4.1: تفکیک بیانیه آماری آزمون t نمونه تکی.
معنی | قسمت | |
نشان می دهد که ما در حال مقایسه با یک توزیع t (t-test) هستیم. | t | 1 |
درجه آزادی را نشان می دهد که N – 1 است | (39) | 2 |
مقدار بدست آمده از آزمون t را نشان می دهد (t-value به دست آمده) | 2.381- | 3 |
در صورت صحت فرضیه صفر، احتمال به دست آوردن مقدار t مشاهده شده را نشان می دهد. | P=.022 | 4 |
همچنین می توانید معیارهای تفاوت بین دو میانگین جمعیت را در گزارش خود بگنجانید. این اطلاعات در ستونهای سمت راست جدول One-Sample Test ، همانطور که در زیر مشخص شده است، گنجانده شده است:
این بخش از جدول نشان می دهد که میانگین تفاوت (Mean Difference) در میانگین جمعیت 0.28- است و فاصله اطمینان 95٪ (95% CI) این تفاوت 0.51- تا 0.04- است. برای اندازه گیری های مورد استفاده، گزارش مقادیر به 2 رقم اعشار کافی خواهد بود. می توانید این نتایج را به صورت زیر بنویسید:
نمره افسردگی از نظر آماری به طور قابل توجهی با 0.28 (CI 95%، 0.04 تا 0.51) کمتر از نمره افسردگی نرمال 4.0، t(39)= -2.381,p = .022 بود.
اندازه های اثر استاندارد شده
پس از گزارش اندازه اثر غیراستاندارد، ممکن است یک اندازه اثر استاندارد شده (Standardised effect sizes) مانند Cohen’s d (1988) یا Hedges’ g (1981) را گزارش کنیم.
انواع مختلفی از اندازه اثر استاندارد وجود دارد. در SPSS Statistics ورژن های 18 تا 26، به طور خودکار اندازه اثر استاندارد شده را به عنوان بخشی از تجزیه و تحلیل t-test نمونه تکی تولید نمیکند. با این حال، محاسبه اندازه اثر استاندارد شده مانند Cohen’s d با استفاده از نتایج حاصل از تجزیه و تحلیل آزمون t یک نمونه آسان است. در SPSS Statistics ورژنهای 27 و 28، دو اندازه اثر استاندارد شده Cohen’s d و Hedges’ g بهطور خودکار تولید میشود، همانطور که در جدول اندازههای اثر یک نمونه در زیر نشان داده شده است:
گزارش خروجی SPSS Statistics از آزمون t نمونه تکی
می توانید یافته ها را بدون آزمون فرضیات به شرح زیر گزارش کنید:
میانگین نمره افسردگی (0.74 ± 3.73) کمتر از نمره افسردگی نرمال 4 بود که از نظر آماری تفاوت معنیدار 0.28 (95% فاصله اطمینان (CI)، 0.04 تا 0.51)، t(39) = -2.381، p = 0.022 بود.
با اضافه کردن اطلاعات مربوط به آزمون آماری که انجام داده اید، از جمله فرضیات، شما باید به شرح زیر گزارش کنید:
یک آزمون t نمونه تکی برای تعیین اینکه آیا نمره افسردگی در افراد متفاوت از نرمال است یا خیر اجرا شد که به عنوان نمره افسردگی 4.0 تعریف شد. همانطور که توسط آزمون Shapiro-Wilk ارزیابی شد (p> 0.05)، نمرات افسردگی به طور نرمال توزیع شد، و همانطور که با بازرسی از یک نمودارجعبه ای ارزیابی شد، هیچ نقطه پرت در داده ها وجود نداشت،. میانگین نمره افسردگی (0.74 ± 3.73) کمتر از نمره افسردگی نرمال 4 بود که از نظر آماری تفاوت معنیدار 0.28 (95% فاصله اطمینان (CI)، 0.04 تا 0.51)، t(39) = -2.381، p = 0.022 بود.
آزمون اهمیت فرضیه صفر (Null hypothesis significance testing)
می توانید نتیجه را با توجه به فرضیه صفر و جایگزین خود به صورت زیر بنویسید:
بین میانگین ها تفاوت آماری معنی داری وجود داشت (p < .05). بنابراین می توانیم فرض صفر را رد کرده و فرضیه جایگزین را بپذیریم.
عملی (Practical) در مقابل اهمیت آماری (statistical significance)
اگرچه تفاوت آماری معنیداری بین نمرات افسردگی در آزمودنیهای استخدام شده در مقایسه با نمره افسردگی عادی مشاهده شد. لزوماً به این معنی نیست که تفاوت مشاهده شده، 0.28 (95% CI، 0.04 تا 0.51)، کافی است تا عملاً معنی دار باشد. در واقع، محقق ممکن است بپذیرد که اگرچه تفاوت از نظر آماری معنیدار است (و این را گزارش میکند)، تفاوت آنقدر بزرگ نیست که عملاً معنیدار باشد (یعنی میتوان با افراد به صورت نرمال رفتار کرد).
مطالب زیر را هم از دست ندهید:
چگونه یک نمودار نقطهای متصل به هم در R ایجاد کنیم؟
چند پروژه برای مبتدیان علم داده
نحوه تعیین خودکار تعداد خوشه ها توسط قانون آرنج
هوش مصنوعی (AI) چیست؟ 3 چیز که باید بدانید
تجزیه و تحلیل آماری: تعریف، مثال
16 پاسخ