آزمون t مستقل (independent t-test) برای دو نمونه
مقدمه
آزمون t مستقل (independent t-test) که به آن آزمون t دو نمونه ای (two sample t-test)، آزمون t مستقل نمونه ها (independent-samples t-test) یا آزمون t استیودنت (student’s t-test) نیز گفته می شود، یک آزمون آماری استنباطی برای تعیین وجود یا نبود تفاوت معنی داری بین میانگین ها در دو گروه غیرمرتبط می باشد.
فرضیه های صفر (H0) و جایگزین (HA) برای آزمون t مستقل
فرضیه صفر برای آزمون t مستقل این است که میانگین جامعه از دو گروه غیرمرتبط (u1 و u2) با هم برابر است:
H0: u1 = u2
در بیشتر موارد، ما به دنبال این هستیم که آیا میتوانیم فرضیه صفر را رد کنیم و فرضیه جایگزین را بپذیریم. یعنی اینکه میانگینهای جمعیت برابر نیستند:
HA: u1 ≠ u2
برای انجام این کار، باید یک سطح معناداری (که آلفا نیز نامیده می شود) تعیین کنیم که به ما امکان می دهد فرضیه جایگزین را رد یا بپذیریم. نرمالاً این مقدار بر روی 0.05 تنظیم می شود.
برای اجرای آزمون تی مستقل به چه چیزهایی نیاز دارید؟
برای اجرای آزمون t مستقل به موارد زیر نیاز دارید:
(1) یک متغیر مستقل و طبقه ای (categorical) که دارای دو سطح/گروه است.
(2) یک متغیر وابسته پیوسته
گروه های غیر مرتبط (Unrelated groups)
گروههای غیرمرتبط که گروههای جفت نشده (unpaired) یا گروههای مستقل نیز نامیده میشوند، گروههایی هستند که موارد (مثلاً شرکتکنندگان) در هر گروه متفاوت است. اغلب ما تفاوت ها در افراد ( یا موارد) را بررسی می کنیم، به این معنی که هنگام مقایسه دو گروه، یک فرد در یک گروه نمی تواند عضو گروه دیگر نیز باشد و بالعکس. یک مثال می تواند جنسیت باشد – یک فرد باید به عنوان مرد یا زن طبقه بندی شود – نه هر دو!.
فرض نرمال بودن (normality) متغیر وابسته
آزمون t مستقل مستلزم آن است که متغیر وابسته تقریباً به طور نرمال در هر گروه توزیع شود.
نکته: از نظر فنی، این باقیمانده ها هستند که باید به طور نرمال توزیع شوند، اما برای یک آزمون t مستقل، هر دو نتیجه یکسانی به شما می دهند.
شما می توانید نرمالیته (نرمال بودن) را با استفاده از آزمون های مختلفی بررسی کنید، اما تست نرمال بودن Shapiro-Wilks یا یک روش گرافیکی، مانند Q-Q Plot، بسیار رایج است. شما می توانید این تست ها را با استفاده از SPSS اجرا کنید. با این حال، آزمون t به عنوان یک آزمون قوی با توجه به فرض نرمال بودن توصیف می شود. این بدان معنی است که مقداری انحراف از نرمال بودن تأثیر زیادی بر میزان خطای نوع I ندارد.
وقتی فرض نرمال بودن را نقض گردد چه باید کرد
اگر متوجه شدید که یکی یا هر دو داده های گروه شما تقریباً به طور نرمال توزیع نشده اند و اندازه گروه ها بسیار متفاوت است، دو گزینه دارید: (1) داده های خود را طوری تغییر دهید که داده ها به طور نرمال توزیع شوند (تبدیل داده ها Transforming Data) یا (2) آزمون من ویتنی U (Mann-Whitney U Test) را اجرا کنید که یک آزمون ناپارامتریک است که نیازی به فرض نرمال بودن ندارد.
فرض همگنی واریانس (homogeneity of variance)
آزمون t مستقل فرض میکند که واریانس دو گروهی که اندازهگیری میکنید در جامعه برابر هستند. اگر واریانس های شما نابرابر باشند، می تواند بر میزان خطای نوع I تأثیر بگذارد. فرض همگن بودن واریانس را می توانید با استفاده از آزمون برابری واریانس های Levene که در آمار SPSS هنگام اجرای روش آزمون t مستقل تولید می شود، بررسی کنید. اگر تست برابری واریانس های Levene را در آمار SPSS اجرا کرده باشید، نتیجه ای شبیه به زیر دریافت خواهید کرد:
این آزمون برای همگنی واریانس، یک آماره F و یک مقدار معنادار (p-value) ارائه می دهد. ما در درجه اول نگران مقدار معنی داری هستیم – اگر بزرگتر از 0.05 باشد (یعنی p > 0.05)، واریانس های گروهی ما می توانند برابر در نظر گرفته شوند. با این حال، اگر p <0.05، واریانس های نابرابر داریم و فرض همگنی واریانس ها نقض شده است.
غلبه بر نقض فرض همگنی واریانس
اگر آزمون لوون (Levene) برای برابری واریانس ها از نظر آماری معنی دار باشد، نشان می دهد که واریانس های گروهی در جامعه نابرابر هستند، شما می توانید این تخلف را با استفاده نکردن از تخمین تلفیقی (pooled estimate) برای عبارت خطا برای آمار t تصحیح کنید، ولی باید از تنظیم درجه آزادی با استفاده از روش Welch-Satterthwaite استفاده می کند. احتمالاً نام این تنظیمات را نشنیدهاید، زیرا SPSS این اطلاعات را پنهان میکند و به سادگی دو گزینه را بهعنوان Equal variances assumed «واریانسهای برابر فرض شده» و Equal variances not assumed «واریانسهای برابر فرض نشده» بدون بیان صریح آزمونهای اساسی مورد استفاده، نامگذاری میکند. با این حال، می توانید شواهد این آزمونها را به صورت زیر مشاهده کنید:
از نتیجه آزمون تساوی واریانس لوین می توان فرضیه صفر مبنی بر عدم وجود تفاوت در واریانس بین گروه ها را رد کرد و فرضیه جایگزین را مبنی بر وجود تفاوت آماری معنادار در واریانس بین گروه ها قبول کرد. در ستون پایانی شکل فوق مشهود است (Equal variances not assumed) که در آن شاهد کاهش مقدار آماره t و کاهش زیادی در درجات آزادی (df) هستیم. این اثر افزایش p-value بالاتر از سطح اهمیت بحرانی 0.05 دارد. بنابراین، در این مورد، فرضیه جایگزین را نمیپذیریم و میپذیریم که از نظر آماری تفاوت معناداری بین میانگینها وجود ندارد. اگر همگنی واریانس ها را آزمایش نمی کردیم، نتیجه گیری ما به این صورت نمی شد.
گزارش نتیجه یک آزمون t مستقل
هنگام گزارش نتیجه یک آزمون t مستقل، باید مقدار آماره t(t-statistic)، درجات آزادی (df) و مقدار معناداری آزمون (p-value) (significance value) را در نظر بگیرید. فرمت نتیجه آزمون عبارت است از:
t(df) = t-statistic, p = significance value
بنابراین، برای مثال بالا، می توانید نتیجه را به صورت زیر گزارش کنید:
t(7.001) = 2.233, p = 0.061
به طور کامل نتایج خود را گزارش کنید
برای درک کامل نتایج در هنگام اجرای یک آزمون t مستقل و به منظور ارائه اطلاعات کافی برای خوانندگان، باید نتیجه آزمون های نرمال بودن، آزمون برابری واریانس لوون، دو میانگین گروه و انحراف معیار، نتیجه واقعی آزمون t و جهت تفاوت (مثبت و یا منفی در صورت وجود) را در نظر بگیرید.. علاوه بر این، ممکن است بخواهید تفاوت بین گروه ها را به همراه یک فاصله اطمینان 95 درصد در نظر بگیرید. مثلا:
بررسی نمودارهای Q-Q نشان داد که غلظت کلسترول به طور نرمال برای هر دو گروه توزیع شده است و مطابق با آزمون Levene’s برای برابری واریانس ها، واریانس همگنی وجود داشت. بنابراین، آزمون t مستقل بر روی داده ها با فاصله اطمینان 95 درصد (CI) برای اختلاف میانگین اجرا شد. مشخص شد که پس از دو مداخله، غلظت کلسترول در گروه رژیم غذایی (52/0 ± 15/6 میلی مول در لیتر) (t(38) = 2.470, p = 0.018) به طور معنی داری بیشتر از گروه ورزش (38/0 ± 80/5 میلی مول در لیتر) (95% CI, 0.06 to 0.64) بود
مطالب زیر را هم از دست ندهید
آلفای کرونباخ (Cronbach’s alpha) با استفاده از Minitab
آلفای کرونباخ (α) (Cronbach’s alpha) با استفاده از SPSS
نحوه تبدیل داده ها (Transforming Data) در SPSS
کاپای کوهن (Cohen’s kappa (κ)) با استفاده از SPSS
ایجاد نمودار میله ای با استفاده از SPSS
رسم نمودار پراکندگی (نقطه ای) (Scatterplot) با استفاده از SPSS
ایجاد نمودار میله ای خوشه ای (Clustered Bar Chart) با استفاده از SPSS
آنالیز کوواریانس چند متغیره (MANCOVA) یک طرفه در SPSS
آزمون علامت (sign test) با استفاده از SPSS
همبستگی حاصلضرب-گشتاور پیرسون (Pearson’s Product-Moment Correlation) با استفاده از SPSS Statistics
همبستگی دو رشته ای نقطه ای (Point-Biserial Correlation) با استفاده از SPSS
ضریب همبستگی رتبهای اسپیرمن (Spearman rank-order correlation coefficient) با استفاده از SPSS
همبستگی جزئی (Partial Correlation) با استفاده از SPSS
گامای گودمن و کروسکال (Goodman and Kruskal’s gamma) با استفاده از SPSS
آزمون H کروسکال-والیس (H Kruskal-Wallis) با استفاده از Stata
MANOVA یک طرفه با استفاده از Stata
آنالیز اجزای اصلی (PCA) با استفاده از SPSS
آمار توصیفی (descriptive) و استنباطی (inferential)
آزمون مربع کای (Chi-Square) با استفاده از SPSS
آزمون یو من ویتنی (Mann-Whitney U) با استفاده از SPSS
آزمون مک نمار (McNemar’s test) با استفاده از SPSS
کتاب سنجی (Bibliometrics) و تفاوت آن با علم سنجی (Scientometrics) و اطلاع سنجی (Informetrics)
تعدیل کننده دو وضعیتی (Dichotomous Moderator) با استفاده از SPSS
ضریب همبستگی تاوی- بی کندال (Kendall’s Tau-b correlation coefficient) با استفاده از SPSS
آزمون Jonckheere-Terpstra (جانكهير ترپسترا) با استفاده از SPSS
آزمون رتبه علامتدار ویلکاکسون (Wilcoxon signed-rank test) با استفاده از SPSS
آزمون Q کوکران (Cochran’s Q) با استفاده از SPSS
دی سامرز (Somers’ d) با استفاده از SPSS
آزمون t وابسته با استفاده از SPSS Statistics
آزمون t وابسته برای نمونه های جفت شده
رگرسیون لجستیک چند جمله ای در SPSS
رگرسیون لجستیک دو جمله ای با استفاده از SPSS
رگرسیون پواسون با استفاده از SPSS
ایجاد متغیر های ساختگی در SPSS
رگرسیون لجستیک ترتیبی با استفاده از SPSS
رگرسیون چندگانه با استفاده از SPSS
رگرسیون خطی با استفاده از SPSS
ANOVA مخلوط با استفاده از SPSS Statistics
ANOVA اندازه گیری های مکرر دو طرفه با استفاده از SPSS Statistics
ANOVA دو طرفه در SPSS Statistics
ANOVA با اندازه گیری های مکرر با استفاده از SPSS Statistics
آزمون نرمال بودن با استفاده از SPSS Statistics
انواع متغیر و تحقیقات تجربی و غیر تجربی
ANCOVA یک طرفه در SPSS Statistics
شصت لغت پرتکرار آزمون زبان عمومی آزمون دکتری
آزمون t نمونه تکی با استفاده از SPSS Statistics
چگونه یک نمودار نقطهای متصل به هم در R ایجاد کنیم؟
چند پروژه برای مبتدیان علم داده
شمارش تعداد در یک بردار منطقی در R
جایگزینی اولین مقدار غیر مفقود در R
انتساب داده های گمشده (Imputation of missing data) در R
برای یادگیری پایتون چه کتابایی بخونیم
چگونه نتایج حاشیه خطا را تفسیر کنیم؟
تحلیل سئوال روش تحقیق آزمون دکتری
تفاوت بین یادگیری ماشین، علم داده، هوش مصنوعی، یادگیری عمیق و آمار
تجزیه و تحلیل آماری: تعریف، مثال
روایی نتیجه گیری آماری (SCV) چیست؟
برنامه کلاس های آنلاین آمار و روش تحقیق
نحوه تعیین خودکار تعداد خوشه ها توسط قانون آرنج
هوش مصنوعی (AI) چیست؟ 3 چیز که باید بدانید
آمار و روش تحقیق در آزمون کارشناسی ارشد و دکتری روانشناسی
چهار مهارت افراد قدرتمند برای دانشمندان داده
چگونه یک سئوال تحقیق خوب طراحی کنیم؟
علم داده راه حلی برای مشکلات تجاری
بهترین کتاب های علوم داده برای مبتدیان
آمار در مقایسه با یادگیری ماشینی در سیستم های بیولوژیک
گراندد تئوری ادغام سنت های رشته ای متفاوت
یک پاسخ