آزمون H کروسکال-والیس با استفاده از SPSS
مقدمه
آزمون H کروسکال-والیس (H Kruskal-Wallis) که گاهی به آن ANOVA یک طرفه در رتبه ها (one-way ANOVA on ranks) نیز می گویند، یک آزمون ناپارامتریک مبتنی بر رتبه است که می تواند برای تعیین وجود یا نبود تفاوت های آماری معنی داری بین دو یا چند گروه از یک متغیر مستقل روی یک متغیر وابسته پیوسته یا ترتیبی استفاده شود. این آزمون جایگزین ناپارامتری برای ANOVA یک طرفه و بسط آزمون یو من ویتنی (Mann-Whitney U) برای مقایسه بیش از دو گروه مستقل در نظر گرفته می شود.
برای مثال، میتوانید از آزمون H کروسکال-والیس استفاده کنید تا بفهمید که آیا نمره امتحان، که در مقیاس پیوسته از 0 تا 20 اندازهگیری میشود، بر اساس میزان اضطراب امتحان متفاوت است یا نه. در این مثال متغیر وابسته «نمره امتحان» و متغیر مستقل “سطح اضطراب امتحان” خواهد بود که دارای سه گروه مستقل دانش آموزان با میزان اضطراب امتحان “کم”، “متوسط” و “بالا است.
توجه: اگر میخواهید ماهیت ترتیبی یک متغیر مستقل را در نظر بگیرید و یک فرضیه جایگزین مرتب داشته باشید، میتوانید به جای آزمون H کروسکال-والیس یک آزمون Jonckheere-Terpstra (جانكهير ترپسترا) را اجرا کنید.
توجه به این نکته مهم است که آزمون H کروسکال-والیس یک آمار آزمون همه جانبه است و نمی تواند به شما بگوید که کدام گروه های خاص از متغیر مستقل شما از نظر آماری به طور قابل توجهی با یکدیگر متفاوت هستند. فقط به شما می گوید که حداقل دو گروه متفاوت دارید. وقتی سه، چهار، پنج یا چند گروه در طرح مطالعه خود داشته باشید، تعیین اینکه کدام یک از این گروه ها با یکدیگر متفاوت هستند، مهم می باشد. شما می توانید این کار را با استفاده از یک آزمون تعقیبی (post hoc test) انجام دهید.
این آموزش به شما نشان میدهد که چگونه یک آزمون H کروسکال-والیس را با استفاده از SPSS انجام دهید، و در نهایت نتایج این آزمون را تفسیر و گزارش کنید. با این حال، قبل از اینکه شما را با این روش آشنا کنیم، باید فرضیات مختلفی را که دادههای شما باید برآورده کنند تا آزمون H کروسکال-والیس به شما یک نتیجه معتبر بدهد، بدانید. در ادامه به این فرضیات می پردازیم.
فرضیات
هنگامی که تصمیم میگیرید دادههای خود را با استفاده از آزمون H کروسکال-والیس آنالیز کنید، ابتدا باید مطمئن شوید که داده های شما واقعاً با استفاده از این قابل آنالیز می باشند. شما باید این کار را انجام دهید. زیرا استفاده از آزمون H کروسکال-والیس تنها در صورتی مناسب است که داده های شما از چهار فرض لازم برای آزمون H کروسکال-والیس عبور کنند تا یک نتیجه معتبر به شما بدهد. در عمل، بررسی این چهار فرض کمی زمان بر خواهد بود. ولی در کل، کار سختی نیست.
فرض شماره 1:
متغیر وابسته شما باید در مقیاس ترتیبی (ordinal) یا یک مقیاس پیوسته (continuous) (یعنی مقیاس فاصله ای (interval) یا نسبتی (ratio)) اندازه گیری شود. نمونهای از متغیرهای ترتیبی عبارتند از مقیاس لیکرت (مثلاً مقیاس ۷ درجهای از «کاملاً موافقم» تا «کاملاً مخالفم») می باشد. نمونههایی از متغیرهای پیوسته عبارتند از قد، دما، حقوق و دستمزد ، زمان، هوش، نمره، و غیره می باشد.
فرض شماره 2:
متغیر مستقل شما باید شامل دو یا چند گروه طبقه ای (categorical) و مستقل (غیر مرتبط) باشد. معمولا، آزمون H کروسکال-والیس زمانی استفاده میشود که شما سه یا چند گروه طبقه ای و مستقل داشته باشید، اما میتوان از آن فقط برای دو گروه استفاده کرد (به عنوان مثال، آزمون یو من ویتنی معمولا برای دو گروه استفاده می شود). نمونه متغیرهای مستقلی که این معیار را برآورده می کنند شامل قومیت (به عنوان مثال، سه گروه: قفقازی، آفریقایی آمریکایی و اسپانیایی)، سطح فعالیت بدنی (به عنوان مثال، چهار گروه: کم تحرک، کم، متوسط و بالا)، حرفه (به عنوان مثال، پنج گروه: جراح، پزشک، پرستار، دندانپزشک، درمانگر) و غیره.
فرض شماره 3:
مشاهدات شما باید استقلال داشته باشند. به این معنی که هیچ رابطه ای بین مشاهدات در هر گروه یا بین خود گروه ها وجود ندارد. برای مثال، باید در هر گروه شرکتکنندگان متفاوتی وجود داشته باشد و هیچ شرکتکنندهای در بیش از یک گروه نباشد. این بیشتر یک موضوع طراحی مطالعه است تا چیزی که بتوانید آن را آزمایش کنید، اما این یک فرض مهم برای آزمون H کروسکال-والیس است. اگر مطالعه شما با این فرض ناکام باشد، احتمالاً «گروههای مرتبط» (related groups) دارید. باید از آزمون آماری دیگری (مثلاً آزمون فریدمن Friedman) به جای آزمون H کروسکال-والیس استفاده کنید.
از آنجایی که آزمون H کروسکال-والیس نرمال بودن دادهها را در نظر نمیگیرد و حساسیت کمتری به موارد پرت (outliers) دارد، میتوان زمانی از آن استفاده کرد که این فرضیه نرمال بودن (نرمالیته) نقض شده باشند و استفاده از ANOVA یک طرفه نامناسب باشد. علاوه بر این، اگر داده های شما ترتیبی است، ANOVA یک طرفه نامناسب است، اما آزمون H کروسکال-والیس اینطور نیست. با این حال، آزمون H Kruskal-Wallis لزوماً عاری از فرضیات نیست. زیرا نتیجهگیری شما به توزیع دادهها بستگی دارد که در فرض شماره 4 مورد بحث قرار می گیرد:
فرض شماره 4:
برای اینکه بدانید چگونه نتایج آزمون H کروسکال-والیس را تفسیر کنید، باید تعیین کنید که آیا توزیع ها در هر گروه (یعنی توزیع امتیازات برای هر گروه از متغیر مستقل) شکل یکسانی دارند یا خیر. که به تغییرپذیری مشابه (same variability) نیز هست. برای درک این مطلب به نمودار زیر نگاه کنید:
در نمودار سمت چپ بالا، توزیع مقادیر برای گروه های “قفقازی” (Caucasian)، “آفریقایی آمریکایی” (African American) و “اسپانیایی” (Hispanic) به یک شکل است. از سوی دیگر، در نمودار سمت راست بالا، توزیع مقادیر برای هر گروه یکسان نیست. یعنی اشکال و متغیرهای متفاوتی دارند.
اگر توزیعهای شما شکل یکسانی دارند، میتوانید از SPSS برای انجام آزمون H کروسکال-والیس برای مقایسه میانههای متغیر وابسته خود (به عنوان مثال، “امتیاز تعامل” (engagement score)) برای گروههای مختلف متغیر مستقل مورد علاقه خود استفاده کنید. (به عنوان مثال، گروه های قفقازی، آفریقایی آمریکایی و اسپانیایی، برای متغیر مستقل، “قومیت”). با این حال، اگر توزیعهای شما شکل متفاوتی دارند، فقط میتوانید از آزمون H کروسکال-والیس برای مقایسه میانگین رتبهها استفاده کنید. داشتن توزیع های مشابه به سادگی به شما امکان می دهد از میانه ها برای نشان دادن تغییر مکان بین گروه ها استفاده کنید (همانطور که در نمودار سمت چپ بالا نشان داده شده است
شما می توانید فرض شماره 4 را با استفاده از SPSS بررسی کنید. همچنین فرضیات #1، #2 و #3 نیز باید بررسی شوند. به این ترتیب، بررسی این فرض ها بسیار مهم است وگرنه ممکن است نتایج خود را اشتباه تفسیر کنید.
در بخش بعدی ما روش SPSS را برای انجام یک آزمون H کروسکال-والیس با فرض اینکه توزیع های شما یک شکل نیستند و باید رتبه های میانگین را به جای میانه ها تفسیر کنید، نشان می دهیم. ابتدا، مثالی را که برای توضیح روش آزمون H کروسکال-والیس در SPSS استفاده کرده ایم، را بیان می کنیم.
مثال
یک محقق پزشکی شواهدی را از این که برخی از داروهای ضد افسردگی میتوانند اثرات جانبی مثبتی برای کاهش درد افراد مبتلا به کمردرد مزمن داشته باشند، شنیده است. البته در صورتی که دارو در دوزهای کمتر از تجویز شده برای افسردگی تجویز شوند. محقق پ مایل است این شواهد را با یک مطالعه بررسی کند. محقق 3 داروی معروف ضد افسردگی را که ممکن است این عارضه جانبی مثبت را داشته باشند شناسایی کرد و آنها را داروی A، داروی B و داروی C نامگذاری کرد. سپس محقق گروهی متشکل از 60 نفر با سطح مشابهی از کمردرد را به طور تصادفی انتخاب کرد. آنها را به یکی از سه گروه – گروه های درمانی داروی A، داروی B و یا داروی C اختصاص داد. داروی مربوطه برای یک دوره 4 هفته ای برای این 60 نفر تجویز شد. در پایان دوره 4 هفته ای، محقق از شرکت کنندگان خواست که کمردرد خود را در مقیاس 1 تا 10 ارزیابی کنند که 10 نشان دهنده بیشترین میزان درد است. محقق می خواهد میزان درد تجربه شده توسط گروه های مختلف را در پایان دوره درمان دارویی مقایسه کند. بنابراین آزمون H کروسکال-والیس را برای مقایسه اجرا کرد. در آن متغیر وابسته (Pain_Score) بین سه درمان دارویی و متغیر مستقل Drug_Treatment_Group نوع دارویی با بیش از دو گروه است.
روش آزمون در SPSS
9 مرحله زیر به شما نشان می دهد که چگونه داده های خود را با استفاده از آزمون H کروسکال-والیس در SPSS آنالیز کنید. در پایان این هشت مرحله، ما به شما نشان میدهیم که چگونه نتایج آزمون کروسکال-والیس را تفسیر کنید.
نکته: SPSS دارای دو روش مختلف است که می توان از آنها برای اجرای آزمون H کروسکال-والیس استفاده کرد: (1) روش Legacy Dialogs > K Independent Samples و (2) روش Nonparametric Tests > Independent Samples . روش ای که در زیر ارائه می کنیم، روش Legacy Dialogs > K Independent Samples است. زیرا این روش در ورژن های مختلف SPSS قابل اجرا است. با این حال، یکی از معایب این روش این است که به طور خودکار آزمون های post hoc را اجرا نمی کند.
مرحله (1)
همانطور که در زیر نشان داده شده است، روی
Analyze > Nonparametric Tests > Legacy Dialogs > K Independent Samples…
در منوی اصلی کلیک کنید:
همانطور که در زیر نشان داده شده است، پنجره ی “Tests for Several Independent Samples” نمایش داده می شود:
نکته: باید چک باکس Kruskal-Wallis H در ناحیه –Test Type–به طور پیش فرض انتخاب شود، اما اگر اینطور نیست، حتما این گزینه را علامت بزنید. این گزینه به SPSS دستور می دهد تا آزمون H کروسکال-والیس را روی متغیرهایی که قرار است در مرحله بعدی این روش انتقال دهید، اجرا کند.
مرحله (2)
با استفاده از دکمه فلش راست مناسب متغیر وابسته Pain_Score را به کادر Test Variable List و متغیر مستقل Drug_Treatment_Group را به کادر Grouping Variable منتقل کنید. در نهایت با صفحهای مشابه تصویر زیر مواجه خواهید شد:
توجه: اگر دکمه Define range فعال نیست (یعنی به حالت غیر فعال باشد)، مطمئن شوید که متغیر Drug_Treatment_Group با کلیک بر روی آن با رنگ زرد برجسته شده است. با این کار دکمه فعال می شود.
مرحله (3)
بر روی دکمه Define range کلیک کنید. همانطور که در زیر نشان داده شده است، پنجره ی ” Several Independent Samples: Define Range” نمایش داده می شود:
مرحله (4)
عدد”1″ را در کادر Minimum و عدد “3” را در کادر Maximum وارد کنید. این مقادیر نشاندهنده محدوده کدهایی است که شما به گروههای متغیر مستقل، Drug_Treatment_Group دادهاید. به عنوان مثال، داروی A با “1” و داروی C با “3” کد گذاری شده بودند. در نهایت با یک صفحه نمایش مشابه زیر روبرو خواهید شد:
توجه: اگر چهار گروه داشتید (مثلاً داروی A تا داروی D) و فقط می خواستید داروی B را از طریق داروی D آنالیز کنید، می توانید به ترتیب “2” و “4” را در کادرهای Minimum و Maximum وارد کنید (با فرض اینکه شما گروه ها را به صورت عددی سفارش کرده اید)
مرحله (5)
بر روی دکمه Continue کلیک کنید و به پنجره ی “Tests for Several Independent Samples” باز خواهید گشت، اما اکنون با کادر تکمیل شده Grouping Variable همانطور که در زیر مشخص شده است:
مرحله (6)
بر روی دکمه Options کلیک کنید. همانطور که در زیر نشان داده شده است، پنجره ی ” Several Independent Samples: Options” نمایش داده می شود:
مرحله (7)
اگر مشخصات توصیفی میخواهید، چک باکس Descriptive را انتخاب کنید و اگر میانهها و چارکها را میخواهید، چک باکس Quartiles را انتخاب کنید. اگر فقط گزینه Descriptives را انتخاب کرده باشید، با صفحه زیر روبرو خواهید شد:
مرحله (8)
بر روی دکمه Continue کلیک کنید. شما به پنجره ی ” Tests for Several Independent Samples” بازگردانده می شوید.
مرحله (9)
بر روی دکمه OK کلیک کنید تا خروجی تولید گردد.
خروجی SPSS برای آزمون H کروسکال-والیس
خروجی زیر به شما نمایش داده می شود (با فرض اینکه چک باکس Descriptive را در پنجره ی ” Several Independent” انتخاب نکرده اید):
میانگین رتبه (یعنی ستون “Mean Rank” در جدول Ranks) Pain_Score (میزان درد) برای هر گروه درمانی دارویی می تواند برای مقایسه اثر درمان های دارویی مختلف استفاده شود. این که آیا این گروههای درمان دارویی دارای میزان درد متفاوتی هستند یا خیر، را میتوان با استفاده از جدول Test Statistics (آمار آزمون) که نتیجه آزمون H کروسکال-والیس را ارائه میکند، ارزیابی کرد. یعنی آمار مجذور کای (ردیف “Chi-Square”)، درجات آزادی (ردیف “df”) آزمون و اهمیت آماری آزمون (ردیف “Asymp. Sig.”).
گزارش خروجی آزمون H کروسکال-والیس
با استفاده از داده های دو جدول بالا، می توانید نتیجه را به صورت زیر گزارش کنید:
آزمون H کروسکال-والیس نشان داد که تفاوت آماری معنیداری در میزان درد احساس شده بین درمانهای دارویی مختلف با میانگین میزان درد 35.33 برای داروی A، 34.83 برای داروی B و 21.35 برای داروی C وجود دارد.
χ2(2) = 8.520, p = 0.014
مطالب زیر را هم از دست ندهید
آزمون H کروسکال-والیس (H Kruskal-Wallis) با استفاده از Stata
گامای گودمن و کروسکال (Goodman and Kruskal’s gamma) با استفاده از SPSS
ANOVA مخلوط با استفاده از SPSS Statistics
ANOVA اندازه گیری های مکرر دو طرفه با استفاده از SPSS Statistics
ANOVA دو طرفه در SPSS Statistics
ANOVA با اندازه گیری های مکرر با استفاده از SPSS Statistics
آزمون نرمال بودن با استفاده از SPSS Statistics
ANCOVA یک طرفه در SPSS Statistics
MANOVA یک طرفه با استفاده از Stata
Afshin Safaee (@afshinsafaee.official)