آزمون یو من ویتنی (Mann-Whitney U) با استفاده از SPSS
مقدمه
آزمون یو من ویتنی (Mann-Whitney U) که به آزمون من ویتنی مشهور است، برای مقایسه تفاوتهای بین دو گروه مستقل استفاده میشود. البته زمانی که متغیر وابسته، از نوع ترتیبی یا پیوسته باشد و به طور نرمال توزیع نشود. برای مثال، میتوانید از آزمون من ویتنی استفاده کنید تا بفهمید که آیا حقوق، که در مقیاس پیوسته اندازهگیری میشود، بر اساس میزان تحصیلات متفاوت است یا نه؟. یعنی متغیر وابسته «حقوق» و متغیر مستقل « میزان تحصیلات» با دو گروه «لیسانس و زیر لیسانس» و «فوق لیسانس به بالا»است. آزمون من ویتنی اغلب جایگزین ناپارامتری برای آزمون t نمونههای مستقل در نظر گرفته می شود، اگرچه همیشه اینطور نیست.
برخلاف آزمون t نمونههای مستقل، آزمون من ویتنی به شما امکان میدهد بسته به فرضیاتی که در مورد توزیع دادههای خود میکنید، نتایج متفاوتی در مورد دادههای خود بگیرید. این نتیجهگیریها میتواند از بیان ساده این که آیا این دو جمعیت با یکدیگر تفاوت دارند تا تعیین اینکه آیا تفاوتهایی در میانهها بین گروهها وجود دارد، متغیر است. این نتیجهگیریهای متفاوت به شکل توزیع دادههای شما بستگی دارد که بعداً در مورد آن توضیح خواهیم داد.
در این آموزش، ما اصول اولیه آزمون من ویتنی را با استفاده از یکی از روشهای SPSS را هنگامی که فرض مهم این آزمون نقض میشود، به شما نشان میدهیم. قبل از اینکه نحوه انجام این کار را به شما نشان دهیم، فرضیات مختلفی را توضیح میدهیم که دادههای شما باید با آنها مطابقت داشته باشند تا آزمون من ویتنی نتیجه معتبری به شما بدهد. در ادامه به این فرضیات می پردازیم.
فرضیات
هنگامی که تصمیم می گیرید داده های خود را با استفاده از آزمون من ویتنی آنالیز کنید، باید ابتدا مطمئن شوید که داده های شما آیا واقعاً می توانند با استفاده از این آزمون آنالیز شوند یا نه؟. شما باید این کار را انجام دهید. زیرا استفاده از آزمون من ویتنی تنها در صورتی مناسب است که داده های شما از چهار فرضی که برای آزمون من ویتنی لازم است تا یک نتیجه معتبر به شما بدهد، «عبور کند». در عمل، بررسی این چهار فرض کمی زمان بر خواهد بود. ولی در کل کار سختی نیست.
فرض شماره 1:
متغیر وابسته شما باید در سطح ترتیبی یا پیوسته اندازه گیری شود. نمونهای از متغیر ترتیبی شامل موارد لیکرت (Likert items) (مثلاً مقیاس 7 درجهای از «کاملاً موافقم» تا «کاملاً مخالفم») می باشد. نمونههایی از متغیرهای پیوسته عبارتند از: زمان (اندازهگیری شده بر حسب ساعت)، هوش (اندازهگیری شده با استفاده از تست IQ)، نمره امتحان (اندازهگیری شده از 0 تا 20)، وزن (اندازهگیری شده بر حسب کیلوگرم)، و غیره.
فرض شماره 2:
متغیر مستقل شما باید از دو گروه طبقه ای (categorical) و مستقل تشکیل شده باشد. نمونه متغیرهای مستقلی که این معیار را برآورده می کنند شامل جنسیت (2 گروه: مرد یا زن)، وضعیت اشتغال (2 گروه: شاغل یا بیکار)، فرد سیگاری (2 گروه: بله یا خیر) و غیره است.
فرض شماره 3:
مشاهدات شما باید استقلال داشته باشند. این به این معنی است که هیچ رابطه ای بین مشاهدات در هر گروه یا بین خود گروه ها وجود ندارد. به عنوان مثال، باید در هر گروه شرکتکنندگان متفاوتی وجود داشته باشد و هیچ شرکتکنندهای در بیش از یک گروه نباشد. این بیشتر به موضوع طراحی مطالعه شما مربوط است تا چیزی که بتوانید آن را آزمون کنید، اما یک فرض مهم از آزمون من ویتنی است. اگر مطالعه شما این فرض را نقص کند، باید از آزمون آماری دیگری (مثلاً آزمون رتبه علامت دار ویلکاکسون (Wilcoxon signed-rank test)) به جای آزمون من ویتنی استفاده کنید.
فرض شماره 4:
زمانی که دو متغیر شما به طور نرمال توزیع نشده اند، می توان از آزمون من ویتنی استفاده کرد. با این حال، برای اینکه بدانید چگونه نتایج آزمون من ویتنی را تفسیر کنید، باید تعیین کنید که آیا دو توزیع شما (یعنی توزیع مقادیر برای هر دو گروه متغیر مستقل؛ به عنوان مثال، “مردان” و “” زنان برای متغیر مستقل، «جنسیت») شکل مشابهی دارند یا نه. برای درک این مطلب، به نمودار زیر نگاه کنید:
در دو نمودار بالا، توزیع مقادیر برای “مرد” و “زن” دقیقا شکل یکسانی دارند. در نمودار سمت چپ، نمی توانید توزیع مقادیر را برای “مردان” ببینید (توزیع رنگ آبی در نمودار سمت چپ دیده نمی شود و پشت نمودار قرمز افتاده است) زیرا دو توزیع کاملا یکسان (identical) هستند. با این حال، در نمودار سمت راست، حتی اگر هر دو توزیع شکل مشابه (same shape) دارند، اما مکان متفاوتی (different location) دارند. یعنی توزیع مقادیر زنان (قرمز) دارای ارزش بالاتری نسبت به توزیع مقادیرمردان (آبی) دارد.
وقتی داده های خود را آنالیز می کنید، بسیار بعید است که دو توزیع شما کاملا یکسان باشند، اما ممکن است شکل “مشابه” داشته باشند. اگر شکل مشابهی دارند، میتوانید از SPSS برای انجام یک آزمون من ویتنی برای مقایسه میانههای متغیر وابسته برای دو گروه از افراد مستقل استفاده کنید. با این حال، اگر دو توزیع شما شکل متفاوتی دارند، فقط می توانید از آزمون من ویتنی برای مقایسه رتبه استفاده کنید.
بنابراین، هنگام انجام آزمون من ویتنی، باید از SPSS برای تعیین اینکه آیا دو توزیع شما یک شکل یا شکل متفاوت دارند، نیز استفاده کنید. این کار به چند روش دیگر در SPSS نیاز دارد، اما این یک فرآیند گام به گام آسان است که در آمزش های آینده، آن را به شما نشان خواهیم داد. در این آموزش، ما فقط به شما نشان میدهیم که چگونه یک آزمون من ویتنی را با فرض اینکه دو توزیع شما شکل مشابهی ندارند، انجام دهید، که در این صورت شما بجای میانهها فقط میتوانید میانگین رتبه ها را مقایسه کنید.
شما می توانید فرض شماره 4 را با استفاده از SPSS بررسی کنید. قبل از انجام این کار، باید مطمئن شوید که داده های شما با فرضیات شماره 1، 2 و 3 مطابقت دارند، اگرچه برای انجام این کار به SPSS نیاز ندارید. فقط به یاد داشته باشید که اگر فرض شماره 4 را بررسی نکنید، نمیتوانید بفهمید که آیا میانگین رتبهها یا میانهها را به درستی مقایسه کرده اید یا نه و نتایجی که هنگام اجرای آزمون من ویتنی به دست میآورید ممکن است معتبر نباشد.
در بخش بعدی از این آموزش، ما روش SPSS را برای انجام یک آزمون من ویتنی با فرض اینکه دو توزیع شما یک شکل نیستند و شما باید میانگین رتبه ها را به جای میانه ها تفسیر کنید، نشان می دهیم. ابتدا، مثالی را که برای توضیح روش آزمون من ویتنی در SPSS استفاده کرده ایم، را برای شما بیان می کنیم.
مثال
غلظت کلسترول خون با خطر ابتلا به بیماری قلبی مرتبط است، به طوری که غلظت بالاتر کلسترول نشان دهنده ی سطح بالای خطر و غلظت کمتر نشان دهنده ی سطح خطر کمتر است. اگر غلظت کلسترول خون را کاهش دهید، خطر ابتلا به بیماری قلبی را می توان کاهش داد. اضافه وزن و یا کم تحرک بودن، غلظت کلسترول خون را افزایش می دهد. هم ورزش و هم کاهش وزن می توانند غلظت کلسترول را کاهش دهند. با این حال، مشخص نیست که کدام یک (ورزش یا کاهش وزن) برای کاهش غلظت کلسترول بهترین گزینه است. بنابراین، یک محقق تصمیم گرفت بررسی کند که آیا ورزش در کاهش سطح کلسترول مؤثرتر است یا کاهش وزن. برای این منظور، محقق نمونهای تصادفی از مردان کم تحرک را که دارای اضافه وزن بودند، انتخاب کرد. سپس این نمونه به طور تصادفی به دو گروه تقسیم شد: گروه 1 تحت یک رژیم غذایی کنترل شده با کالری (یعنی گروه diet “رژیم غذایی“) قرار گرفتند و گروه 2 یک برنامه ورزشی (یعنی گروه exercise “ورزش“) را انجام دادند. به منظور تعیین اینکه کدام برنامه درمانی موثرتر است، غلظت کلسترول بین دو گروه در پایان برنامه های درمانی مقایسه شد.
تنظیمات در SPSS
در SPSS، مقادیر غلظت کلسترول، متغیر وابسته را با نام متغیر وارد کردیم. سپس یک متغیر گروه بندی به نام ایجاد کردیم که نشان دهنده متغیر مستقل بود. از آنجایی که متغیر مستقل دارای دو گروه بود – “رژیم غذایی” (diet) و “ورزش” (exercise) – به گروه diet مقدار “1” و به گروه exercise مقدار “2” دادیم. اگر دو گروه خود را برچسب گذاری نکنید، SPSS نمی تواند بین آنها تمایز قائل شود و آزمون من ویتنی اجرا نمی شود.
توجه: دو روش مختلف در SPSS برای اجرای آزمون من ویتنی وجود دارد: (1) روش Nonparametric Tests > Independent Samples برای زمانی که متغیر وابسته شما پیوسته است. (2) روش Legacy Dialogs > 2 Independent Samples برای زمانی که متغیر وابسته شما ترتیبی است. اگر دو توزیع شکل مشابهی داشته باشند روش (1) مناسب تر است ولی اگر دو توزیع شما شکلهای متفاوتی داشته باشند، انتخاب روش (2) بهتر است. بنابراین بسته به نوع متغییر، باید تنظیمات دادههای خود را متناسب با روش انتخابی تغییر دهید. در این آموزش، برای مثال گفته شده، ما روش Legacy Dialogs > 2 Independent Samples را انتخاب کرده ایم.
روش آزمون در SPSS
با توجه فرض شماره 4 گفته شده در بخش قبل، میدانید که نوع روش SPSS برای آنالیز دادهها با استفاده از آزمون من ویتنی بسته به شکل توزیع دو متغیر مستقل، متفاوت خواهد بود. در این مثال، متغیر وابسته غلظت کلسترول، است، و دو توزیع متغیر مستقل، می باشد که از دو توزیع مقادیر برای گروه “diet” و گروه “exercise” تشکیل شده است. در 10 مرحله زیر، به شما نشان می دهیم که چگونه داده های خود را با استفاده از آزمون من ویتنی در SPSS با استفاده از روش Legacy Dialogs > 2 Independent Samples آنالیز کنید. البته زمانی که این دو توزیع شکل متفاوتی دارند. بنابراین، شما باید میانگین رتبه های متغیر وابسته خود را به جای میانه ها مقایسه کنید.
برای استفاده از SPSS برای تعیین اینکه آیا دو توزیع شما دارای اشکال مشابه یا متفاوت هستند، یا اگر می خواهید بدانید که چگونه از SPSS برای انجام آزمون من ویتنی زمانی که دو توزیع شما دارای یک شکل هستند، استفاده کنید، به طوری که شما نیاز دارید. برای مقایسه میانگینها به جای رتبههای میانگین، باید به بخش روشها در راهنمای آزمون من ویتنی پیشرفته ما دسترسی داشته باشید (N.B.، میتوانید این کار را با عضویت در Laerd Statistics انجام دهید). علاوه بر این، 9 مرحله زیر به شما نشان میدهد که چگونه یک آزمون من ویتنی را با استفاده از روش Legacy Dialogs > 2 Independent Samples در SPSS انجام دهید. در پایان 9 مرحله زیر، نحوه تفسیر نتایج این آزمون را با استفاده از میانگین رتبه ها به شما نشان می دهیم.
مرحله (1)
همانطور که در زیر نشان داده شده است، روی
Analyze > Nonparametric Tests > Legacy Dialogs > 2 Independent Samples…
در منوی اصلی کلیک کنید:
مرحله (2)
مطابق شکل زیر پنجره ی Two-Independent-Samples Tests نمایش داده می شود:
مرحله (3)
با استفاده از دکمه فلش مناسب، متغیر وابسته ، را به کادر Test Variable List و متغیر مستقل، ، را به Grouping Variable منتقل کنید.
نکته خیلی **مهم**: همانطور که در بالا مشاهده می شود، مطمئن شوید که چک باکس در ناحیه –Test Type– تیک خورده باشد و کادر Grouping Variable با رنگ زرد برجسته شده باشد. اگر با رنگ زرد مشخص نشده است، به سادگی با مکان نمای خود روی کادر Grouping Variable کلیک کنید تا آن را برجسته کنید. اگر کادر Grouping Variable را برجسته نکرده باشید، دکمه Define Groups فعال و قابل کلیک نخواهد بود.
مرحله (4)
بر روی دکمه Define Groups کلیک کنید. با صفحه زیر روبرو خواهید شد:
مرحله (5)
عدد 1 را در کادر Group 1 و عدد 2 را در کادر Group 2 وارد کنید. به یاد داشته باشید که ما گروه رژیم غذایی (diet) را به عنوان 1 و گروه ورزش (exercise) را به عنوان 2 برچسب گذاری کردیم.
توجه: اگر در مطالعه خود بیش از دو گروه دارید (به عنوان مثال، سه گروه: گروه های رژیم غذایی (1)، ورزش (2) و دارو (3))، اما فقط می خواهید دو گروه را با هم مقایسه کنید (به عنوان مثال، گروه رژیم غذایی و دارو)، می توانید عدد 1 را در کادر Group 1 و عدد 3 را در کادر Group 2 تایپ کنید. با این کار شما در واقع گروه رژیم غذایی را با گروه دارو مقایسه می کنید.
مرحله (6)
بر روی دکمه Continue کلیک کنید.
مرحله (7)
اگر میخواهید از این روش برای تولید برخی آمار توصیفی استفاده کنید، روی دکمه Options کلیک کنید و سپس تیک Descriptive و Quartiles را در ناحیه –Statistics– بزنید. در نهایت با پنجره ی زیر مواجه خواهید شد:
مرحله (8)
بر روی دکمه Continue کلیک کنید. همانطور که در زیر نشان داده شده است، شما به پنجره ی اصلی با کادر Grouping Variable برمی گردید:
مرحله (9)
روی دکمه OK کلیک کنید تا خروجی آزمون من ویتنی تولید گردد.
خروجی آزمون و تفسیر آن
اگر این آموزش را از ابتدا دنبال کردهاید، میدانید که خروجی و تفسیری که در زیر آمده است به نتایج آزمون من ویتنی مربوط میباشد. همچنین در این مثال گفته شده، دو توزیع شکل متفاوتی دارند، شما رتبههای میانگین را به جای میانهها مقایسه میکنید. این زمانی اتفاق می افتد که داده ها فرض شماره 4 را نقض کرده باشد. در این شرایط، خروجی تولید شده مبتنی بر روش Legacy Dialogs > 2 Independent Samples خواهد بود. در خروجی SPSS زیر، به شما نشان می دهیم که چگونه آزمون من ویتنی را با استفاده از میانگین رتبه ها گزارش دهید. برای انجام این کار، SPSS سه جدول خروجی تولید می کند:
(1) جدول Descriptives
جدول Descriptive Statistics (آمار توصیفی) به صورت زیر است:
اگرچه ما تصمیم گرفتیم به شما نشان دهیم که چگونه می توانید آمارهای SPSS را برای ارائه آمار توصیفی برای آزمون من ویتنی بدست آورید، با این حال، به خاطر 2 مورد، چندان مفید نیستند. اولاً، برای مقایسه گروهها، بجای مقادیر ادغام شده (amalgamated)، به مقادیر گروهی فردی (individual group) نیاز داریم،. این جدول این اطلاعات حیاتی را در اختیار ما قرار نمی دهد، بنابراین نمی توانیم تفاوت های احتمالی را بین گروه های ورزش و رژیم مقایسه کنیم. ثانیاً، ما آزمون من ویتنی را انتخاب کردیم زیرا یکی از گروههای فردی (گروه ورزش) به طور نرمال توزیع نشده بود. با این حال، ما آزمایش نکردهایم تا ببینیم آیا ادغام دو گروه منجر به توزیع نرمال گروه بزرگتر میشود یا خیر. بنابراین، نمی دانیم که از میانگین و انحراف معیار استفاده کنیم و یا از میانه و فاصلهی بین چارکی (interquartile range (IQR)) استفاده کنیم. IQR از 25 تا 75 صدک (percentile) است. اگر داده ها به طور نرمال توزیع می شدند، این به عنوان جایگزینی برای انحراف استاندارد عمل می کرد. به این دلایل توصیه می کنیم از این جدول صرف نظر کنید.
(2) جدول Ranks (رتبه ها)
جدول رتبه ها اولین جدولی است که اطلاعات مربوط به خروجی آزمون واقعی Mann-Whitney U را ارائه می دهد. میانگین رتبه (Mean Rank) و مجموع رتبهها (Sum of Ranks) را برای دو گروه مورد آزمون یعنی گروه “رژیم غذایی” (diet) و “ورزش” (exercise) نشان میدهد:
جدول بالا بسیار مفید است زیرا به طور کلی نشان می دهد که کدام گروه را می توان دارای غلظت کلسترول بالاتر در نظر گرفت. یعنی گروهی که بالاترین میانگین رتبه (Mean Rank) را دارند. در این مورد، گروه رژیم غذایی (diet) بالاترین غلظت کلسترول را داشتند.
(3) جدول Test Statistics (آمار آزمون)
این جدول ارزش واقعی آزمون را به ما نشان می دهد. به طور خاص، جدول Test Statistics، آمار آزمون، آماره U و همچنین مقدار p معناداری مجانبی (asymptotic significance (2-tailed)) را ارائه می دهد.
از این داده ها می توان نتیجه گرفت که غلظت کلسترول در گروه رژیم غذایی به طور معنی داری بیشتر از گروه ورزش بود، و برنامه درمانی ورزش برای کاهش غلظت کلسترول بهتر از برنامه درمانی رژیم غذایی می باشد (U=110, p=.014). بسته به اندازه گروه ها، SPSS هر دو سطح معنی داری آماری دقیق (Exact) و مجانبی (.Asymp) را تولید می کند.
مطالب زیر را هم از دست ندهید:
آزمون مک نمار (McNemar’s test) با استفاده از SPSS
تعدیل کننده دو وضعیتی (Dichotomous Moderator) با استفاده از SPSS
ضریب همبستگی تاوی- بی کندال (Kendall’s Tau-b correlation coefficient) با استفاده از SPSS
آزمون Jonckheere-Terpstra (جانكهير ترپسترا) با استفاده از SPSS
آزمون رتبه علامتدار ویلکاکسون (Wilcoxon signed-rank test) با استفاده از SPSS
آزمون Q کوکران (Cochran’s Q) با استفاده از SPSS
دی سامرز (Somers’ d) با استفاده از SPSS
آزمون t وابسته با استفاده از SPSS Statistics
آزمون t وابسته برای نمونه های جفت شده
آزمون t نمونه تکی با استفاده از SPSS Statistics
کتاب سنجی (Bibliometrics) و تفاوت آن با علم سنجی (Scientometrics) و اطلاع سنجی (Informetrics)
Afshin Safaee (@afshinsafaee.official)
6 پاسخ