همبستگی رتبهای اسپیرمن با استفاده از Stata
معرفی
ضریب همبستگی رتبهای اسپیرمن (Spearman rank-order correlation coefficient) در Stata یک آزمون ناپارامتریک است که قدرت و جهت ارتباط بین دو متغیر که در مقیاس ترتیبی یا پیوسته اندازه گیری می شوند، را اندازه گیری می کند. ضریب همبستگی رتبه ای Spearman اغلب با نماد rs یا حرف یونانی ρ که rho تلفظ می شود، نشان داده می شود. زمانی که توزیع داده ها نرمال نباشد، و رابطه غیر خطی باشد و یا اینکه از متغیرهای ترتیبی استفاده شود و نمیتوان از همبستگی پیرسون (Pearson’s Correlation) استفاده کرد، در این صورت اجرای همبستگی رتبه ای Spearman یک آزمون مفیدی خواهد بود.
برای مثال، میتوانید از همبستگی رتبه ای Spearman استفاده کنید تا بفهمید آیا ارتباطی بین عملکرد پرش از ارتفاع و زمان صرف شده برای تمرین وجود دارد یا نه؟. در این مثال، دو متغیر شما «عملکرد پرش ارتفاع»، اندازهگیری شده برحسب ارتفاع پرش، و «زمان صرف شده برای تمرین» اندازهگیری شده برحسب ساعت در هفته هستند. اگر یک ارتباط متوسط و مثبت وجود داشت، میتوان گفت که هرچه زمان بیشتری صرف تمرین شود با عملکرد پرش ارتفاع بهتر خواهد بود. همچنین، میتوانید از همبستگی رتبه ای Spearman برای درک اینکه آیا ارتباطی بین مدت زمان بیکاری و سلامتی وجود دارد، استفاده کنید. در این مثال، دو متغیر شما «مدت زمان بیکاری» هستند که برحسب روز اندازهگیری میشوند و «سلامتی» که با استفاده از مقیاس پیوسته اندازهگیری میشوند. اگر یک ارتباط منفی و قوی بین این دو متغیر وجود داشت، میتوان گفت که هر چه مدت بیکاری بیشتر باشد، سطح سلامت پایینتر است.
در این آموزش، نحوه انجام همبستگی رتبه ای Spearman را با استفاده از Stata و همچنین تفسیر و گزارش نتایج این آزمون به شما نشان میدهیم. با این حال، قبل از اینکه شما را با این روش آشنا کنیم، باید فرضیات مختلفی را که داده های شما باید رعایت کنند تا همبستگی رتبه ای Spearman به شما نتیجه معتبری بدهد، بدانید. در ادامه به این فرضیات می پردازیم.
فرضیات
دو فرض وجود دارد که زیربنای همبستگی رتبه ای Spearman است. اگر هر یک از این دو فرض برآورده نشود، تجزیه و تحلیل داده های شما با استفاده از همبستگی رتبه ای Spearman ممکن است به نتیجه معتبری منجر نشود. از آنجایی که فرض شماره 1 به انتخاب شما از متغیرها مربوط می شود، نمی توان آن را برای استفاده از Stata آزمایش کرد. خوشبختانه، می توانید با استفاده از Stata، فرض شماره 2 را بررسی کنید. با این حال، قبل از آزمون، باید تصمیم بگیرید که آیا مطالعه شما با این دو فرض مطابقت دارد یا خیر.
فرض شماره 1:
دو متغیر شما باید در یک سطح پیوسته (یعنی متغیرهای فاصله ای (interval) یا نسبتی (ratio) هستند) یا در سطح ترتیبی (ordinal) اندازه گیری شوند. نمونههایی از متغیرهای پیوسته عبارتند از: قد (اندازهگیری شده بر حسب سانتی متر)، دما (اندازهگیری شده بر حسب درجه سانتیگراد)، حقوق و یا دستمزد (اندازهگیری شده بر حسب ریال)، زمان (اندازهگیری شده بر حسب ساعت)، هوش (اندازهگیری شده با استفاده از امتیاز IQ)، زمان واکنش (اندازهگیری شده برحسب میلی ثانیه)، نمره آزمون (اندازه گیری شده از 0 تا 20)، میزان فروش (اندازه گیری شده بر اساس تعداد معاملات در ماه)، و غیره می باشد. نمونههایی از متغیرهای ترتیبی شامل موارد لیکرت مثلاً مقیاس 7 درجهای از «کاملاً موافقم» تا «کاملاً مخالفم») و یا مقیاس 5 درجهای برای سنجش رضایت شغلی، با دامنه “بیشترین رضایت” تا “کمترین رضایت” و غیره می باشد.
فرض شماره 2:
باید یک رابطه یکنواخت (monotonic relationship) بین دو متغیر وجود داشته باشد. یک رابطه یکنواخت زمانی وجود دارد که یا مقدار متغیرها با هم افزایش می یابد، و یا با افزایش مقدار یک متغیر، مقدار متغیر دیگر کاهش می یابد. چندین راه برای بررسی وجود رابطه یکنواخت بین دو متغیر شما وجود دارد. با این حال پیشنهاد می کنیم با استفاده از Stata یک نمودار پراکند گی (نقطه ای) (scatterplot) ایجاد کنید که در آن می توانید یک متغیر را بر حسب متغییر دیگر رسم کنید و سپس به صورت بصری نمودار پراکندگی را برای بررسی یکنواختی بررسی کنید. نمودار پراکندگی شما ممکن است چیزی شبیه به یکی از موارد زیر باشد:
اگر رابطه نمایش داده شده در نمودار پراکنده شما غیر یکنواخت (non-monotonic) است، باید داده های خود را تبدیل (transformation) کنید و یا از آزمون آماری دیگری استفاده کنید. در عمل، بررسی فرض شماره 2 کار دشواری نیست و Stata تمام ابزارهای مورد نیاز برای انجام این کار را فراهم می کند.
همچنین شایان ذکر است که برای اجرای همبستگی رتبه ای Spearman ، نیازی نیست متغیرهای شما از توزیع نرمال برخوردار باشند. علاوه بر این، همبستگی رتبه ای Spearman به نقاط پرت (مشاهدات غیرمعمول در داده های شما) (outliers) خیلی حساس نمی باشد، بنابراین وجود این نقاط داده نتایج حاصل اجرای همبستگی رتبه ای Spearman را تحت تاثیر قرار نمی دهد و آنها را بی اعتبار نمی کند.
در بخش بعدی، روش Stata مورد نیاز برای انجام همبستگی رتبه ای Spearman را با این فرض که هیچ فرضی نقض نشده است، نشان میدهیم. ابتدا، مثالی را که برای توضیح روش همبستگی رتبه ای Spearman در Stata استفاده میکنیم، بیان میکنیم.
مثال
همواره در استخدام های دولتی، میزان حقوق و یا دستمزد کارمند، با میزان تحصیلات او در ارتباط است. در یک مطالعه بسیار ساده، یک محقق می خواست بداند که آیا تعداد سال هایی که یک فرد تحصیل کرده است با حقوق او در 35 سالگی مرتبط است یا خیر. برای انجام این مطالعه، محقق نمونه کوچکی از 13 کارمند دولتی 35 ساله را انتخاب کرد. تعداد سنوات تحصیلی آنها در متغیر edu_years و حقوق آنها در متغیر salary شد. محقق میخواست میزان حقوق و تعداد سنوات تحصیلی را که به صورت متغیر بیان میشد، به همدیگر مرتبط کند.
توجه: مثال و داده های استفاده شده برای این راهنما ساختگی هستند. همچنین فرض بر این بود که داده ها با فرضیات مورد نیاز برای اجرای همبستگی پیرسون شکست خورده اند.
تنظیمات در Stata
در Stata، ما دو متغیر ایجاد کردیم: (1) متغیر salary، که حقوق یک کارمند است (برحسب 1000 دلار در سال!!!) و (2) متغیر edu_years، که تعداد سنوات تحصیلی است که یک کارمند داشته است.
توجه: مهم نیست که ابتدا کدام متغیر را ایجاد کنید.
همانطور که در زیر نشان داده شده است، پس از ایجاد این دو متغیر edu_years و salary، مقادیر آنها را در دو ستون Data Editor (Edit) وارد کردیم:
روش آزمون در Stata
در این بخش، به شما نشان میدهیم که چگونه دادههای خود را با استفاده از همبستگی رتبه ای Spearman در Stata تجزیه و تحلیل کنید. البته به شرطی که دو فرض توضیح داده شده در بخش فرضیات، نقض نشده باشند. شما می توانید یک همبستگی رتبه ای Spearman را با استفاده از دو روش (1) کد (code) یا (2) رابط کاربری گرافیکی (GUI) (graphical user interface) انجام دهید. پس از اینکه تجزیه و تحلیل خود را انجام دادید، به شما نشان می دهیم که چگونه نتایج خود را تفسیر کنید. ابتدا انتخاب کنید که از کدام روش ((1) code یا (2) GUI) می خواهید استفاده کنید.
(1) با استفاده از روش code
کد اصلی برای اجرای همبستگی رتبه ای Spearman به شکل زیر است:
spearman VariableA VariableB
با استفاده از این کد، Stata چند نتیجه را گزارش خواهد کرد: (الف) تعداد مشاهدات (یعنی شرکت کنندگان) در تحلیل همبستگی رتبه ای Spearman ؛ (ب) ضریب همبستگی رتبه ای Spearman و (ج) اهمیت آماری آن (یعنی p-value). گزینه های مختلف دیگری در Stata وجود دارد، اما ما در این آموزش فقط بر روی نتایج آماری اولیه تمرکز خواهیم کرد.
با جایگزینی دو متغیر salary و edu_years به ترتیب به جای VariableA و VariableB در کد نشان داده شده در بالا، کد به صورت زیر خواهد بود:
spearman salary edu_years
این کدی است که باید در Stata وارد کنید تا یک همبستگی رتبه ای Spearman روی این متغیرها اجرا شود. کد باید در کادر Command در Stata وارد شود که در زیر نشان داده شده است:
بنابراین کد را مانند شکل زیر در کادر Command وارد کنید:
اکنون کلید ” Enter” را روی صفحه کلید خود فشار دهید تا نتایج ایجاد گردد.
(2) با استفاده از روش GUI
سه مرحله مورد نیاز برای انجام همبستگی رتبه ای Spearman در Stata در زیر نشان داده شده است:
مرحله (1)
همانطور که در زیر نشان داده شده است، در منوی اصلی روی
Statistics > Nonparametric analysis > Tests of hypotheses > Spearman’s rank correlation
و یا
Statistics > Summaries, tables, and tests > Nonparametric tests of hypotheses > Spearman’s rank correlation
کلیک کنید:
پنجره spearman – Spearman’s rank correlation coefficients به صورت زیر نمایش داده می شود:
مرحله (2)
با استفاده از دکمه کشویی متغیر های salary و edu_years را از داخل کادر Variables: (leave empty for all) انتخاب کنید. در نهایت با صفحه زیر مواجه خواهید شد:
توجه: فرقی نمی کند که دو متغیر خود را به چه ترتیبی از داخل کادر Variables: (leave empty for all) انتخاب کنید. علاوه بر این، اگر تمام گزینههای موجود در ناحیه –List of Statistics– را انتخاب کنید، در نهایت همان خروجی (یعنی حجم نمونه، ضریب همبستگی رتبه ای Spearman و سطح معنیداری آماری) را خواهید داشت.
مرحله (3)
در نهایت بر روی دکمه OK کلیک کنید تا خروجی تولید گردد.
خروجی همبستگی رتبه ای Spearman در Stata
اگر داده های شما از فرض شماره 2 عبور کردند (یعنی یک رابطه یکنواخت بین دو متغیر شما وجود داشت که قبلاً در بخش فرضیات توضیح دادیم)، فقط باید خروجی همبستگی رتبه ای Spearman زیر را در Stata تفسیر کنید:
خط اول (یعنی “spearman edu_years salary“) حاوی کدی است که Stata برای ایجاد همبستگی رتبه ای Spearman اجرا کرد. با این حال، کاربران روش GUI (رابط کاربری گرافیکی) این کد را تشخیص نخواهند داد، اما این کدی است که هنگام انتخاب گزینه های مختلف در پنجره Spearman – Rank Correlation Coefficients – Spearman در پشت پرده اجرا می شود.
خط بعدی (“Number of obs = 13”) شامل تعداد مشاهدات (یعنی شرکت کنندگان) است که بررسی شده اند. 13 شرکت کننده در این مثال وجود داشت. خط بعدی (“Spearman’s rho = 0.8583”) مقدار واقعی ضریب همبستگی رتبه ای Spearman را نشان می دهد. می توانید ببینید که rho اسپیرمن(ρ) مقدار 0.8583 را دارد. برای این مثال مقادیر ضریب همبستگی رتبه ای Spearman به طور کلی کمتر از ضریب همبستگی پیرسون است و ρ اسپیرمن 0.8583 نشان دهنده یک رابطه یکنواخت قوی است. از آنجایی که ضریب اسپیرمن مثبت است، می توان نتیجه گرفت که تعداد سنوات تحصیلی بیشتر با حقوق بیشتر همراه است. آخرین خط (“Prob > |t| = 0.0002”) خروجی، اهمیت آماری دو طرفه(یعنیp-value) ضریب همبستگی رتبه ای Spearman را نشان می دهد. میتوانید ببینید که ضریب همبستگی رتبه ای Spearman از نظر آماری معنیدار است زیرا p=.0002 است که کمتر از p<.05 است.
گزارش همبستگی رتبه ای Spearman
هنگامی که خروجی همبستگی رتبه ای Spearman خود را گزارش می کنید، بهتر است که شامل موارد زیر باشد:
الف. مقدمه ای بر تحلیلی که انجام دادید.
ب. اطلاعات مربوط به نمونه شما (شامل مقادیر گمشده).
ج. ضریب همبستگی رتبه ای Spearman ، rs.
ج. سطح معناداری آماری (یعنی p-value) نتیجه شما.
با توجه به نتایج فوق می توان نتایج این تحقیق را به شرح زیر گزارش کرد:
یک همبستگی رتبه ای Spearman برای ارزیابی رابطه بین حقوق و تعداد سنوات تحصیل با استفاده از یک نمونه کوچک از 13 نفره 35 ساله اجرا شد. بین حقوق و سنوات تحصیلی همبستگی مثبت و قوی وجود داشت که از نظر آماری معنی دار بود.
علاوه بر گزارش نتایج به شرح بالا، می توان از یک نمودار برای ارائه بصری نتایج استفاده کرد. به عنوان مثال، می توانید این کار را با استفاده از نمودار پراکندگی انجام دهید. این کار می تواند درک نتایج شما را برای دیگران آسان تر کند و این نمودار را میتوان به راحتی در Stata ایجاد کرد.
مطالب زیر را هم از دست ندهید:
همبستگی حاصلضرب-گشتاور پیرسون (Pearson’s Product-Moment Correlation) با استفاده از Minitab
همبستگی حاصلضرب-گشتاور پیرسون (Pearson’s Product-Moment Correlation) با استفاده از SPSS Statistics
ضریب همبستگی رتبهای اسپیرمن (Spearman rank-order correlation coefficient) با استفاده از SPSS
آزمون H کروسکال-والیس (H Kruskal-Wallis) با استفاده از Stata
MANOVA یک طرفه با استفاده از Stata
رسم نمودار پراکندگی (نقطه ای) (Scatterplot) با استفاده از SPSS
ایجاد نمودار میله ای خوشه ای (Clustered Bar Chart) با استفاده از SPSS
ANCOVA یک طرفه در SPSS Statistics
ANOVA اندازه گیری های مکرر دو طرفه با استفاده از SPSS Statistics
ANOVA با اندازه گیری های مکرر با استفاده از SPSS Statistics
ANOVA دو طرفه در SPSS Statistics
ANOVA مخلوط با استفاده از SPSS Statistics
انواع متغیر و تحقیقات تجربی و غیر تجربی
ایجاد متغیر های ساختگی در SPSS
آزمون Jonckheere-Terpstra (جانكهير ترپسترا) با استفاده از SPSS
آزمون Q کوکران (Cochran’s Q) با استفاده از SPSS
آزمون t نمونه تکی با استفاده از SPSS Statistics
آزمون t وابسته با استفاده از SPSS
آزمون t وابسته برای نمونه های جفت شده
آزمون رتبه علامتدار ویلکاکسون (Wilcoxon signed-rank test) با استفاده از SPSS
آزمون مربع کای (Chi-Square) با استفاده از SPSS
آزمون مک نمار (McNemar’s test) با استفاده از SPSS
آزمون نرمال بودن با استفاده از SPSS Statistics
آزمون یو من ویتنی (Mann-Whitney U) با استفاده از SPSS
آمار توصیفی (descriptive) و استنباطی (inferential)
آنالیز اجزای اصلی (PCA) با استفاده از SPSS
تعدیل کننده دو وضعیتی (Dichotomous Moderator) با استفاده از SPSS
دی سامرز (Somers’ d) با استفاده از SPSS
رگرسیون پواسون با استفاده از SPSS
رگرسیون چندگانه با استفاده از SPSS
رگرسیون خطی با استفاده از SPSS
رگرسیون لجستیک ترتیبی با استفاده از SPSS
رگرسیون لجستیک چند جمله ای در SPSS
رگرسیون لجستیک دو جمله ای با استفاده از SPSS
ضریب همبستگی تاوی- بی کندال (Kendall’s Tau-b correlation coefficient) با استفاده از SPSS
گامای گودمن و کروسکال (Goodman and Kruskal’s gamma) با استفاده از SPSS
Afshin Safaee (@afshinsafaee.official)