همبستگی جزئی با استفاده از SPSS Statistics
معرفی
همبستگی جزئی (Partial Correlation) معیاری از قدرت و جهت یک رابطه خطی بین دو متغیر پیوسته در حالی که اثر یک یا چند متغیر پیوسته دیگر را کنترل میکند، است. در اینجا، متغیرهای پیوسته به عنوان متغیرهای “متغیرهای کمکی” یا “کنترل” نیز شناخته میشود. همبستگی جزئی تفاوتی بین متغیرهای مستقل و وابسته ایجاد نمی کند، با اینحال این دو متغیر اغلب به این صورت در نظر گرفته می شوند. به عنوان مثال، شما یک متغیر وابسته پیوسته و یک متغیر مستقل پیوسته و همچنین یک یا چند متغیر کنترل پیوسته دارید.
توجه: بسیاری از جنبههای همبستگی جزئی را میتوان با استفاده از رگرسیون چندگانه مورد بررسی قرار داد و گاهی توصیه میشود که به این روش به آنالیز خود را انجام دهید. شما می توانید همبستگی جزئی را در SPSS Statistics با استفاده از دو روش مختلف همبستگی و رگرسیون انجام دهید.
به عنوان مثال، می توانید از همبستگی جزئی برای درک اینکه در حالی که سرعت باد و رطوبت نسبی را کنترل می کنید، آیا یک رابطه خطی بین عملکرد دویدن 10 کیلومتری و VO2max (حداکثر ظرفیت هوازی) وجود دارد یا نه؟. در اینجا متغیر وابسته پیوسته عملکرد دویدن 10 کیلومتری خواهد بود که با دقیقه و ثانیه اندازه گیری می شود. همچنین متغیر مستقل پیوسته VO2max خواهد بود که بر حسب میلی لیتر/دقیقه/کیلوگرم اندازه گیری می شود. دو متغیر کنترلی – یعنی دو متغیر مستقل پیوسته دیگر که برای آن ها تنظیم می کنید “سرعت باد” (که بر حسب مایل در ساعت اندازه گیری می شود) و “رطوبت نسبی” (به صورت درصد بیان می شود) خواهد بود. در این مثال شما بر این باور هستید که بین عملکرد دویدن 10 کیلومتری و VO2max رابطه ای وجود دارد. یعنی هر چه VO2max یک ورزشکار بزرگتر باشد، عملکرد دویدن آنها بهتر است. اما دوست دارید بدانید که آیا این رابطه تحت تأثیر سرعت و رطوبت باد قرار می گیرد یا نه. یعنی، ممکن است عملکرد ورزشکاران در شرایط باد و رطوبت بیشتر، کاهش می یابد.
این آموزش به شما نشان می دهد که چگونه با استفاده از SPSS Statistics یک همبستگی جزئی انجام دهید و همچنین نتایج این آزمون را تفسیر و گزارش کنید. با این حال، قبل از اینکه شما را با این روش آشنا کنیم، باید فرضیات مختلفی را که داده های شما باید رعایت کنند تا یک همبستگی جزئی به شما نتیجه معتبری بدهد، بدانید. در ادامه به این فرضیات می پردازیم.
فرضیات
هنگامی که تصمیم می گیرید داده های خود را با استفاده از همبستگی جزئی آنالیز کنید، ابتدا باید مطمئن شوید که آیا داده های شما واقعاً می توانند با استفاده از همبستگی جزئی آنالیز شوند یا نه؟. شما باید این کار را انجام دهید. زیرا تنها زمانی استفاده از همبستگی جزئی مناسب است که داده های شما از پنج فرضی که برای ارائه یک نتیجه معتبر لازم است، عبور کند. در عمل، بررسی این پنج فرض فقط کمی زمان بر خواهد بود. با اینحال کار سختی نیست.
فرض شماره 1:
شما یک متغیر وابسته و یک متغیر مستقل دارید که هر دو در یک مقیاس پیوسته اندازه گیری می شوند. یعنی در مقیاس فاصله ای (interval) یا نسبتی (ratio) اندازه گیری می شوند. نمونههایی از متغیرهای پیوسته عبارتند از: زمان (اندازهگیری شده بر حسب ساعت)، هوش (اندازهگیری شده با استفاده از امتیاز IQ)، نمره امتحان (اندازهگیری شده از 0 تا 20)، وزن (اندازهگیری شده بر حسب کیلوگرم)، دما (اندازهگیری شده بر حسب درجه سانتیگراد) و غیره.
فرض شماره 2:
شما یک یا چند متغیر کنترلی دارید که به عنوان متغیرهای کمکی نیز شناخته می شوند. یعنی متغیرهای کنترل فقط متغیرهایی هستند که شما از آنها برای تنظیم رابطه بین دو متغیر وابسته و مستقل استفاده می کنید. این متغیرهای کنترلی نیز در مقیاس پیوسته اندازه گیری می شوند و متغیرهای پیوسته هستند.
فرض شماره 3:
باید یک رابطه خطی بین هر سه متغیر وجود داشته باشد. یعنی همه جفت متغیرها باید یک رابطه خطی نشان دهند. این اغلب به صورت بررسی چشمی یک نمودار نقطه ای یا پراکندگی (Scatterplot) انجام می شود.
فرض شماره 4:
نباید نقاط پرت (outliers) قابل توجهی وجود داشته باشد. نقاط پرت، داده هایی هستند که از الگوی نرمال پیروی نمی کنند. همبستگی جزئی به نقاط پرت حساس است، که می تواند تأثیر بسیار زیادی روی خط تناسب و ضریب همبستگی داشته باشد و منجر به نتیجه گیری نادرست در مورد داده های شما شود. بنابراین، بهترین کار این است که هیچ نقطهای وجود نداشته باشد یا به حداقل برسد.
فرض شماره 5:
متغیرهای شما باید تقریباً به طور نرمال توزیع شوند. برای ارزیابی اهمیت آماری همبستگی جزئی، باید نرمال بودن دو متغیره را برای هر جفت متغیر داشته باشید. با این حال ارزیابی این فرض کمی دشوار است. برای همین روش سادهتری مورد استفاده قرار میگیرد، که در آن آن توزیع برای هر متغیر بهصورت جداگانه آزمایش و بررسی میشود. این بررسی را می توان با استفاده از آزمون نرمال بودن Shapiro-Wilk آزمایش کرد.
با استفاده از SPSS Statistics می توانید فرضیات #3، #4 و #5 را بررسی کنید. به یاد داشته باشید که اگر آزمون های آماری را بر اساس این فرضیات به درستی اجرا نکنید، نتایجی که هنگام اجرای یک همبستگی جزئی به دست می آورید ممکن است معتبر نباشند.
در بخش بعدی ما روش SPSS Statistics را برای انجام یک همبستگی جزئی با فرض اینکه هیچ فرضی نقض نشده است، نشان میدهیم. ابتدا، مثالی را که برای توضیح روش همبستگی جزئی در SPSS Statistics استفاده کرده ایم، را ارائه میکنیم.
مثال و تنظیمات در SPSS Statistics
یک محقق می خواهد بداند که آیا رابطه خطی معنی داری بین VO2max (حداکثر ظرفیت هوازی) و وزن فرد وجود دارد یا خیر. علاوه بر این، محقق میخواهد بداند که آیا این رابطه پس از محاسبه سن فرد همچنان باقی میماند یا نه؟. یعنی آیا این رابطه تحت تأثیر سن فرد می باشد یا نه؟. بنابراین، محقق از همبستگی جزئی برای تعیین وجود یک رابطه خطی بین VO2max و وزن، استفاده میکند، در حالی که سن را کنترل میکند. در این مثال، متغیر وابسته پیوسته “VO2max” است، که بر حسب میلیلیتر/دقیقه/کیلوگرم اندازهگیری میشود، متغیر مستقل پیوسته وزن است، که بر حسب کیلوگرم اندازه گیری می شود، و متغیر کنترل (یعنی متغیر مستقل پیوسته اضافی که محقق برای آن تنظیم می کند) «سن» است که بر حسب سال اندازه گیری می شود.
در SPSS Statistics، سه متغیر ایجاد شد تا بتوان داده ها را وارد کرد:
(1) VO2max (یعنی VO2max فرد، اندازه گیری شده بر حسب میلی لیتر/دقیقه/کیلوگرم)
(2) weight (یعنی وزن فرد، بر حسب کیلوگرم)
(3) age (یعنی، سن فرد، بر حسب سال اندازه گیری می شود).
توجه: این یک مثال ساده از همبستگی جزئی با یک متغیر کنترل پیوسته است، اما می توانید چندین متغیر کنترل را در آنالیز خود بگنجانید.
روش آزمون در SPSS Statistics
روش 6 مرحله ای Correlate > Partial زیر به شما نشان می دهد که چگونه داده های خود را با استفاده از همبستگی جزئی در SPSS Statistics آنالیز کنید. البته به شرطی که، هیچ یک از پنج فرض در بخش قبل بیان گردید، نقض نشده باشد. در پایان این شش مرحله، نحوه تفسیر نتایج این آزمون را به شما نشان می دهیم.
توجه: در این مثال به شما نشان می دهیم که چگونه از روش Correlate که بسیار ساده است، در SPSS Statistics استفاده کنید. اما امکان استفاده از روش Regression نیز وجود دارد که دارای چندین مزیت است. با این حال در این آموزش فقط به روش ساده ی Correlate بسنده می کنیم.
مرحله (1)
همانطور که در زیر نشان داده شده است، روی
Analyze > Correlate > Partial…
در منوی اصلی کلیک کنید:
با صفحه Partial Correlations زیر روبرو خواهید شد:
مرحله (2)
متغیرهای weight و VO2max را به کادر Variables و age را به کادر Controlling for با کشیدن و رها کردن یا با کلیک کردن روی دکمههای فلش مربوطه منتقل کنید. در نهایت با صفحهای مشابه تصویر زیر مواجه خواهید شد:
مرحله (3)
بر روی دکمه Options کلیک کنید. با صفحه Partial Correlations: Options زیر روبرو خواهید شد:
مرحله (4)
همانطور که در زیر نشان داده شده است، چک باکس های Means and standard deviations و Zero-order correlations را در ناحیه –Statistics– علامت بزنید:
مرحله (5)
بر روی دکمه Continue کلیک کنید.
مرحله (6)
بر روی دکمه OK کلیک کنید، تا خروجی تولید شود.
تفسیر نتایج یک همبستگی جزئی
SPSS Statistics دو جدول برای یک همبستگی جزئی بر اساس روشی که در بخش قبل اجرا کردید ایجاد می کند. اگر دادههای شما تمام فرضیات همبستگی جزئی را که قبلاً در بخش قبل توضیح دادهایم، رعایت کنند، این نتایج صحیح خواهند بود. با این حال، در این آموزش، ما تنها بر نتایج حاصل از روش همبستگی جزئی تمرکز میکنیم، با این فرض که دادههای شما تمام فرضیات مربوطه را برآورده میکنند. در پنجره IBM SPSS Statistics Viewer، جداول Descriptive Statistics و Correlations به شما نمایش داده می شود. همانطور که در زیر نشان داده شده است، ما پیشنهاد می کنیم که ابتدا با جدول Descriptive Statistics داده های خود را بررسی کنید:
(1) جدول Descriptive Statistics (آمار توصیفی) نشان میدهد که ما هیچ داده ی گمشده ای (missing data) نداریم. زیرا حجم نمونه ثبتشده، 100=N، برابر با تعداد شرکتکنندگانی است که در مطالعه شرکت کردند. همچنین در جدول میتوانیم ببینیم که مقدار میانگین متغیر وابسته، VO2max، 43.63 میلی لیتر / دقیقه / کیلوگرم (با انحراف معیار 8.57 میلی لیتر / دقیقه / کیلوگرم)، در حالی که میانگین Weight وزن شرکتکنندگان 79.7 کیلوگرم (با انحراف معیار 15.1 کیلوگرم) بود. در نهایت Age میانگین سنی شرکت کنندگان، 31.1 سال (با انحراف معیار 9.1 سال) بود. نتایج نشان میدهد که نمونه شرکتکنندگان بهجای نشاندادن کل جمعیت، کمی در سمت جوانتر بودند، که دانستن آن وقتی در مورد تعمیم پذیری یافته ها (generalizability of the findings) در گزارش خود بحث می کنید، مفید است.
همانطور که در زیر نشان داده شده است، در مرحله بعد، پیشنهاد می کنیم به جدول Correlations نگاه کنید:
(2) جدول Correlations (همبستگی ها) به دو بخش اصلی تقسیم می شود: (الف) همانطور که با مستطیل آبی مشخص شده است، ضرایب همبستگی حاصلضرب-گشتاور پیرسون (Pearson product-moment correlation) برای همه متغیرهای شما (یعنی متغیر وابسته، متغیر مستقل و یک یا چند متغیر کنترلی). (ب) همانطور که با مستطیل قرمز مشخص شده است، نتایج حاصل از همبستگی جزئی که در آن ضریب همبستگی محصول- لحظه پیرسون بین متغیر وابسته و مستقل برای در نظر گرفتن متغیر(های) کنترل، تنظیم شده است.
توجه: همیشه میتوانید قسمت اول جدول Correlations را که حاوی ضرایب همبستگی حاصلضرب-گشتاور پیرسون برای همه متغیرهای شماست، شناسایی کنید، زیرا در ستون سمت چپ جدول با برچسب none-a مشخص میشود. این ها به عنوان همبستگی های مرتبه صفر نیز شناخته می شوند. بخش دوم جدول، که نتایج همبستگی جزئی را ارائه میکند، حاوی برچسب متغیر کنترل (در مثال ما، “Age”) در ستون سمت چپ است.
نتایج همبستگی جزئی که توسط مستطیل قرمز برجسته شده است نشان می دهد که بین متغیر وابسته “VO2max” و متغیر مستقل “Weight” همبستگی جزئی متوسط و منفی وجود دارد، در حالی که “Age” را کنترل می کند که از نظر آماری معنی دار است (r(97) = -.314, n = 100, p = .002). با این حال، همانطور که توسط مستطیل آبی مشخص شده است، وقتی به همبستگی لحظه-محصول پیرسون (که به همبستگی مرتبه صفر نیز معروف است) بین “VO2max” و “Weight” اشاره می کنیم، بدون اینکه “Age” را کنترل کنیم، می بینیم که همچنین در آنجا یک همبستگی آماری معنی دار، متوسط و منفی بین “VO2max” و”Weight” وجود دارد (r(98) = -.307, n = 100, p = .002). این نشان می دهد که “Age” تاثیر بسیار کمی در کنترل رابطه بین “VO2max” و “وزن” داشته است.
گزارش نتایج یک همبستگی جزئی
در مثال بالا، ممکن است نتایج را به صورت زیر ارائه کنید:
یک همبستگی جزئی برای تعیین رابطه بین VO2max و وزن یک فرد در حالی که سن کنترل میشد، اجرا شد. بین حداکثر VO2max (43.63 ± 8.57 میلی لیتر / دقیقه / کیلوگرم) و وزن (15.09 ± 79.66 کیلوگرم) در حالی که برای سن (9.1 ± 31.1 سال) همبستگی متوسط و منفی وجود داشت (9.1 ± 31.1 سال) که از نظر آماری معنی دار بود (r(97) = -.314, N = 100, p = .002). با این حال، همبستگی های مرتبه صفر نشان داد که یک همبستگی آماری معنی دار، متوسط و منفی بین VO2max و وزن وجود دارد (r(98) = -.307, n = 100, p < .002)، که نشان می دهد سن تأثیر بسیار کمی در کنترل رابطه بین VO2max و وزن دارد.
مطالب زیر را هم از دست ندهید:
گامای گودمن و کروسکال (Goodman and Kruskal’s gamma) با استفاده از SPSS
آزمون H کروسکال-والیس (H Kruskal-Wallis) با استفاده از Stata
آنالیز اجزای اصلی (PCA) با استفاده از SPSS
آزمون مربع کای (Chi-Square) با استفاده از SPSS
آزمون یو من ویتنی (Mann-Whitney U) با استفاده از SPSS
آزمون مک نمار (McNemar’s test) با استفاده از SPSS
تعدیل کننده دو وضعیتی (Dichotomous Moderator) با استفاده از SPSS
ضریب همبستگی تاوی- بی کندال (Kendall’s Tau-b correlation coefficient) با استفاده از SPSS
آزمون Jonckheere-Terpstra (جانكهير ترپسترا) با استفاده از SPSS
آزمون رتبه علامتدار ویلکاکسون (Wilcoxon signed-rank test) با استفاده از SPSS
آزمون Q کوکران (Cochran’s Q) با استفاده از SPSS
دی سامرز (Somers’ d) با استفاده از SPSS
آزمون t وابسته با استفاده از SPSS Statistics
آزمون t وابسته برای نمونه های جفت شده
آزمون t نمونه تکی با استفاده از SPSS Statistics
کتاب سنجی (Bibliometrics) و تفاوت آن با علم سنجی (Scientometrics) و اطلاع سنجی (Informetrics)
Afshin Safaee (@afshinsafaee.official)
یک پاسخ