همبستگی جزئی (Partial Correlation) با استفاده از SPSS

پری کرمی
بهمن 23, 1401
یک دیدگاه

همبستگی جزئی با استفاده از SPSS Statistics

معرفی

همبستگی جزئی (Partial Correlation) معیاری از قدرت و جهت یک رابطه خطی بین دو متغیر پیوسته در حالی که اثر یک یا چند متغیر پیوسته دیگر را کنترل می‌کند، است. در اینجا، متغیرهای پیوسته به عنوان متغیرهای “متغیرهای کمکی” یا “کنترل” نیز شناخته می‌شود. همبستگی جزئی تفاوتی بین متغیرهای مستقل و وابسته ایجاد نمی کند، با اینحال این دو متغیر اغلب به این صورت در نظر گرفته می شوند. به عنوان مثال، شما یک متغیر وابسته پیوسته و یک متغیر مستقل پیوسته و همچنین یک یا چند متغیر کنترل پیوسته دارید.

توجه: بسیاری از جنبه‌های همبستگی جزئی را می‌توان با استفاده از رگرسیون چندگانه مورد بررسی قرار داد و گاهی توصیه می‌شود که به این روش به آنالیز خود را انجام دهید. شما می توانید همبستگی جزئی را در SPSS Statistics با استفاده از دو روش مختلف همبستگی و رگرسیون انجام دهید.

به عنوان مثال، می توانید از همبستگی جزئی برای درک اینکه در حالی که سرعت باد و رطوبت نسبی را کنترل می کنید، آیا یک رابطه خطی بین عملکرد دویدن 10 کیلومتری و VO₂max (حداکثر ظرفیت هوازی) وجود دارد یا نه؟. در اینجا متغیر وابسته پیوسته عملکرد دویدن 10 کیلومتری خواهد بود که با دقیقه و ثانیه اندازه گیری می شود. همچنین متغیر مستقل پیوسته VO₂max خواهد بود که بر حسب میلی لیتر/دقیقه/کیلوگرم اندازه گیری می شود. دو متغیر کنترلی – یعنی دو متغیر مستقل پیوسته دیگر که برای آن ها تنظیم می کنید “سرعت باد” (که بر حسب مایل در ساعت اندازه گیری می شود) و “رطوبت نسبی” (به صورت درصد بیان می شود) خواهد بود. در این مثال شما بر این باور هستید که بین عملکرد دویدن 10 کیلومتری و VO₂max رابطه ای وجود دارد. یعنی هر چه VO₂max یک ورزشکار بزرگتر باشد، عملکرد دویدن آنها بهتر است. اما دوست دارید بدانید که آیا این رابطه تحت تأثیر سرعت و رطوبت باد قرار می گیرد یا نه. یعنی، ممکن است عملکرد ورزشکاران در شرایط باد و رطوبت بیشتر، کاهش می یابد.

این آموزش به شما نشان می دهد که چگونه با استفاده از SPSS Statistics یک همبستگی جزئی انجام دهید و همچنین نتایج این آزمون را تفسیر و گزارش کنید. با این حال، قبل از اینکه شما را با این روش آشنا کنیم، باید فرضیات مختلفی را که داده های شما باید رعایت کنند تا یک همبستگی جزئی به شما نتیجه معتبری بدهد، بدانید. در ادامه به این فرضیات می پردازیم.

فرضیات

هنگامی که تصمیم می گیرید داده های خود را با استفاده از همبستگی جزئی آنالیز کنید، ابتدا باید مطمئن شوید که آیا داده های شما واقعاً می توانند با استفاده از همبستگی جزئی آنالیز شوند یا نه؟. شما باید این کار را انجام دهید. زیرا تنها زمانی استفاده از همبستگی جزئی مناسب است که داده های شما از پنج فرضی که برای ارائه یک نتیجه معتبر لازم است، عبور کند. در عمل، بررسی این پنج فرض فقط کمی زمان بر خواهد بود. با اینحال کار سختی نیست.

فرض شماره 1:

شما یک متغیر وابسته و یک متغیر مستقل دارید که هر دو در یک مقیاس پیوسته اندازه گیری می شوند. یعنی در مقیاس فاصله ای (interval) یا نسبتی (ratio) اندازه گیری می شوند. نمونه‌هایی از متغیرهای پیوسته عبارتند از: زمان (اندازه‌گیری شده بر حسب ساعت)، هوش (اندازه‌گیری شده با استفاده از امتیاز IQ)، نمره امتحان (اندازه‌گیری شده از 0 تا 20)، وزن (اندازه‌گیری شده بر حسب کیلوگرم)، دما (اندازه‌گیری شده بر حسب درجه سانتی‌گراد) و غیره.

فرض شماره 2:

شما یک یا چند متغیر کنترلی دارید که به عنوان متغیرهای کمکی نیز شناخته می شوند. یعنی متغیرهای کنترل فقط متغیرهایی هستند که شما از آنها برای تنظیم رابطه بین دو متغیر وابسته و مستقل استفاده می کنید. این متغیرهای کنترلی نیز در مقیاس پیوسته اندازه گیری می شوند و متغیرهای پیوسته هستند.

فرض شماره 3:

باید یک رابطه خطی بین هر سه متغیر وجود داشته باشد. یعنی همه جفت متغیرها باید یک رابطه خطی نشان دهند. این اغلب به صورت بررسی چشمی یک نمودار نقطه ای یا پراکندگی (Scatterplot) انجام می شود.

فرض شماره 4:

نباید نقاط پرت (outliers) قابل توجهی وجود داشته باشد. نقاط پرت، داده هایی هستند که از الگوی نرمال پیروی نمی کنند. همبستگی جزئی به نقاط پرت حساس است، که می تواند تأثیر بسیار زیادی روی خط تناسب و ضریب همبستگی داشته باشد و منجر به نتیجه گیری نادرست در مورد داده های شما شود. بنابراین، بهترین کار این است که هیچ نقطه‌ای وجود نداشته باشد یا به حداقل برسد.

فرض شماره 5:

متغیرهای شما باید تقریباً به طور نرمال توزیع شوند. برای ارزیابی اهمیت آماری همبستگی جزئی، باید نرمال بودن دو متغیره را برای هر جفت متغیر داشته باشید. با این حال ارزیابی این فرض کمی دشوار است. برای همین روش ساده‌تری مورد استفاده قرار می‌گیرد، که در آن آن توزیع برای هر متغیر به‌صورت جداگانه آزمایش و بررسی می‌شود. این بررسی را می توان با استفاده از آزمون نرمال بودن Shapiro-Wilk آزمایش کرد.

با استفاده از SPSS Statistics می توانید فرضیات #3، #4 و #5 را بررسی کنید. به یاد داشته باشید که اگر آزمون های آماری را بر اساس این فرضیات به درستی اجرا نکنید، نتایجی که هنگام اجرای یک همبستگی جزئی به دست می آورید ممکن است معتبر نباشند.

در بخش بعدی ما روش SPSS Statistics را برای انجام یک همبستگی جزئی با فرض اینکه هیچ فرضی نقض نشده است، نشان می‌دهیم. ابتدا، مثالی را که برای توضیح روش همبستگی جزئی در SPSS Statistics استفاده کرده ایم، را ارائه می‌کنیم.

مثال و تنظیمات در SPSS Statistics

یک محقق می خواهد بداند که آیا رابطه خطی معنی داری بین VO₂max (حداکثر ظرفیت هوازی) و وزن فرد وجود دارد یا خیر. علاوه بر این، محقق می‌خواهد بداند که آیا این رابطه پس از محاسبه سن فرد همچنان باقی می‌ماند یا نه؟. یعنی آیا این رابطه تحت تأثیر سن فرد می باشد یا نه؟. بنابراین، محقق از همبستگی جزئی برای تعیین وجود یک رابطه خطی بین VO₂max و وزن، استفاده می‌کند، در حالی که سن را کنترل می‌کند. در این مثال، متغیر وابسته پیوسته “VO₂max” است، که بر حسب میلی‌لیتر/دقیقه/کیلوگرم اندازه‌گیری می‌شود، متغیر مستقل پیوسته وزن است، که بر حسب کیلوگرم اندازه گیری می شود، و متغیر کنترل (یعنی متغیر مستقل پیوسته اضافی که محقق برای آن تنظیم می کند) «سن» است که بر حسب سال اندازه گیری می شود.

در SPSS Statistics، سه متغیر ایجاد شد تا بتوان داده ها را وارد کرد:

(1) VO₂max (یعنی VO₂max فرد، اندازه گیری شده بر حسب میلی لیتر/دقیقه/کیلوگرم)

(2) weight (یعنی وزن فرد، بر حسب کیلوگرم)

(3) age (یعنی، سن فرد، بر حسب سال اندازه گیری می شود).

توجه: این یک مثال ساده از همبستگی جزئی با یک متغیر کنترل پیوسته است، اما می توانید چندین متغیر کنترل را در آنالیز خود بگنجانید.

روش آزمون در SPSS Statistics

روش 6 مرحله ای Correlate > Partial زیر به شما نشان می دهد که چگونه داده های خود را با استفاده از همبستگی جزئی در SPSS Statistics آنالیز کنید. البته به شرطی که، هیچ یک از پنج فرض در بخش قبل بیان گردید، نقض نشده باشد. در پایان این شش مرحله، نحوه تفسیر نتایج این آزمون را به شما نشان می دهیم.

توجه: در این مثال به شما نشان می دهیم که چگونه از روش Correlate که بسیار ساده است، در SPSS Statistics استفاده کنید. اما امکان استفاده از روش Regression نیز وجود دارد که دارای چندین مزیت است. با این حال در این آموزش فقط به روش ساده ی Correlate بسنده می کنیم.

مرحله (1)

همانطور که در زیر نشان داده شده است، روی

Analyze > Correlate > Partial…

در منوی اصلی کلیک کنید:

با صفحه Partial Correlations زیر روبرو خواهید شد:

مرحله (2)

متغیرهای weight و VO₂max را به کادر Variables و age را به کادر Controlling for با کشیدن و رها کردن یا با کلیک کردن روی دکمه‌های فلش مربوطه منتقل کنید. در نهایت با صفحه‌ای مشابه تصویر زیر مواجه خواهید شد:

مرحله (3)

بر روی دکمه Options کلیک کنید. با صفحه Partial Correlations: Options زیر روبرو خواهید شد:

مرحله (4)

همانطور که در زیر نشان داده شده است، چک باکس های Means and standard deviations و Zero-order correlations را در ناحیه –Statistics– علامت بزنید:

مرحله (5)

بر روی دکمه Continue کلیک کنید.

مرحله (6)

بر روی دکمه OK کلیک کنید، تا خروجی تولید شود.

تفسیر نتایج یک همبستگی جزئی

SPSS Statistics دو جدول برای یک همبستگی جزئی بر اساس روشی که در بخش قبل اجرا کردید ایجاد می کند. اگر داده‌های شما تمام فرضیات همبستگی جزئی را که قبلاً در بخش قبل توضیح داده‌ایم، رعایت کنند، این نتایج صحیح خواهند بود. با این حال، در این آموزش، ما تنها بر نتایج حاصل از روش همبستگی جزئی تمرکز می‌کنیم، با این فرض که داده‌های شما تمام فرضیات مربوطه را برآورده می‌کنند. در پنجره IBM SPSS Statistics Viewer، جداول Descriptive Statistics و Correlations به شما نمایش داده می شود. همانطور که در زیر نشان داده شده است، ما پیشنهاد می کنیم که ابتدا با جدول Descriptive Statistics داده های خود را بررسی کنید:

(1) جدول Descriptive Statistics (آمار توصیفی) نشان می‌دهد که ما هیچ داده ی گمشده ای (missing data) نداریم. زیرا حجم نمونه ثبت‌شده، 100=N، برابر با تعداد شرکت‌کنندگانی است که در مطالعه شرکت کردند. همچنین در جدول می‌توانیم ببینیم که مقدار میانگین متغیر وابسته، VO₂max، 43.63 میلی لیتر / دقیقه / کیلوگرم (با انحراف معیار 8.57 میلی لیتر / دقیقه / کیلوگرم)، در حالی که میانگین Weight وزن شرکت‌کنندگان 79.7 کیلوگرم (با انحراف معیار 15.1 کیلوگرم) بود. در نهایت Age میانگین سنی شرکت کنندگان، 31.1 سال (با انحراف معیار 9.1 سال) بود. نتایج نشان می‌دهد که نمونه شرکت‌کنندگان به‌جای نشان‌دادن کل جمعیت، کمی در سمت جوان‌تر بودند، که دانستن آن وقتی در مورد تعمیم پذیری یافته ها (generalizability of the findings) در گزارش خود بحث می کنید، مفید است.

همانطور که در زیر نشان داده شده است، در مرحله بعد، پیشنهاد می کنیم به جدول Correlations نگاه کنید:

(2) جدول Correlations (همبستگی ها) به دو بخش اصلی تقسیم می شود: (الف) همانطور که با مستطیل آبی مشخص شده است، ضرایب همبستگی حاصل‌ضرب-گشتاور پیرسون (Pearson product-moment correlation) برای همه متغیرهای شما (یعنی متغیر وابسته، متغیر مستقل و یک یا چند متغیر کنترلی). (ب) همانطور که با مستطیل قرمز مشخص شده است، نتایج حاصل از همبستگی جزئی که در آن ضریب همبستگی محصول- لحظه پیرسون بین متغیر وابسته و مستقل برای در نظر گرفتن متغیر(های) کنترل، تنظیم شده است.

توجه: همیشه می‌توانید قسمت اول جدول Correlations را که حاوی ضرایب همبستگی حاصل‌ضرب-گشتاور پیرسون برای همه متغیرهای شماست، شناسایی کنید، زیرا در ستون سمت چپ جدول با برچسب none-^a مشخص می‌شود. این ها به عنوان همبستگی های مرتبه صفر نیز شناخته می شوند. بخش دوم جدول، که نتایج همبستگی جزئی را ارائه می‌کند، حاوی برچسب متغیر کنترل (در مثال ما، “Age”) در ستون سمت چپ است.

نتایج همبستگی جزئی که توسط مستطیل قرمز برجسته شده است نشان می دهد که بین متغیر وابسته “VO₂max” و متغیر مستقل “Weight” همبستگی جزئی متوسط و منفی وجود دارد، در حالی که “Age” را کنترل می کند که از نظر آماری معنی دار است (r(97) = -.314, n = 100, p = .002). با این حال، همانطور که توسط مستطیل آبی مشخص شده است، وقتی به همبستگی لحظه-محصول پیرسون (که به همبستگی مرتبه صفر نیز معروف است) بین “VO₂max” و “Weight” اشاره می کنیم، بدون اینکه “Age” را کنترل کنیم، می بینیم که همچنین در آنجا یک همبستگی آماری معنی دار، متوسط و منفی بین “VO₂max” و”Weight” وجود دارد (r(98) = -.307, n = 100, p = .002). این نشان می دهد که “Age” تاثیر بسیار کمی در کنترل رابطه بین “VO₂max” و “وزن” داشته است.

گزارش نتایج یک همبستگی جزئی

در مثال بالا، ممکن است نتایج را به صورت زیر ارائه کنید:

یک همبستگی جزئی برای تعیین رابطه بین VO₂max و وزن یک فرد در حالی که سن کنترل می‌شد، اجرا شد. بین حداکثر VO₂max (43.63 ± 8.57 میلی لیتر / دقیقه / کیلوگرم) و وزن (15.09 ± 79.66 کیلوگرم) در حالی که برای سن (9.1 ± 31.1 سال) همبستگی متوسط و منفی وجود داشت (9.1 ± 31.1 سال) که از نظر آماری معنی دار بود (r(97) = -.314, N = 100, p = .002). با این حال، همبستگی های مرتبه صفر نشان داد که یک همبستگی آماری معنی دار، متوسط و منفی بین VO₂max و وزن وجود دارد (r(98) = -.307, n = 100, p < .002)، که نشان می دهد سن تأثیر بسیار کمی در کنترل رابطه بین VO₂max و وزن دارد.

مطالب زیر را هم از دست ندهید:

گامای گودمن و کروسکال (Goodman and Kruskal’s gamma) با استفاده از SPSS

آزمون H کروسکال-والیس (H Kruskal-Wallis) با استفاده از Stata

آنالیز اجزای اصلی (PCA) با استفاده از SPSS

تحلیل مؤلفه‌های اصلی (PCA)