رگرسیون لجستیک ترتیبی با استفاده از SPSS Statistics
معرفی
رگرسیون لجستیک ترتیبی (Ordinal logistic regression) (اغلب فقط “رگرسیون ترتیبی” نامیده می شود) برای پیش بینی یک متغیر وابسته ترتیبی با توجه به یک یا چند متغیر مستقل استفاده می شود. می توان آن را به عنوان تعمیم رگرسیون خطی چندگانه یا به عنوان تعمیم رگرسیون لجستیک دو جمله ای در نظر گرفت، اما این آموزش بر روی تعمیم رگرسیون لجستیک دو جمله ای تمرکز خواهد کرد. همانند سایر انواع رگرسیون، رگرسیون ترتیبی نیز می تواند از تعاملات بین متغیرهای مستقل برای پیش بینی متغیر وابسته استفاده کند.
برای مثال، میتوانید از رگرسیون ترتیبی استفاده کنید تا تعیین کنید که آیا تعدادی از متغیرهای مستقل، مانند «سن»، «جنس»، «سطح فعالیت بدنی»، میتوانند متغیر وابسته ترتیبی، «چاقی» را پیشبینی کنند یا خیر؟. که در آن چاقی با سه دسته “نرمال”، “اضافه وزن” و “خیلی چاق” اندازه گیری می شود.
با انجام رگرسیون ترتیبی، میتوانید تعیین کنید که کدام یک از متغیرهای مستقل (در صورت وجود) تأثیر آماری معنیداری بر متغیر وابسته شما دارند. همچنین میتوانید تعیین کنید که مدل رگرسیون ترتیبی شما چقدر متغیر وابسته را پیشبینی میکند.
این آموزش به شما نشان می دهد که چگونه با استفاده از SPSS Statistics رگرسیون ترتیبی را انجام دهید و آنچه را که برای تفسیر و گزارش نیاز دارید توضیح دهید. با این حال، قبل از اینکه شما را با این روش آشنا کنیم، باید فرضیات مختلفی را که داده های شما باید رعایت کنند تا رگرسیون ترتیبی به شما یک نتیجه معتبر بدهد، بدانید. در ادامه به این فرضیات می پردازیم.
فرضیات
هنگامی که تصمیم می گیرید داده های خود را با استفاده از رگرسیون ترتیبی تجزیه و تحلیل کنید، باید مطمئن شوید که داده هایی که می خواهید تجزیه و تحلیل کنید واقعاً می توانند با استفاده از رگرسیون ترتیبی تجزیه و تحلیل شوند یا نه. زیرا تنها زمانی استفاده از رگرسیون ترتیبی مناسب است که داده های شما از چهار فرضی که رگرسیون ترتیبی برای به دست آوردن یک نتیجه معتبر لازم دارد، عبور کند. در عمل، بررسی این چهار فرض کمی زمان بر است ولی در کل کار سختی نیست.
فرض شماره 1:
متغیر وابسته شما باید در سطح ترتیبی اندازه گیری شود. به عنوان مثال: موارد لیکرت (Likert items) (مثلاً مقیاس 7 درجهای از «کاملاً موافقم» تا «کاملاً مخالفم»)
فرض شماره 2:
یک یا چند متغیر مستقل که پیوسته، ترتیبی یا طبقه ای (categorical) هستند (شامل متغیرهای دوتایی (dichotomous)). با این حال، متغیرهای مستقل ترتیبی باید به صورت پیوسته یا طبقه ای در نظر گرفته شوند. هنگام اجرای یک رگرسیون لجستیک ترتیبی در SPSS Statistics نمی توان آنها را به عنوان متغیرهای ترتیبی در نظر گرفت. نمونههایی از متغیرهای پیوسته که این معیار را برآورده میکنند شامل سن (اندازهگیری شده بر حسب سال)، زمان (بر حسب ساعت)، درآمد (اندازهگیری شده بر حسب ریال ایران!!!)، هوش (اندازهگیری شده با استفاده از تست IQ)، نمره امتحان (اندازهگیری شده از 0 تا 20)، وزن (بر حسب کیلوگرم) و غیره. نمونه هایی از متغیرهای طبقه ای شامل: جنسیت (به عنوان مثال، 2 گروه: مرد و زن)، قومیت (به عنوان مثال، 3 گروه: قفقازی، آفریقایی آمریکایی و اسپانیایی)، حرفه (به عنوان مثال، 4 گروه: جراح، پزشک، پرستار، دندانپزشک).
فرض شماره 3:
همخطی چندگانه (multicollinearity) وجود ندارد. همخطی چندگانه زمانی اتفاق می افتد که شما دو یا چند متغیر مستقل داشته باشید که همبستگی بالایی با یکدیگر دارند. تعیین اینکه آیا همخطی چندگانه وجود دارد یا خیر، گام مهمی در رگرسیون ترتیبی است. متأسفانه، آزمایش این فرض میتواند مستلزم ایجاد متغیرهای ساختگی (dummy variables) برای متغیرهای طبقه ای شما باشد (به عنوان مثال، متغیرهای ساختگی، متغیرهای جدیدی هستند که بر اساس مقادیر دادههای موجود شما هستند). تعداد متغیرهای ساختگی که باید در SPSS Statistics ایجاد کنید به این بستگی دارد که چند متغیر مستقل طبقه ای دارید و هر یک از این متغیرهای مستقل چند گروه دارد. اگر شما فقط یک متغیر مستقل طبقه ای با سه گروه دارید فقط باید دو متغیر ساختگی ایجاد کنید. با این حال، اگر چندین متغیر مستقل طبقه ای دارید که هر کدام دارای سه یا چند گروه هستند، باید تعداد زیادی از این متغیرهای ساختگی را ایجاد کنید.
فرض شماره 4:
شما شانس و یا بخت های متناسب (proportional odds) دارید که یک فرض اساسی این نوع مدل رگرسیون ترتیبی است. یعنی نوع رگرسیون ترتیبی که در این آموزش استفاده می کنیم (یعنی رگرسیون ترتیبی شانس تجمعی با شانس متناسب (cumulative odds ordinal regression with proportional odds)). فرض شانس متناسب به این معنی است که هر متغیر مستقل در هر تقسیم تجمعی متغیر وابسته ترتیبی اثر یکسانی دارد. در SPSS Statistics با استفاده از آزمون نسبت درست نمایی کامل که مدل مکان تناسب را با مدلی با پارامترهای مکان متفاوت مقایسه میکند، آزمایش میشود. در حالی که این می تواند کمی پیچیده به نظر برسد، ما آن را در راهنمای رگرسیون ترتیبی پیشرفته خود توضیح می دهیم. تنها مشکل این آزمون این است که میتواند نقضهایی را که وجود ندارند علامتگذاری کند. بنابراین ما به شما نشان میدهیم که چگونه رگرسیونهای لجستیک دوجملهای جداگانه را روی متغیرهای وابسته دوگانه تجمعی اجرا کنید تا مشخص شود آیا این فرض برآورده شده است یا خیر.
با استفاده از SPSS Statistics می توانید فرضیات شماره 3 و 4 را بررسی کنید. قبل از اینکه به فرضیات شماره 3 و 4 بروید، ابتدا باید فرضیات شماره 1 و 2 بررسی شوند. ما پیشنهاد می کنیم این فرضیات را با این ترتیب آزمایش کنید، زیرا نشان دهنده ترتیبی است که در آن، اگر نقض این فرض قابل اصلاح نباشد، دیگر نمی توانید از رگرسیون ترتیبی استفاده کنید. فقط به یاد داشته باشید که اگر آزمون های آماری را بر اساس این فرضیات به درستی اجرا نکنید، نتایجی که هنگام اجرای رگرسیون ترتیبی به دست می آورید ممکن است معتبر نباشند.
در بخش بعدی، روش SPSS Statistics را برای انجام یک رگرسیون ترتیبی با فرض اینکه هیچ فرض گفته شده در بالا نقض نشده است، نشان میدهیم. ابتدا مثالی را که در این آموزش استفاده شده معرفی می کنیم.
مثال
گرفتن مالیات در بسیاری از افراد با واکنشهای قوی و متفاوتی همراه است. به عنوان مثال برخی فکر میکنند مالیات گرفته شده خیلی زیاد است، در حالی که برخی فکر میکنند که باید بیشتر از این هم گرفته شود. یک محقق یک مطالعه ساده انجام داد و به شرکت کنندگان این جمله را گفتند: “مالیات در این کشور خیلی زیاد است” و از آنها پرسیده که چقدر با این جمله موافق هستند. آنها چهار گزینه برای پاسخ دادن داشتند: «کاملاً مخالفم»، «مخالفم»، «موافقم» یا «کاملاً موافقم». این پاسخ های مرتب شده، دسته های متغیر وابسته، tax_too_high بودند. محقق از شرکت کنندگان تعدادی سؤال ساده پرسید، از جمله اینکه آیا آنها صاحب کسب و کار خود هستند (biz_owner)، سن آنها (age) و آخرین بار به کدام حزب سیاسی رأی داده اند (politics). محقق مایل است که رابطه بین متغیر مستقل -biz_owner، age و politic و متغیر وابسته، tax_too_high را بداند.
توجه: در یک نمونه از نظام سیاسی سه حزب سیاسی اصلی داریم که به موجب آن لیبرال دموکرات ها (Liberal Democrats) و حذب کارگر (Labour) طرفدار مالیات های بالا و محافظه کاران (Conservatives) طرفدار مالیات های پایین تر هستند .
تنظیمات در SPSS Statistics
در SPSS Statistics، چهار متغیر ایجاد کردیم: (1) متغیر وابسته tax_too_high، که دارای چهار دسته مرتب شده است: “کاملاً مخالفم”، “مخالفم”، “موافقم” و “کاملاً موافقم” (Strongly Disagree، Disagree، Agree و Strongly Agree). (2) متغیر مستقل biz_owner که دارای دو دسته است: “بله” و “خیر”. (Yes و No) (3) متغیر مستقل، politic، که دارای سه دسته است: “Con”، “Lab” و “Lib” (یعنی بازتاب لیبرال دموکرات ها (Liberal Democrats) و حذب کارگر (Labour) و محافظه کاران (Conservatives)). و (4) متغیر مستقل، age، که سن شرکت کنندگان است.
توجه: در روش های SPSS Statistics که می خواهید اجرا کنید، باید متغیرها را به متغیرهای کمکی و فاکتورها جدا کنید. برای این روش های خاص، SPSS Statistics متغیرهای مستقل پیوسته را به عنوان متغیرهای کمکی و متغیرهای مستقل طبقه ای را به عنوان فاکتورها طبقه بندی می کند. بنابراین، age به عنوان یک متغیر و politic و biz_owner به عنوان فاکتور در نظر گرفته میشوند.
روش آزمون در SPSS Statistics
در SPSS Statistics، یک رگرسیون ترتیبی را می توان با استفاده از یکی از دو روش PLUM و یا GENLIN انجام داد. روش GENLIN چندین مزیت نسبت به PLUM دارد، از جمله اجرای آسانتر و سریعتر، با این حال تنها در صورتی در دسترس است که ماژول پیشرفته (Advanced Module) SPSS Statistics را داشته باشید. بنابراین، در این آموزش بر دستور PLUM تمرکز میکنیم.
علاوه بر این، بیش از یک نوع رگرسیون ترتیبی وجود دارد که می تواند برای تجزیه و تحلیل متغیرهای وابسته ترتیبی استفاده شود. برای درک این انواع مختلف، تعریف یک متغیر ترتیبی را به عنوان یک متغیر طبقه ای با دسته های مرتب شده در نظر بگیرید. به عنوان مثال، متغیر وابسته، “مالیات خیلی زیاد است”، با چهار دسته “1 = کاملا موافقم”، “2 = موافقم” “، “3 = مخالف” و “4 = کاملاً مخالف”مرتب شده است ؛ سوال مهم این است که «چگونه ترتیب دستهها را در تحلیلهای خود نشان دهیم؟»، زیرا این کاری است که هنگام انجام رگرسیون ترتیبی باید انجام دهید.
به منظور درک ماهیت مرتب این دسته بندی ها، تعدادی از رویکردها بر اساس استفاده از دسته های تجمعی (cumulative)، مجاور (adjacent) یا ادامه ای (continuation) توسعه یافته اند. برای هر یک از این سه رویکرد، مدل های رگرسیون ترتیبی متفاوتی توسعه داده شده است. ما محبوب ترین نوع رگرسیون ترتیبی را به شما نشان می دهیم که به عنوان رگرسیون لجستیک ترتیبی شانس تجمعی با شانس متناسب (cumulative odds ordinal logistic regression with proportional odds) شناخته می شود که از دسته بندی های تجمعی استفاده می کند.
برای انجام رگرسیون ترتیبی در SPSS Statistics، پنج مجموعه روش وجود دارد. تنها روشهایی که در زیر پوشش نمیدهیم، مواردی هستند که برای آزمایش فرضیات شماره 3 و 4 آزمون رگرسیون ترتیبی، مورد نیاز هستند (به بخش فرضیات مراجعه کنید). قبل از اینکه شما را از طریق هر یک از این پنج مجموعه از روش ها آشنا کنیم، به طور خلاصه به آنچه در زیر آمده است اشاره می کنیم:
روش شماره 1 – کار با OMS:
یکی از اشکالات عمده روش PLUM، این است که تمام خروجی آماری مورد نیاز را تولید نمی کند. به ویژه، ” نسبت شانس” (odds ratios) یا “فاصله اطمینان 95%” آنها را تولید نمی کند. در عوض، log odds را تولید می کند. با این حال، میتوانید به به سیستم دستور دهید تا تفاوتهای log odds را به odds ratio مورد نیازتان تبدیل کند. برای انجام این کار، نحوه استفاده از کنترل پنل سیستم مدیریت خروجی (OMS) را به شما نشان می دهیم. این اساساً اطلاعاتی را که هنگام اجرای روش شماره 2 در زیر نیاز دارید ذخیره می کند، به طوری که می توانید از SPSS Statistics برای محاسبه odds ratio بعدا استفاده کنید (به عنوان مثال، با استفاده از روش های #3، #4 و #5).
روش شماره 2 – اجرای روش PLUM:
روش PLUM در SPSS Statistics برخی از نتایج اصلی را برای تجزیه و تحلیل رگرسیون ترتیبی شما تولید می کند، از جمله احتمالات پیش بینی شده، در میان سایر معیارهای آماری مفیدی که برای تجزیه و تحلیل بعدی به آنها نیاز خواهید داشت.
روش شماره 3 – خروجی تخمین پارامترهای PLUM با استفاده از OMS:
پس از اجرای روش PLUM، باید به کنترل پنل OMS برگردید و SPSS Statistics را دریافت کنید تا فایل حاوی اطلاعات جدول برآورد پارامترها را که در حافظه ذخیره شده است، خروجی بگیرید.
روش شماره 4 – ذخیره فایل جدید ایجاد شده:
با فرض اینکه از روش بالا پیروی کرده اید، نه تنها خروجی را به روش معمول (به عنوان مثال در پنجره Output Viewer) ایجاد کرده اید، بلکه یک فایل داده آماری SPSS جدید نیز ایجاد خواهید کرد. این فایل به طور خودکار ذخیره نمی شود، بنابراین باید قبل از ادامه آن را ذخیره کنید.
روش شماره 5 – ایجاد odds ratios:
پس از ذخیره فایل، باید odds ratios و فاصله اطمینان 95٪ آنها را تولید کنید، که می توانید با استفاده از فایل ذخیره شده از روش شماره 4 این کار را انجام دهید. این نیاز به استفاده از syntax دارد، اما ما به شما نشان می دهیم که چه نحوی را در Syntax Editor کپی کنید.
روش شماره 1 – کار با OMS
دستورالعملهای زیر به شما نشان میدهند که چگونه SPSS Statistics را برای ذخیره اطلاعات جدول برآورد پارامترها در حافظه تنظیم کنید، که بعداً از آن برای تولید «odds ratios» و «فاصلههای اطمینان 95 درصد» آنها استفاده خواهید کرد.
مرحله (1)
همانطور که در زیر نشان داده شده است، روی
Utilities > OMS Control Panel…
در منوی اصلی کلیک کنید:
همانطور که در زیر نشان داده شده است، پنجره ی Output Management System Control Panel نمایش داده می شود:
مرحله (2)
مطابق شکل زیردر کادر Output Types، Command Identifiers و Table Subtypes for Selected Commands به ترتیب، Tables، PLUM و Parameter Estimates را انتخاب کنید:
مرحله (3)
گزینه New dataset را از ناحیه Output Destinations انتخاب کنید و مانند شکل زیر “plum” را در کادر وارد کنید:
مرحله (4)
روی دکمه Add در ناحیه –New Request– کلیک کنید. این کار درخواست را به کادر Requests اضافه می کند، همانطور که در زیر نشان داده شده است:
مرحله (5)
بر روی دکمه OK کلیک کنید. همانطور که در زیر نشان داده شده است، پنجره ی OMS Control Panel: Summary نمایش داده می شود:
مرحله (6)
برای خروج بر روی دکمه OK کلیک کنید.
روش شماره 2 – اجرای روش PLUM
دستورالعمل های زیر به شما نشان می دهد که چگونه روش PLUM را اجرا کنید. برخی از این موارد نیاز به استفاده از syntax دارد، اما ما توضیح می دهیم که چه کاری باید انجام دهید. این مرحله برخی از نتایج اصلی را برای تجزیه و تحلیل رگرسیون ترتیبی شما، از جمله احتمالات پیش بینی شده، در میان سایر معیارهای آماری مفیدی که بعداً در بخش تفسیر و گزارش مورد بحث قرار خواهیم داد، تولید می کند.
مرحله (1)
همانطور که در زیر نشان داده شده است، روی
Analyze > Regression > Ordinal…
در منوی اصلی کلیک کنید:
همانطور که در زیر نشان داده شده است با پنجره ی Ordinal Regression روبرو خواهید شد:
مرحله (2)
با استفاده از دکمه فلش متغیر وابسته ترتیبی – tax_too_high – را به کادر Dependent منتقل کنید. سپس، متغیرهای مستقل طبقهبندی – biz_owner و politics را به کادر Factor(s) و متغیر مستقل پیوسته age را به کادر Covariate(s) منتقل کنید. در نهایت با صفحه ای شبیه به صفحه زیر مواجه خواهید شد:
توضیح: رگرسیون ترتیبی می تواند متغیرهای مستقلی را بپذیرد که اسمی، ترتیبی یا پیوسته هستند، اگرچه متغیرهای مستقل ترتیبی باید به عنوان متغیرهای اسمی یا پیوسته در نظر گرفته شوند. در پنجره ی Ordinal Regression، متغیرهای اسمی مستقل به کادر Factor(s) و متغیرهای پیوسته مستقل به کادر Covariate(ها) منتقل می شوند. بسته به اینکه میخواهید با متغیر ترتیبی چگونه رفتار شود، میتوانید یک متغیر مستقل ترتیبی را به کادر Factor(s) یا Covariate(s) منتقل کنید. با این حال، این تصمیمی است که باید بگیرید.
مرحله (3)
بر روی دکمه Options کلیک کنید و مطابق شکل زیر با پنجره ی Ordinal Regression: Options روبرو خواهید شد:
توجه: بعید است که شما به تغییر هر یک از گزینه های موجود در پنجره ی Ordinal Regression گزینه های نشان داده شده در بالا نیاز داشته باشید. در واقع، در این مثال شما چیزی را تغییر نخواهید داد. با این حال، اگر میخواهید فواصل اطمینان (فاصله اطمینان: کادر) را از 95% تغییر دهید یا نوع عملکرد پیوند (Link) را تغییر دهید، میتوانید این کار را در اینجا انجام دهید.
مرحله (4)
بر روی دکمه Continue کلیک کنید و به پنجره ی Ordinal Regression باز می گردید.
مرحله (5)
بر روی دکمه OutPut کلیک کنید و مطابق شکل زیر با پنجره ی Ordinal Regression: Output روبرو خواهید شد:
مرحله (6)
علاوه بر گزینههایی که قبلاً انتخاب شدهاند، Test of parallel linesرا در ناحیه –Display– انتخاب کنید. همچنین در ناحیه –Saved Variables– هر چهار گزینه Estimated response probabilities، Predicted category، Predicted category probability و Actual category probability را انتخاب کنید. در نهایت با یک صفحه نمایش مشابه زیر روبرو خواهید شد:
نکته 1: هنگامی که شما فقط متغیرهای مستقل طبقه ای دارید، ممکن است بخواهید گزینه Cell information را نیز انتخاب کنید. با این حال، به عنوان یک قاعده کلی، هنگامی که شما متغیرهای مستقل پیوسته در مدل دارید (مانند این مثال) گزینه Cell information چندان کاربردی نیست.
نکته 2: نگه داشتن گزینه پیشفرض Including multinomial constant انتخاب شده در ناحیه –Print Log-Likelihood– منجر به تولید FULL log-likelihood میشود، در حالی که گزینه Excluding multinomial constant منجر به تولید KERNAL of the log-likelihood میشود. این بر ارزش log-likelihood تأثیر می گذارد، اما بر نتیجه گیری تأثیر نمی گذارد.
مرحله (7)
بر روی دکمه Continue کلیک کنید و به پنجره ی Ordinal Regression باز می گردید.
مرحله (8)
روی دکمه Location کلیک کنید. همانطور که در زیر نشان داده شده است، پنجره ی Ordinal Regression: Location نمایش داده می شود:
اینجاست که می توانید مدل خود را مشخص کنید. اگر مدلی دارید که شامل هر متغیری است که در پنجره ی Ordinal Regression وارد کرده اید و هیچ گونه تعاملی ندارید، نیازی به تغییر چیزی در این پنجره ی ندارید. بنابراین، در مثال ما، شما نیازی به ایجاد هیچ تغییری ندارید.
مرحله (9)
بر روی دکمه Continue کلیک کنید و به پنجره ی Ordinal Regression باز می گردید.
مرحله (10)
بر روی دکمه Paste کلیک کنید، که Syntax Editor را مانند شکل زیر باز می کند:
مرحله (11)
برای متغیر مستقل طبقهبندی با سه یا چند دسته (یعنی متغیر politics)، کد زیر را به انتهای syntax اضافه کنید، اما درست قبل از نقطه (full stop):
توجه: دستور اضافی نشان داده شده در بالا برای ارائه یک آزمون کلی از اهمیت آماری برای هر متغیر مستقل طبقهبندی با سه یا چند گروه مورد نیاز است. اگر هیچ متغیر مستقل طبقهبندیای ندارید که بیش از دو گروه داشته باشد، میتوانید این مرحله را رد کرده و به مرحله 12 زیر بروید.
مرحله (12)
مطابق شکل زیر روی
Run > All
در منوی اصلی کلیک کنید. این باعث تولید خروجی می شود.
روش شماره 3 – خروجی تخمین پارامترهای PLUM با استفاده از OMS
اکنون که روش PLUM را اجرا کرده اید، می توانید به کنترل پنل OMS برگردید و SPSS Statistics را دریافت کنید تا فایل حاوی اطلاعات جدول برآورد پارامترها را که در حافظه ذخیره شده است، خروجی بگیرد.
مرحله (1)
همانطور که در زیر نشان داده شده است، روی
Utilities > OMS Control Panel…
در منوی اصلی کلیک کنید:
همانطور که در زیر نشان داده شده است، با درخواست انتخابی قبلی، پنجره ی Output Management System Control Panel به شما نمایش داده می شود:
مرحله (2)
روی دکمه End All کلیک کنید. همانطور که در زیر مشخص شده است، ستون Status (وضعیت) به “end” در کادر Requests تغییر می کند:
مرحله (3)
بر روی دکمه OK کلیک کنید. همانطور که در زیر نشان داده شده است، پنجره ی OMS Control Panel: Summary نمایش داده می شود:
مرحله (4)
برای خروج بر روی دکمه OK کلیک کنید.
روش شماره 4- ذخیره فایل تازه ایجاد شده
اگر روش بالا را دنبال کرده باشید، نه تنها خروجی را به روش معمول (یعنی در پنجره Output Viewer) تولید خواهید کرد، بلکه یک فایل داده SPSS Statistics جدید نیز ایجاد خواهید کرد، همانطور که در زیر نشان داده شده است:
این فایل حاوی odds ratios و فاصله اطمینان 95% آنها است، اما در حال حاضر ذخیره نشده است. بنابراین فایل را با نام دلخواه با کلیک بر روی File > Save As… در منوی اصلی ذخیره کنید (در این آموزش به صورت plum.sav ذخیره شده است).
اکنون که فایل را ذخیره کرده اید، می توانید odds ratios را به فایل اضافه کنید.
روش شماره 5 – ایجاد odds ratios
دستورالعمل های زیر را برای ایجاد odds ratios دنبال کنید:
مرحله (1)
مانند شکل زیر روی
File > New > Syntax
در منوی اصلی کلیک کنید:
پنجره IBM SPSS Statistics Statistics Syntax Editor مانند شکل زیر به شما نمایش داده می شود:
مرحله (2)
مطمئن شوید که با مجموعه داده صحیح کار می کنید. میتوانید این کار را با تأیید اینکه نام داخل پرانتز پس از نام فایل plum.sav در پنجره IBM SPSS Statistics Statistics Data Editor، همان نامی است که برای گزینه Active در پنجره IBM SPSS Statistics Statistics Syntax Editor انتخاب شده است، انجام دهید، همانطور که در زیر مشخص شده است. :
توجه: اگرچه نام مجموعه داده بالا “DataSet2” است، اما ممکن است نام شما متفاوت باشد. تا زمانی که آنها یکسان باشند، مشکلی ندارد.
مرحله (3)
برای محاسبه odds ratios و فاصله اطمینان 95% آنها در فایل جدید، syntax برجسته شده زیر را کلمه به کلمه در Syntax Editor کپی کنید:
توضیح: این مرحله آخر odds ratios و فاصله اطمینان 95% آنها را از تخمین پارامترها محاسبه می کند و این مقادیر را در متغیرهای جدید در فایل ‘plum’ ذخیره می کند. برای سادهتر شدن، میتوانید کد زیر را برای قسمت آخر کپی و پیست کنید:
COMPUTE Exp_B = EXP(Estimate).
COMPUTE Lower = EXP(LowerBound).
COMPUTE Upper = EXP(UpperBound).
FORMATS Exp_B Lower Upper (F8.3).
EXECUTE.
مرحله (4)
مطابق شکل زیر روی
Run > All
در منوی اصلی کلیک کنید تا خروجی ایجاد شود:
تعدادی ستون اضافی به فایل خود اضافه خواهید کرد که نشان دهنده odds ratios و فاصله اطمینان 95٪ آن است، همانطور که در زیر مشخص شده است:
پس از اجرای هر پنج روش، اکنون باید تمام اطلاعات مورد نیاز برای شروع تفسیر نتایج از رگرسیون ترتیبی خود را داشته باشید.
تفسیر و گزارش خروجی رگرسیون ترتیبی
SPSS Statistics هنگام انجام تجزیه و تحلیل رگرسیون ترتیبی، جداول کمی از خروجی تولید می کند. در زیر به طور خلاصه مراحل اصلی را که باید برای تفسیر نتایج رگرسیون ترتیبی خود دنبال کنید، توضیح می دهیم.
مرحله شماره 1:
شما باید نتایج حاصل از آزمون های فرضی خود را تفسیر کنید تا مطمئن شوید که می توانید از رگرسیون ترتیبی برای تجزیه و تحلیل داده های خود استفاده کنید یا نه. این شامل تجزیه و تحلیل: (الف) رگرسیون خطی چندگانه است که باید برای آزمایش همخطی چندگانه بودن آن را اجرا کنید (فرض شماره 3). و (ب) آزمون نسبت درست نمایی کامل (full likelihood ratio test) که مدل مکان تناسب را با مدلی با پارامترهای مکان متفاوت مقایسه میکند، و همچنین رگرسیونهای لجستیک دوجملهای، که هر دوی آنها باید برای آزمایش شانس متناسب اجرا شود (فرض شماره 4).
مرحله شماره 2:
باید بررسی کنید که آیا مدل رگرسیون ترتیبی شما تناسب کلی دارد یا خیر. این شامل تفسیر خروجی SPSS Statistics از تعدادی آزمون آماری، از جمله آزمون های پیرسون (Pearson) و آزمون انحراف نیکویی تناسب (Deviance goodness-of-fit)، اندازه گیری های کاکس (Cox) و اسنل (Snell)، ناگلکرکه (Nagelkerke) و اندازه گیری های R2 مک فادن (McFadden) و آزمون نسبت احتمال (likelihood-rati) است.
مرحله شماره 3:
باید تعیین کنید که کدام یک از متغیرهای مستقل شما (در صورت وجود) تأثیر آماری معناداری بر متغیر وابسته شما دارند.
مرحله شماره 4-الف:
برای متغیرهای مستقل طبقه ای (که 3 گروه برای مثال بالا دارد: «محافظه کار»، «حزب کارگر» و «لیبرال دموکرات»)، باید شانس را تفسیر کنید. اینکه یک گروه (مثلاً حامیان «محافظهکار») مقدار بالاتر یا پایینتری برای متغیر وابسته شما داشتند (مثلاً، یک مقدار بالاتر میتواند بیانگر این باشد که «کاملاً موافق هستند» که «مالیات خیلی زیاد است» به جای اینکه بگویند «مخالف هستند». “) در مقایسه با گروه دوم (به عنوان مثال، حذب کارگر). به عنوان مثال، می توانید به دنبال بیان جمله ای مانند زیر باشید:
شانس صاحبان مشاغل که مالیات را خیلی بالا در نظر می گیرند 1.944 (95% فاصله اطمینان (CI)، 1.101 تا 3.431) برابر صاحبان غیر کسب و کار بود، که یک اثر آماری معنی دار است:
χ2(1) = 5.255 , p=.022
مرحله شماره 4-ب:
برای متغیرهای مستقل پیوسته (به عنوان مثال، “سن”، که بر حسب سال اندازه گیری می شود)، می توانید تفسیر کنید که یک واحد افزایش یا کاهش در آن متغیر (به عنوان مثال، افزایش یا کاهش یک ساله در سن) چگونه بوده است. احتمال اینکه متغیر وابسته شما دارای مقدار بالاتر یا کمتری باشد (به عنوان مثال، افزایش یک ساله در سن شرکت کنندگان، احتمال اینکه آنها مالیات را خیلی زیاد در نظر بگیرند افزایش می دهد). به عنوان مثال، می توانید به دنبال بیان جمله ای مانند زیر باشید:
افزایش سن (بیان شده بر حسب سال) با افزایش شانس در نظر گرفتن مالیات خیلی بالا همراه بود، با odds ratios: 1.274 (95% فاصله اطمینان (CI)، 1.196 تا 1.357):
χ2(1) = 56.355 , p<.001
مرحله شماره 5:
شما باید تعیین کنید که مدل رگرسیون ترتیبی شما چقدر متغیر وابسته را پیشبینی میکند، که میتوانید با مشاهده احتمالات پیشبینیشده مدل و با ایجاد یک جدول confusion با استفاده از SPSS Statistics انجام دهید.
مطالب زیر را هم از دست ندهید:
رگرسیون چندگانه با استفاده از SPSS
رگرسیون خطی با استفاده از SPSS
ANOVA با اندازه گیری های مکرر با استفاده از SPSS Statistics
آزمون نرمال بودن با استفاده از SPSS Statistics
ANOVA دو طرفه در SPSS Statistics
ANCOVA یک طرفه در SPSS Statistics
ANOVA اندازه گیری های مکرر دو طرفه با استفاده از SPSS Statistics
ANOVA مخلوط با استفاده از SPSS Statistics
انواع متغیر و تحقیقات تجربی و غیر تجربی
آزمون t نمونه تکی با استفاده از SPSS Statistics
چگونه یک نمودار نقطهای متصل به هم در R ایجاد کنیم؟
چند پروژه برای مبتدیان علم داده
نحوه تعیین خودکار تعداد خوشه ها توسط قانون آرنج
هوش مصنوعی (AI) چیست؟ 3 چیز که باید بدانید
تجزیه و تحلیل آماری: تعریف، مثال
چگونه نتایج حاشیه خطا را تفسیر کنیم؟
روایی نتیجه گیری آماری (SCV) چیست؟
تحلیل سئوال روش تحقیق آزمون دکتری
تفاوت بین یادگیری ماشین، علم داده، هوش مصنوعی، یادگیری عمیق و آمار
آمار در مقایسه با یادگیری ماشینی در سیستم های بیولوژیک
Afshin Safaee (@afshinsafaee.official)
15 پاسخ
سلام. من واقعا لذت بردم. واقعا با جزئیات و عالی توضیح دادین. من به کمک این نوشته شما تونستم، پروژم رو انجام بدم. متشکرم ازتون.