ایجاد متغیرهای ساختگی در SPSS Statistics
معرفی
اگر داده های خود را با استفاده از رگرسیون چندگانه تجزیه و تحلیل می کنید و هر یک از متغیرهای مستقل شما در مقیاس اسمی (nominal) یا ترتیبی (ordinal) اندازه گیری شده است، باید بدانید که چگونه متغیرهای ساختگی (dummy variables) ایجاد کنید و نتایج آنها را تفسیر کنید. این به این دلیل است که متغیرهای مستقل اسمی و ترتیبی، که بیشتر به عنوان متغیرهای مستقل طبقهای (categorical independent variables) شناخته می شوند، نمی توانند مستقیماً وارد یک تحلیل رگرسیون چندگانه شوند. در عوض، آنها باید به متغیرهای ساختگی تبدیل شوند. به استثنا متغیرهای مستقل ترتیبی (ordinal independent variables) که به عنوان متغیرهای مستقل پیوسته وارد یک رگرسیون چندگانه می شوند که نیازی به تبدیل آنها به متغیرهای ساختگی نیست. بنابراین، در این آموزش به شما نشان میدهیم که چگونه متغیرهای ساختگی را زمانی که متغیرهای مستقل طبقهای دارید ایجاد کنید.
قبل از توضیح نحوه تنظیم دادههای خود در پنجرههای Variable View و Data View در SPSS Statistics، ابتدا مثالی را که برای نشان دادن نحوه ایجاد متغیرهای ساختگی در SPSS Statistics استفاده میکنیم، ارائه میکنیم تا بتوانید متغیرهای ساختگی ایجاد کنید.
مثال استفاده شده در این آموزش
در این آموزش از 10 سوژه ” ورزشکار سه گانه” (triathletes) استفاده خواهیم کرد. سهگانه یک ورزش ترکیبی است که شرکتکنندگان در آن با انجام سه ورزش شنا، دوچرخه سواری و دویدن در پنج مرحله پی درپی در مسافت ها و محیط های مختلف با یکدیگر رقابت میکنند. از این ورزشکاران خواسته شد ورزش مورد علاقه خود را از بین سه ورزشی که هنگام انجام ورزش سه گانه انجام می دهند (شنا، دوچرخه سواری و دویدن) انتخاب کنند.
پاسخ آنها در متغیر مستقل اسمی favorite_sport ثبت شد که دارای سه دسته swimming «شنا»، cycling «دوچرخه سواری» و running «دویدن» است. این متغیر مستقل اسمی، favorite_sport، قرار بود در یک تحلیل رگرسیون چندگانه که تعدادی متغیر مستقل پیوسته نیز دارد، گنجانده شود. این یک متغیر مستقل طبقه ای (categorical) بود. (یعنی متغیرهای اسمی و متغیرهای ترتیبی را می توان به طور کلی به عنوان “متغیرهای طبقه ای” دسته بندی کرد). بنابراین قبل از اینکه بتوان آن را در تحلیل رگرسیون چندگانه وارد کرد، باید متغیرهای ساختگی ایجاد می شد.
مهم: توجه داشته باشید که favorite_sport یک متغیر اسمی است، اما شما همچنین می توانید متغیرهای ساختگی برای یک متغیر ترتیبی ایجاد کنید. علاوه بر این، فرآیند ایجاد متغیرهای ساختگی صرف نظر از اینکه متغیر ترتیبی یا اسمی دارید، یکسان است، به استثنای یک تغییر کوچک که باید هنگام تنظیم داده های خود ایجاد کنید، که در زیر توضیح داده شده است.
نکته 1: به «دستههای» یک متغیر مستقل طبقه ای، «گروهها» یا «سطوح» نیز گفته میشود، اما اصطلاح «سطوح» معمولاً برای دستههایی که دارای ترتیب هستند به کار می رود. با این حال، این سه اصطلاح – “دسته ها” (categories)، “گروه ها” (groups) و “سطوح” (levels) می توانند به جای یکدیگر استفاده شوند. در این آموزش، ما به آنها به عنوان دسته ها اشاره خواهیم کرد، اما در صورت تمایل می توانید به آنها به عنوان گروه یا سطوح اشاره کنید.
نکته 2: اصطلاح «فاکتور ها» (factors) گاهی به جای «متغیرهای مستقل طبقهای» (یعنی متغیرهای مستقل «ترتیبی» یا «اسمی») استفاده میشود. با این حال، این دو اصطلاح – “متغیرهای مستقل طبقهای” و “فاکتور ها”، می توانند به جای یکدیگر استفاده شوند. در این آموزش، ما به آنها به عنوان متغیرهای مستقل طبقهای اشاره میکنیم و همچنین مشاهده خواهید کرد که SPSS Statistics در روش رگرسیون چندگانه خود بهجای فاکتورها، به متغیرهای مستقل اشاره میکند. با این حال، در صورت تمایل می توانید به آنها به عنوان فاکتور ها اشاره کنید.
تنظیم داده های خود در SPSS Statistics
هنگام ایجاد متغیرهای ساختگی، با یک متغیر مستقل طبقهای (به عنوان مثال، favorite_sport) شروع می کنید. برای تنظیم این متغیر مستقل طبقهای، SPSS Statistics دارای یک Variable View )نمای متغیر) است که در آن انواع متغیری را که در حال تجزیه و تحلیل هستید تعریف می کنید و یک Data View )نمای داده) که در آن داده های خود را برای این متغیر وارد می کنید. در این بخش، قبل از اینکه به شما نشان دهیم که چگونه دادههای خود را در پنجره View Data وارد کنید، ابتدا به شما نشان میدهیم که چگونه یک متغیر مستقل طبقهای را در پنجره View Variable Statistics SPSS تنظیم کنید. ما این کار را با استفاده از متغیر مستقل دسته بندی خود، favorite_sport انجام می دهیم که دارای سه دسته swimming، cycling و running است.
Variable View در SPSS Statistics
با کلیک بر روی تب Variable View در گوشه سمت چپ پایین نرم افزار آماری SPSS می توانید به پنجره Variable View در SPSS Statistics دسترسی داشته باشید. برای یک متغیر مستقل طبقهای (به عنوان مثال، favorite_sport)، پنجره View Variable شما مانند شکل زیر خواهد بود:
نام متغیر مستقل طبقهای شما باید در سلول زیر ستون Name وارد شود (به عنوان مثال، فیلد “favorite_sport” در ردیف 1 برای نشان دادن متغیر مستقل طبقهای). برخی از کاراکترهای “غیرمجاز” وجود دارند که نمی توان آنها را در سلول زیر ستون Name وارد کرد. بنابراین، اگر پیغام خطایی دریافت کردید نام متغیر را تغییر دهید.
توجه: برای وضوح خود، می توانید یک برچسب برای متغیرهای خود در ستون ستون Label نیز ارائه دهید. در این مثال، برچسبی که ما وارد کردیم، ” Triathlete’s favourite sport” بود.
سلول زیر ستون Values باید حاوی اطلاعات مربوط به دستههای متغیر مستقل طبقهای شما باشد (به عنوان مثال، swimming، cycling و running. برای وارد کردن این اطلاعات، روی سلول زیر Values کلیک کنید که ستونی برای متغیر مستقل شما است. دکمه در سلول ظاهر می شود. روی این دکمه کلیک کنید و پنجره ی Value Labels ظاهر می شود. اکنون باید به هر دسته از متغیر مستقل خود یک “مقدار” بدهید. برای این مثال، در کادر Value عدد “1” و در کادر Label برچسب swimming را وارد می کنید. در واقع با این کار “شنا” با عدد 1 کدگذاری شد. با کلیک کردن روی دکمه Add، کدگذاری 1.00= swimming در کادر ظاهر می شود. همین کارها را برای 2.00= cycling و 1.00= running نیز انجام دهید.
اگر یک متغیر مستقل اسمی و یک متغیر مستقل ترتیبی دارید، سلول زیر ستون Measure باید Nominal را نشان دهد. دارید. در نهایت، سلول زیر ستون Role باید None را نشان دهد.
توجه: بهتر است سلول زیر ستون Role را از به
تغییر دهید، اما این تغییر ضروری نیست. ولی پیشنهاد می کنیم این کار را انجام دهید. زیرا تحلیل های خاصی در SPSS Statistics وجود دارد که در آن تنظیمات
باعث می شود که متغیرهای شما به طور خودکار به فیلدهای خاصی از جعبه های گفتگوی مورد استفاده شما منتقل شوند. از آنجایی که ممکن است تمایلی به انتقال این متغیرها نداشته باشید، پیشنهاد می کنیم تنظیمات
را به
تغییر دهید تا این اتفاق به صورت خودکار رخ ندهد.
اکنون با موفقیت تمام اطلاعاتی را که SPSS Statistics باید در مورد متغیر مستقل طبقهای شما بداند در پنجره View Variable وارد کرده اید. در بخش بعدی به شما نشان می دهیم که چگونه داده های خود را در پنجره Data View وارد کنید.
Data View در SPSS Statistics
با کلیک بر روی تب Variable View در پایین سمت چپ نرم افزار آماری SPSS می توانید به پنجره Data View در SPSS Statistics دسترسی پیدا کنید. بر اساس تنظیم فایل در پنجره View Variable برای متغیر مستقل طبقهای شما، پنجره View Data به صورت زیر نمایش داده میشود:
متغیر مستقل طبقهای شما در ستون اول نمایش داده می شود زیرا این ترتیبی بود که متغیر را در پنجره View Variable وارد کردیم. در مثال ما، پاسخ های 10 ورزشکار سه گانه در زیر ستون ورزش مورد علاقه ارائه شده است. اکنون، شما به سادگی باید داده های خود را در سلول های زیر این ستون اول وارد کنید. به یاد داشته باشید که هر ردیف یک مورد را نشان می دهد. بنابراین، مورد اول نشان دهنده ورزشکار سه گانه ای بود که ورزش مورد علاقه اش «شنا» بود. از آنجایی که این سلول ها در ابتدا خالی خواهند بود، باید روی سلول ها کلیک کنید تا داده های خود را وارد کنید. متوجه خواهید شد که وقتی روی سلولهای زیر ستون ورزش مورد علاقه کلیک میکنید، SPSS Statistics به شما یک گزینه کشویی میدهد که دستههای شما قبلاً پر شدهاند.
درک متغیرهای ساختگی و کدگذاری ساختگی
همانطور که در مقدمه ذکر کردیم، اگر داده های خود را با استفاده از رگرسیون چندگانه تجزیه و تحلیل می کنید و هر یک از متغیرهای مستقل شما در مقیاس اسمی یا ترتیبی اندازه گیری شده است، باید بدانید که چگونه متغیرهای ساختگی ایجاد کنید و نتایج آنها را تفسیر کنید. این به این دلیل است که متغیرهای مستقل طبقهای (مثلاً متغیرهای مستقل اسمی و ترتیبی) را نمی توان مستقیماً در یک رگرسیون چندگانه وارد کرد. در عوض، آنها باید به متغیرهای ساختگی تبدیل شوند. به استثنا متغیرهای مستقل ترتیبی هستند که به عنوان متغیرهای مستقل پیوسته وارد یک رگرسیون چندگانه می شوند که نیازی به تبدیل آنها به متغیرهای ساختگی نیست.
تعداد متغیرهای ساختگی که باید ایجاد کنید
تعداد متغیرهای ساختگی که باید ایجاد کنید به این بستگی دارد که متغیر مستقل دسته بندی شما چند دسته دارد. به عنوان یک قاعده کلی، شما یک متغیر ساختگی کمتر از تعداد دستهها در متغیر مستقل طبقهای خود ایجاد میکنید. به عنوان مثال، اگر شما یک متغیر مستقل طبقه ای با سه دسته دارید، دو متغیر ساختگی ایجاد می کنید و یک دسته را انتخاب می کنید تا به عنوان دسته مرجع (reference category) عمل کند. در این مثال favourite_spor، با سه دسته “شنا”، “دوچرخه سواری” و “دویدن” که در آن “شنا” و “دوچرخه سواری” به متغیرهای ساختگی تبدیل می شوند و “دویدن” به دسته مرجع تبدیل می شوند).
بعد از جدول زیر در مورد دستههای مرجع بیشتر توضیح میدهیم که نمونههایی از متغیرهای مستقل طبقهای و تعداد متغیرهای ساختگی را که باید ایجاد شوند ارائه میکند:
جدول: نمونه هایی از متغیرهای مستقل طبقهای و متغیرهای ساختگی مربوط به آنها
تعداد متغیرهای ساختگی | تعداد دسته ها | نوع متغیر | نام متغیر مستقل طبقه بندی | |
یک=مرد
«زن» دسته مرجع است |
دو
(مرد و زن) |
اسمی | جنسیت | 1 |
یک = زیر 180 سانتی متر
“180 سانتی متر و بالاتر” دسته مرجع است |
دو
(کوچکتر-مساوی 180 سانتی متر و بالاتر از آن ) |
ترتیبی | ارتفاع | 2 |
دو = آفریقایی آمریکایی و قفقازی
“اسپانیایی” دسته مرجع است |
سه
(آفریقایی آمریکایی، قفقازی و اسپانیایی) |
اسمی | قومیت | 3 |
دو = کم و متوسط
“بالا” دسته مرجع است |
سه
(کم، متوسط و زیاد) |
ترتیبی | سطح فعالیت بدنی | 4 |
سه = جراح، پزشک و پرستار
«درمانگر» دسته مرجع است |
چهار
(جراح، پزشک، پرستار و درمانگر) |
اسمی | حرفه | 5 |
سه = کاملا موافق، موافق و مخالف
«کاملاً مخالفم» دسته مرجع است |
چهار
(کاملاً موافقم، موافقم، مخالفم، کاملاً مخالفم) |
ترتیبی | سطح موافقت | 6 |
چهار = مطالعات بازرگانی، روانشناسی، علوم زیستی و مهندسی
«قانون» دسته مرجع است |
پنج
(مطالعات بازرگانی، روانشناسی، علوم زیستی، مهندسی و حقوق) |
اسمی | موضوع | 7 |
چهار = زیر 18، 19-30، 31-40 و 41-50
“51-60” رده مرجع است |
پنج
(زیر 18، 19-30، 31-40، 41-50، 51-60) |
ترتیبی | سن | 8 |
همانطور که در جدول بالا نشان داده شده است، شما فقط باید یک متغیر ساختگی کمتر از تعداد دسته ها در متغیر مستقل طبقهای خود ایجاد کنید. این به این دلیل است شما زمانی که یک متغیر مستقل طبقهای دارید فقط باید این تعداد متغیر ساختگی را به یک رگرسیون چندگانه منتقل کنید با این حال، دلایل خوبی برای ایجاد یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقهای وجود دارد: (الف) انعطافپذیرتر است و (ب) امکان مقایسههای متعدد را فراهم میکند. به عبارت دیگر، اگر متغیر مستقل طبقهای شما دارای سه دسته باشد، سه متغیر ساختگی ایجاد کنید، نه فقط دو تا.
خوشبختانه، روش Create Dummy Variables در SPSS Statistics ورژن های 22 تا 28 (و ورژن اشتراک SPSS Statistics) به طور خودکار یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقهای شما ایجاد می کند. با این حال، این مورد برای روش Recode into Different Variables در SPSS Statistics ورژن 21 یا ورژن های قبلی SPSS Statistics صدق نمی کند. بنابراین، در شرایط عادی، بسته به اینکه ورژن 21 یا قبل از آن یا ورژن 22 به بالا را داشته باشید، تنظیمات زیر را در SPSS Statistics ایجاد خواهید کرد:
توجه: همانطور که در بالا ذکر شد، ایجاد یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقهای به دو دلیل سودمند است: (الف) انعطافپذیرتر است و (ب) امکان مقایسههای متعدد را فراهم میکند. در زیر به طور خلاصه به این مزایا می پردازیم:
انعطاف پذیرتر است:
هنگامی که یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقهای خود ایجاد کردید، سپس می توانید هر دسته را به عنوان یک دسته مرجع در نظر بگیرید. در مثال ما، دسته “دویدن” را به عنوان دسته مرجع در نظر گرفتیم، به این معنی که “شنا” و “دوچرخه سواری” را به معادله رگرسیون چندگانه منتقل می کردیم. با این حال، اگر بعداً نظر خود را در مورد انتخاب دسته مرجع تغییر دادید، باید دوباره روش متغیر ساختگی را اجرا کنیمد (مگر اینکه ورژن 22 یا بالاتر SPSS Statistics را داشته باشید). به عنوان مثال، فرض کنید اکنون میخواهیم دسته «دوچرخه سواری» را به عنوان دسته مرجع در نظر بگیریم. اکنون میتوانیم متغیرهای ساختگی “swimming” و “running” را به معادله رگرسیون چندگانه منتقل کنیم زیرا متغیر ساختگی “running” را نیز داریم.
این اجازه می دهد تا چندین مقایسه انجام شود:
ضریب یک متغیر ساختگی نشان دهنده تفاوت بین دسته (که متغیر ساختگی نشان می دهد) و دسته مرجع است. که متغیر ساختگی نشان دهنده آن است. برای مثال، با «دویدن» به عنوان دسته مرجع، ضریب متغیر ساختگی «شنا» نشان دهنده تفاوت در متغیر وابسته بین دستههای «شنا» و «دویدن» است. با استفاده از این روش، ترکیب همه دسته ها امکان پذیر نخواهد بود. بلکه این مشکل با استفاده از دسته های مرجع مختلف قابل حل است. این در صورتی امکان پذیر است که همه دسته های متغیر طبقه ای دارای یک متغیر ساختگی باشند.
نحوه ایجاد متغیرهای ساختگی و کدنویسی ساختگی
دو مرحله برای تنظیم موفقیتآمیز متغیرهای ساختگی در یک رگرسیون چندگانه وجود دارد: (1) متغیرهای ساختگی ایجاد کنید که نشاندهنده دستههای متغیر مستقل طبقهای شما هستند. (2) مقادیری را در این متغیرهای ساختگی (که به عنوان کدگذاری ساختگی شناخته می شوند) وارد کنید تا دسته بندی های متغیر مستقل طبقهای را نشان دهند. ما این فرآیند را در زیر با استفاده از مثالی که در بالا ارائه کردیم توضیح می دهیم.
توضیح: متغیرهای ساختگی صرفاً متغیرهای جدیدی هستند که به عنوان “جایگاه دار” (placeholders) برای یک طرح کدگذاری خاص عمل می کنند. آنها به خودی خود حاوی هیچ داده ای نیستند. در عوض، داده ها/مقدارها باید به این متغیرهای ساختگی اضافه شوند تا بتوانند هدف خود را برای نمایش دسته های متغیر مستقل طبقهای شما محقق کنند. انواع مختلفی از طرح های کدگذاری وجود دارد که مقادیر وارد شده به متغیرهای ساختگی را دیکته می کنند، اما ما از یک طرح کدگذاری بسیار رایج به نام کدگذاری ساختگی یا به طور متناوب، کدگذاری نشانگر استفاده می کنیم (نکته، متغیرهای ساختگی و کدنویسی ساختگی یکسان نیستند). کدگذاری ساختگی با استفاده از هر متغیر ساختگی برای شناسایی یک دسته خاص از یک متغیر مستقل طبقهای به استثنای یک دسته مرجع، که در زیر توضیح می دهیم، کار می کند.
بیایید با در نظر گرفتن متغیر مستقل دسته ای مثال بالا، یعنی favourite_sport شروع کنیم که دارای سه دسته “شنا”، “دوچرخه سواری” و “دویدن” است. از آنجایی که سه دسته وجود دارد، باید دو متغیر ساختگی وجود داشته باشد که دو دسته از دستهها را نشان دهد و یک دسته مرجع که نشان دهنده دسته سوم باشد.
توجه: از بحث بالا به خاطر داشته باشید که یک رگرسیون چندگانه از شما میخواهد که یک متغیر ساختگی کمتر از تعداد دستههای متغیر مستقل طبقهای خود (به عنوان مثال، دو متغیر در مثال ما) منتقل کنید. با این حال، می توانید یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقهای به منظور انعطاف بیشتر و توانایی انجام مقایسه های متعدد ایجاد کنید. با این وجود، در بحث زیر ما فقط آنچه را که برای یک رگرسیون چندگانه لازم است را به شما نشان می دهیم. یعنی ایجاد یک متغیر ساختگی کمتر از تعداد دستهها در متغیر مستقل طبقهای شما با دستهای که مستقیماً نشان داده نمیشود و تبدیل به «دسته مرجع» میشود.
به عنوان مثال، اجازه دهید متغیر ساختگی شماره 1 نشان دهنده دسته “شنا” و متغیر ساختگی شماره 2 نشان دهنده دسته “دوچرخه سواری” باشد. این هیچ متغیر ساختگی برای دسته “دویدن” باقی نمی گذارد. این دسته “مفقود” (missing) دسته مرجع است و نیازی به آن نیست. علاوه بر این، این کاملاً به تصمیم شما بستگی دارد که از کدام دسته به عنوان دسته مرجع استفاده کنید. ما می توانستیم به همین راحتی دسته «شنا» را به عنوان دسته مرجع به جای دسته «دویدن» انتخاب کنیم. تنها دلیلی که ما این کار را نکردیم این است که به طور پیشفرض SPSS Statistics از آخرین دستهای که در Variable View برای متغیر مستقل طبقهای خود کد نویسی کرده اید، به عنوان دسته مرجع استفاده میکند
توجه: همانطور که قبلاً در بخش تنظیم داده توضیح داده شد و همانطور که در زیر در پنجره ی Value Labels نشان داده شده است، دسته سوم و آخر متغیر مستقل طبقهای ما “دویدن” بود (یعنی 3=running).
هیچ دلیلی برای ما وجود نداشت که دسته “دویدن” را به دسته سوم و آخر تبدیل کنیم با این حال SPSS Statistics، به طور پیش فرض آن را به عنوان دسته مرجع انتخاب کرد. ما به سادگی این کار را به این صورت انجام دادیم. زیرا وقتی ورزشکاران سهگانه در مسابقات سهگانه شرکت میکنند، ابتدا شنا میکنند، سپس دوچرخه سواری را انجام میدهند و در نهایت تا خط پایان می دوند. بنابراین منطقی به نظر می رسید که متغیر مستقل طبقهای خود را به این شکل کدگذاری کنیم. با این حال، ما می توانستیم آن را به صورت 1=cycling، 2=running و 3=swimming کدگذاری کنیم. هیچ تفاوتی نمیکرد جز این که به عنوان دسته سوم و آخر، «شنا» بهطور پیشفرض در SPSS Statistics به دسته مرجع ما تبدیل میشد.
هنگامی که متغیرهای ساختگی ایجاد می کنید، باید به آنها یک نام معنادار بدهید. از آنجایی که هر یک از متغیرهای ساختگی ما یک دسته از متغیر مستقل طبقهای ما را نشان می دهد، مرسوم است که به هر متغیر ساختگی با نام دسته ای که نشان می دهد اشاره کنیم. بنابراین، ما متغیر ساختگی شماره 1 را “شنا” نامیده ایم زیرا نشان دهنده دسته شنا است. به طور مشابه، ما متغیر ساختگی شماره 2 را “دوچرخه سواری” نامیده ایم زیرا نشان دهنده دسته دوچرخه سواری است. با ایجاد این دو متغیر ساختگی، مانند شکل زیر، دو ستون جدید در مجموعه داده های خود در SPSS Statistics خواهیم داشت:
اکنون که دو متغیر ساختگی ایجاد کردیم و نامهای مناسبی برای آنها گذاشتهایم، باید مقادیری را در این متغیرها وارد کنیم تا هر متغیر ساختگی واقعاً نشاندهنده دستهبندی متغیر مستقل طبقهای خود باشد. با کدنویسی ساختگی این بسیار ساده است. شما “1” (یک) را برای نشان دادن هر موردی که دارای دسته است وارد می کنید وبرای موردی که دسته را ندارد، “0” (صفر) را وارد می کنید. ابتدا متغیر ساختگی “swimming” را در نظر بگیرید، همانطور که در زیر نشان داده شده است:
اگر یکی از ورزشکاران سه گانه عنوان می کرد که “شنا” ورزش “مورد علاقه” آنها است، برای آن ورزشکار سه گانه که اعلام کرده بود شنا ورزش “مورد علاقه” آنها است، یک عدد “1” را در سلول زیر ستون متغیر ساختگی شنا (ستون شنا) وارد می کنیم. . از طرف دیگر، اگر یکی از ورزشکاران سهگانه بیان میکرد که «دوچرخهسواری» یا «دویدن» ورزش «مورد علاقه» آنها است، برای آن ورزشکار سهگانهای که شنا را بیان کرده بود، علامت «0» را در سلول زیر ستون متغیر ساختگی شنا (ستون شنا) وارد میکردیم. چون شنا ورزش مورد علاقه آنها “نبود”. این مورد در زیر برای هر 10 ورزشکار سه گانه نشان داده شده است:
همانطور که در زیر نشان داده شده است، این فرآیند را برای متغیر ساختگی دیگر، “cycling” تکرار می کنیم:
اگر یکی از ورزشکاران سه گانه عنوان می کرد که “دوچرخه سواری” ورزش “مورد علاقه” آنها است، ما یک “1” را در سلول زیر ستون متغیر ساختگی دوچرخه سواری (دوچرخه سواری) برای آن ورزشکار، وارد می کردیم. از طرف دیگر، اگر یکی از ورزشکاران سهگانه بیان میکرد که «شنا» یا «دویدن» ورزش «مورد علاقه» آنها است، برای آن ورزشکار ، «0» را در سلول زیر ستون متغیر ساختگی دوچرخهسواری وارد میکنیم. این مورد در زیر برای هر 10 ورزشکار سه گانه برجسته شده است:
با وارد کردن “1” و “0” به این روش در متغیرهای ساختگی خود، مجموعه ای از متغیرهای ساختگی ایجاد خواهید کرد که می توانید آن ها را در یک تحلیل رگرسیون چندگانه وارد کنید. در بخش Procedure که در ادامه می آید، نحوه ایجاد این متغیرهای ساختگی را با استفاده از روش Create Dummy Variables به شما نشان می دهیم.
ایجاد متغیرهای ساختگی در SPSS Statistics ورژن 22 یا بالاتر
دو روش در SPSS Statistics برای ایجاد متغیرهای ساختگی وجود دارد: روش Create Dummy Variables و روش Recode into Different Variables. در این آموزش، نحوه استفاده از روش Create Dummy Variables را به شما نشان میدهیم که یک روش ساده 3 مرحلهای است. با این حال، این تنها در صورتی در دسترس است که SPSS Statistics ورژن 22 یا بالاتر را داشته باشید.
توجه: اگر SPSS Statistics ورژن 21 یا قبل از آن دارید، نمی توانید از روش Create Dummy Variables استفاده کنید. بنابراین، حداقل روش Recode into Different Variables شما را قادر می سازد تا متغیرهای ساختگی را در SPSS Statistics ایجاد کنید. از روش Recode into Different Variables نیز برای ایجاد متغیرهای ساختگی در SPSS Statistics ورژن 22 یا بالاتر می توانید استفاده کنید. ما روش Create Dummy Variables را در این آموزش معرفی می کنیم زیرا به ایجاد متغیرهای ساختگی اختصاص دارد و بسیار ساده تر است.
مرحله (1)
مطابق شکل زیر، روی
Transform > Create Dummy Variables
در منوی اصلی کلیک کنید:
همانطور که در زیر نشان داده شده است پنجره ی Create Dummy Variables نمایش داده می شود:
مرحله (2)
متغیر مستقل طبقهای، favourite_sport را با انتخاب آن (با کلیک بر روی آن) و سپس کلیک کردن بر روی دکمه فلش به کادر Create Dummy Variables for منتقل کنید. همچنین، یک نام “root” (ریشه) را وارد کنید که بتواند همه متغیرهای ساختگی جدید را در کادر Root Root Names (One Per Selected Variable) در ناحیه –Main Effect Dummy Variables– نشان دهد. ما نام ریشه “fs” را به عنوان مخفف متغیر مستقل دسته بندی خود، “favourite_sport” وارد کردیم، همانطور که در زیر نشان داده شده است:
توجه: SPSS Statistics یک عدد متوالی (به عنوان مثال، 1، 2، 3، 4، و غیره) را به انتهای نام ریشه ای که انتخاب می کنید برای نشان دادن متغیر مستقل طبقهای خود اضافه می کند. برای هر یک از متغیرهای ساختگی که می خواهید ایجاد کنید یک عدد ترتیبی ایجاد می شود (به عنوان مثال، اگر دو متغیر ساختگی دارید، 1 و 2 به انتهای نام ریشه اضافه می شود، اما اگر شش متغیر ساختگی داشته باشید، 1، 2، 3، 4، 5 و 6 به انتهای نام ریشه اضافه می شود. برای این مثال پنجره Variable View به صورت زیر نشان داده شده است:
از آنجایی که متغیر مستقل طبقهای ما، favourite_sport، دارای سه دسته بود (به عنوان مثال، شنا، دوچرخهسواری و دویدن)، روش Create Dummy Variables سه متغیر ساختگی ایجاد میکند (یعنی یکی برای شنا، یکی برای دوچرخهسواری و دیگری برای دویدن). این سه متغیر ساختگی در ستون Name در بالا برجسته شده اند: “fs_1” (برای شنا)، “fs_2” (برای دوچرخه سواری) و “fs_3” (برای دویدن). می توانید بعداً نام آنها را تغییر دهید تا معنی بیشتری پیدا کنند. ما فقط این را برجسته می کنیم تا بدانید کادر Root Names (One Per Selected Variable) چگونه کار می کند.
همچنین، نام ریشه ای که در کادر Root Names (One Per Selected Variable): وارد می کنید، نمی تواند مانند نام متغیر مستقل دسته بندی شما باشد، همانطور که در زیر نشان داده شده است. یعنی اگر برای نام ریشه، “favourite_sport” را وارد کنیم چون با نام متغیر مستقل طبقهای یکی است، با کلیک بر روی دکمه OK، با پیغام خطا مواجه خواهیم شد:
مرحله (3)
بعد از این که نام ریشه ای صحیح را وارد کردید، بر روی دکمه OK کلیک کنید.
پس از انجام روش 3 مرحله ای گفته شده در بالا، متغیرهای ساختگی برای متغیر مستقل طبقهای خود ایجاد خواهید کرد. در بخش بعدی، خروجیای را که در Variable View و Data View Statistics پس از اجرای این روش ایجاد میشود، تفسیر میکنیم.
خروجی و تنظیم داده در SPSS Statistics پس از ایجاد متغیرهای ساختگی
پس از ایجاد متغیرهای ساختگی، جدول Variable Creation در IBM SPSS Statistics Viewer نمایش می دهد:
جدول Variable Creation تأیید می کند که شما با موفقیت متغیرهای ساختگی را ایجاد کرده اید. باید به اندازه تعداد متغیرهای ساختگی جدید، سطر وجود داشته باشد. از آنجایی که ما سه متغیر ساختگی ایجاد کردیم، سه ردیف در جدول وجود دارد، “fs_1″، “fs_2” و “fs_3” که منعکس کننده نام ریشه و شماره گذاری ترتیبی وارد شده در مرحله 2 روش گفته شده در بالا است. برای هر یک از این متغیرهای ساختگی، یک برچسب در جدول ارائه شده است تا مشخص شود که هر متغیر ساختگی کدام دسته از متغیر مستقل طبقهای را نشان می دهد. به عنوان مثال، برچسب “favourite_sport=swimming” برای “fs_1” ارائه شده است که نشان می دهد “fs_1” متغیر ساختگی برای دسته “swimming” از متغیر مستقل طبقهای، favourite_sport است.
سپس با کلیک بر روی تب Variable View به پنجره Variable View در SPSS Statistics بروید. همانطور که در زیر نشان داده شده است، سه متغیر ساختگی اضافه خواهند شد (به عنوان مثال، متغیرهای ساختگی، “fs_1″، “fs_2” و “fs_3″، در ستون Name):
توجه: میتوانید نام متغیرهای ساختگی را در ستون Name تغییر دهید تا واضحتر شود که اینها چه چیز هستند. به عنوان مثال، همانطور که در زیر نشان داده شده است، “fs_1” را به “swimming”، “fs_2” را به “cycling” و “fs_3” را به “running” تغییر دادهایم:
در نهایت با کلیک بر روی تب Data View به پنجره Data View SPSS Statistics بروید. کدگذاری ساختگی در زیر هر یک از متغیرهای ساختگی که ایجاد شده اند نشان داده می شود. به عنوان مثال، در ردیف های زیر ستون “fs_1″، دسته، “شنا” با عدد ” 1.00 “، در حالی که دسته های، “دوچرخه سواری” و “دویدن” با عدد “.00″، مطابق شکل زیر کد گذاری می شوند:
نکته 1: با توجه به تنظیمات پیشفرض SPSS Statistics، متغیرهای ساختگی شما بهترتیب بهجای «1» یا «0» با «1.00» یا «0.00» کد میشوند. آنها یکسان هستند. با این حال، اغلب کدنویسی ساختگی را می بینید که به جای اعشار، بر اساس 1 و 0 نوشته شده است.
نکته 2: اگر نام متغیرهای ساختگی را در ستون Name پنجره Variable View تغییر دهید، اینها نیز در ستون های پنجره View Data تغییر می کنند، همانطور که در زیر نشان داده شده است (به عنوان مثال، عنوان ستون زیر خط fs 1 اکنون تحت عنوان swimming است):
مطالب زیر را هم از دست ندهید:
انواع متغیر و تحقیقات تجربی و غیر تجربی
آزمون t نمونه تکی با استفاده از SPSS Statistics
چگونه یک نمودار نقطهای متصل به هم در R ایجاد کنیم؟
چند پروژه برای مبتدیان علم داده
نحوه تعیین خودکار تعداد خوشه ها توسط قانون آرنج
هوش مصنوعی (AI) چیست؟ 3 چیز که باید بدانید
تجزیه و تحلیل آماری: تعریف، مثال
چگونه نتایج حاشیه خطا را تفسیر کنیم؟
روایی نتیجه گیری آماری (SCV) چیست؟
تحلیل سئوال روش تحقیق آزمون دکتری
تفاوت بین یادگیری ماشین، علم داده، هوش مصنوعی، یادگیری عمیق و آمار
آمار در مقایسه با یادگیری ماشینی در سیستم های بیولوژیک
5 پاسخ