ایجاد متغیر های ساختگی در SPSS

پری کرمی
دی 10, 1401
5 دیدگاه ها

ایجاد متغیرهای ساختگی در SPSS Statistics

معرفی

اگر داده های خود را با استفاده از رگرسیون چندگانه تجزیه و تحلیل می کنید و هر یک از متغیرهای مستقل شما در مقیاس اسمی (nominal) یا ترتیبی (ordinal) اندازه گیری شده است، باید بدانید که چگونه متغیرهای ساختگی (dummy variables) ایجاد کنید و نتایج آنها را تفسیر کنید. این به این دلیل است که متغیرهای مستقل اسمی و ترتیبی، که بیشتر به عنوان متغیرهای مستقل طبقه‌ای (categorical independent variables) شناخته می شوند، نمی توانند مستقیماً وارد یک تحلیل رگرسیون چندگانه شوند. در عوض، آنها باید به متغیرهای ساختگی تبدیل شوند. به استثنا متغیرهای مستقل ترتیبی (ordinal independent variables) که به عنوان متغیرهای مستقل پیوسته وارد یک رگرسیون چندگانه می شوند که نیازی به تبدیل آنها به متغیرهای ساختگی نیست. بنابراین، در این آموزش به شما نشان می‌دهیم که چگونه متغیرهای ساختگی را زمانی که متغیرهای مستقل طبقه‌ای دارید ایجاد کنید.

قبل از توضیح نحوه تنظیم داده‌های خود در پنجره‌های Variable View و Data View در SPSS Statistics، ابتدا مثالی را که برای نشان دادن نحوه ایجاد متغیرهای ساختگی در SPSS Statistics استفاده می‌کنیم، ارائه می‌کنیم تا بتوانید متغیرهای ساختگی ایجاد کنید.

مثال استفاده شده در این آموزش

در این آموزش از 10 سوژه ” ورزشکار سه گانه” (triathletes) استفاده خواهیم کرد. سه‌گانه یک ورزش ترکیبی است که شرکت‌کنندگان در آن با انجام سه ورزش شنا، دوچرخه سواری و دویدن در پنج مرحله پی درپی در مسافت ها و محیط های مختلف با یکدیگر رقابت می‌کنند. از این ورزشکاران خواسته شد ورزش مورد علاقه خود را از بین سه ورزشی که هنگام انجام ورزش سه گانه انجام می دهند (شنا، دوچرخه سواری و دویدن) انتخاب کنند.

پاسخ آنها در متغیر مستقل اسمی favorite_sport ثبت شد که دارای سه دسته swimming «شنا»، cycling «دوچرخه سواری» و running «دویدن» است. این متغیر مستقل اسمی، favorite_sport، قرار بود در یک تحلیل رگرسیون چندگانه که تعدادی متغیر مستقل پیوسته نیز دارد، گنجانده شود. این یک متغیر مستقل طبقه ای (categorical) بود. (یعنی متغیرهای اسمی و متغیرهای ترتیبی را می توان به طور کلی به عنوان “متغیرهای طبقه ای” دسته بندی کرد). بنابراین قبل از اینکه بتوان آن را در تحلیل رگرسیون چندگانه وارد کرد، باید متغیرهای ساختگی ایجاد می شد.

مهم: توجه داشته باشید که favorite_sport یک متغیر اسمی است، اما شما همچنین می توانید متغیرهای ساختگی برای یک متغیر ترتیبی ایجاد کنید. علاوه بر این، فرآیند ایجاد متغیرهای ساختگی صرف نظر از اینکه متغیر ترتیبی یا اسمی دارید، یکسان است، به استثنای یک تغییر کوچک که باید هنگام تنظیم داده های خود ایجاد کنید، که در زیر توضیح داده شده است.

نکته 1: به «دسته‌های» یک متغیر مستقل طبقه ای، «گروه‌ها» یا «سطوح» نیز گفته می‌شود، اما اصطلاح «سطوح» معمولاً برای دسته‌هایی که دارای ترتیب هستند به کار می رود. با این حال، این سه اصطلاح – “دسته ها” (categories)، “گروه ها” (groups) و “سطوح” (levels) می توانند به جای یکدیگر استفاده شوند. در این آموزش، ما به آنها به عنوان دسته ها اشاره خواهیم کرد، اما در صورت تمایل می توانید به آنها به عنوان گروه یا سطوح اشاره کنید.

نکته 2: اصطلاح «فاکتور ها» (factors) گاهی به جای «متغیرهای مستقل طبقه‌ای» (یعنی متغیرهای مستقل «ترتیبی» یا «اسمی») استفاده می‌شود. با این حال، این دو اصطلاح – “متغیرهای مستقل طبقه‌ای” و “فاکتور ها”، می توانند به جای یکدیگر استفاده شوند. در این آموزش، ما به آنها به عنوان متغیرهای مستقل طبقه‌ای اشاره می‌کنیم و همچنین مشاهده خواهید کرد که SPSS Statistics در روش رگرسیون چندگانه خود به‌جای فاکتورها، به متغیرهای مستقل اشاره می‌کند. با این حال، در صورت تمایل می توانید به آنها به عنوان فاکتور ها اشاره کنید.

تنظیم داده های خود در SPSS Statistics

هنگام ایجاد متغیرهای ساختگی، با یک متغیر مستقل طبقه‌ای (به عنوان مثال، favorite_sport) شروع می کنید. برای تنظیم این متغیر مستقل طبقه‌ای، SPSS Statistics دارای یک Variable View )نمای متغیر) است که در آن انواع متغیری را که در حال تجزیه و تحلیل هستید تعریف می کنید و یک Data View )نمای داده) که در آن داده های خود را برای این متغیر وارد می کنید. در این بخش، قبل از اینکه به شما نشان دهیم که چگونه داده‌های خود را در پنجره View Data وارد کنید، ابتدا به شما نشان می‌دهیم که چگونه یک متغیر مستقل طبقه‌ای را در پنجره View Variable Statistics SPSS تنظیم کنید. ما این کار را با استفاده از متغیر مستقل دسته بندی خود، favorite_sport انجام می دهیم که دارای سه دسته swimming، cycling و running است.

Variable View در SPSS Statistics

با کلیک بر روی تب Variable View در گوشه سمت چپ پایین نرم افزار آماری SPSS می توانید به پنجره Variable View در SPSS Statistics دسترسی داشته باشید. برای یک متغیر مستقل طبقه‌ای (به عنوان مثال، favorite_sport)، پنجره View Variable شما مانند شکل زیر خواهد بود:

نام متغیر مستقل طبقه‌ای شما باید در سلول زیر ستون Name وارد شود (به عنوان مثال، فیلد “favorite_sport” در ردیف 1 برای نشان دادن متغیر مستقل طبقه‌ای). برخی از کاراکترهای “غیرمجاز” وجود دارند که نمی توان آنها را در سلول زیر ستون Name وارد کرد. بنابراین، اگر پیغام خطایی دریافت کردید نام متغیر را تغییر دهید.

توجه: برای وضوح خود، می توانید یک برچسب برای متغیرهای خود در ستون ستون Label نیز ارائه دهید. در این مثال، برچسبی که ما وارد کردیم، ” Triathlete’s favourite sport” بود.

سلول زیر ستون Values باید حاوی اطلاعات مربوط به دسته‌های متغیر مستقل طبقه‌ای شما باشد (به عنوان مثال، swimming، cycling و running. برای وارد کردن این اطلاعات، روی سلول زیر Values کلیک کنید که ستونی برای متغیر مستقل شما است. دکمه در سلول ظاهر می شود. روی این دکمه کلیک کنید و پنجره ی Value Labels ظاهر می شود. اکنون باید به هر دسته از متغیر مستقل خود یک “مقدار” بدهید. برای این مثال، در کادر Value عدد “1” و در کادر Label برچسب swimming را وارد می کنید. در واقع با این کار “شنا” با عدد 1 کدگذاری شد. با کلیک کردن روی دکمه Add، کدگذاری 1.00= swimming در کادر ظاهر می شود. همین کارها را برای 2.00= cycling و 1.00= running نیز انجام دهید.

اگر یک متغیر مستقل اسمی و یک متغیر مستقل ترتیبی دارید، سلول زیر ستون Measure باید Nominal را نشان دهد. دارید. در نهایت، سلول زیر ستون Role باید None را نشان دهد.

توجه: بهتر است سلول زیر ستون Role را از به تغییر دهید، اما این تغییر ضروری نیست. ولی پیشنهاد می کنیم این کار را انجام دهید. زیرا تحلیل های خاصی در SPSS Statistics وجود دارد که در آن تنظیمات باعث می شود که متغیرهای شما به طور خودکار به فیلدهای خاصی از جعبه های گفتگوی مورد استفاده شما منتقل شوند. از آنجایی که ممکن است تمایلی به انتقال این متغیرها نداشته باشید، پیشنهاد می کنیم تنظیمات را به تغییر دهید تا این اتفاق به صورت خودکار رخ ندهد.

اکنون با موفقیت تمام اطلاعاتی را که SPSS Statistics باید در مورد متغیر مستقل طبقه‌ای شما بداند در پنجره View Variable وارد کرده اید. در بخش بعدی به شما نشان می دهیم که چگونه داده های خود را در پنجره Data View وارد کنید.

Data View در SPSS Statistics

با کلیک بر روی تب Variable View در پایین سمت چپ نرم افزار آماری SPSS می توانید به پنجره Data View در SPSS Statistics دسترسی پیدا کنید. بر اساس تنظیم فایل در پنجره View Variable برای متغیر مستقل طبقه‌ای شما، پنجره View Data به صورت زیر نمایش داده می‌شود:

متغیر مستقل طبقه‌ای شما در ستون اول نمایش داده می شود زیرا این ترتیبی بود که متغیر را در پنجره View Variable وارد کردیم. در مثال ما، پاسخ های 10 ورزشکار سه گانه در زیر ستون ورزش مورد علاقه ارائه شده است. اکنون، شما به سادگی باید داده های خود را در سلول های زیر این ستون اول وارد کنید. به یاد داشته باشید که هر ردیف یک مورد را نشان می دهد. بنابراین، مورد اول نشان دهنده ورزشکار سه گانه ای بود که ورزش مورد علاقه اش «شنا» بود. از آنجایی که این سلول ها در ابتدا خالی خواهند بود، باید روی سلول ها کلیک کنید تا داده های خود را وارد کنید. متوجه خواهید شد که وقتی روی سلول‌های زیر ستون ورزش مورد علاقه کلیک می‌کنید، SPSS Statistics به شما یک گزینه کشویی می‌دهد که دسته‌های شما قبلاً پر شده‌اند.

درک متغیرهای ساختگی و کدگذاری ساختگی

همانطور که در مقدمه ذکر کردیم، اگر داده های خود را با استفاده از رگرسیون چندگانه تجزیه و تحلیل می کنید و هر یک از متغیرهای مستقل شما در مقیاس اسمی یا ترتیبی اندازه گیری شده است، باید بدانید که چگونه متغیرهای ساختگی ایجاد کنید و نتایج آنها را تفسیر کنید. این به این دلیل است که متغیرهای مستقل طبقه‌ای (مثلاً متغیرهای مستقل اسمی و ترتیبی) را نمی توان مستقیماً در یک رگرسیون چندگانه وارد کرد. در عوض، آنها باید به متغیرهای ساختگی تبدیل شوند. به استثنا متغیرهای مستقل ترتیبی هستند که به عنوان متغیرهای مستقل پیوسته وارد یک رگرسیون چندگانه می شوند که نیازی به تبدیل آنها به متغیرهای ساختگی نیست.

تعداد متغیرهای ساختگی که باید ایجاد کنید

تعداد متغیرهای ساختگی که باید ایجاد کنید به این بستگی دارد که متغیر مستقل دسته بندی شما چند دسته دارد. به عنوان یک قاعده کلی، شما یک متغیر ساختگی کمتر از تعداد دسته‌ها در متغیر مستقل طبقه‌ای خود ایجاد می‌کنید. به عنوان مثال، اگر شما یک متغیر مستقل طبقه ای با سه دسته دارید، دو متغیر ساختگی ایجاد می کنید و یک دسته را انتخاب می کنید تا به عنوان دسته مرجع (reference category) عمل کند. در این مثال favourite_spor، با سه دسته “شنا”، “دوچرخه سواری” و “دویدن” که در آن “شنا” و “دوچرخه سواری” به متغیرهای ساختگی تبدیل می شوند و “دویدن” به دسته مرجع تبدیل می شوند).

بعد از جدول زیر در مورد دسته‌های مرجع بیشتر توضیح می‌دهیم که نمونه‌هایی از متغیرهای مستقل طبقه‌ای و تعداد متغیرهای ساختگی را که باید ایجاد شوند ارائه می‌کند:

جدول: نمونه هایی از متغیرهای مستقل طبقه‌ای و متغیرهای ساختگی مربوط به آنها

تعداد متغیرهای ساختگی	تعداد دسته ها	نوع متغیر	نام متغیر مستقل طبقه بندی
یک=مرد «زن» دسته مرجع است	دو (مرد و زن)	اسمی	جنسیت	1
یک = زیر 180 سانتی متر “180 سانتی متر و بالاتر” دسته مرجع است	دو (کوچکتر-مساوی 180 سانتی متر و بالاتر از آن )	ترتیبی	ارتفاع	2
دو = آفریقایی آمریکایی و قفقازی “اسپانیایی” دسته مرجع است	سه (آفریقایی آمریکایی، قفقازی و اسپانیایی)	اسمی	قومیت	3
دو = کم و متوسط “بالا” دسته مرجع است	سه (کم، متوسط و زیاد)	ترتیبی	سطح فعالیت بدنی	4
سه = جراح، پزشک و پرستار «درمانگر» دسته مرجع است	چهار (جراح، پزشک، پرستار و درمانگر)	اسمی	حرفه	5
سه = کاملا موافق، موافق و مخالف «کاملاً مخالفم» دسته مرجع است	چهار (کاملاً موافقم، موافقم، مخالفم، کاملاً مخالفم)	ترتیبی	سطح موافقت	6
چهار = مطالعات بازرگانی، روانشناسی، علوم زیستی و مهندسی «قانون» دسته مرجع است	پنج (مطالعات بازرگانی، روانشناسی، علوم زیستی، مهندسی و حقوق)	اسمی	موضوع	7
چهار = زیر 18، 19-30، 31-40 و 41-50 “51-60” رده مرجع است	پنج (زیر 18، 19-30، 31-40، 41-50، 51-60)	ترتیبی	سن	8

همانطور که در جدول بالا نشان داده شده است، شما فقط باید یک متغیر ساختگی کمتر از تعداد دسته ها در متغیر مستقل طبقه‌ای خود ایجاد کنید. این به این دلیل است شما زمانی که یک متغیر مستقل طبقه‌ای دارید فقط باید این تعداد متغیر ساختگی را به یک رگرسیون چندگانه منتقل کنید با این حال، دلایل خوبی برای ایجاد یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقه‌ای وجود دارد: (الف) انعطاف‌پذیرتر است و (ب) امکان مقایسه‌های متعدد را فراهم می‌کند. به عبارت دیگر، اگر متغیر مستقل طبقه‌ای شما دارای سه دسته باشد، سه متغیر ساختگی ایجاد کنید، نه فقط دو تا.

خوشبختانه، روش Create Dummy Variables در SPSS Statistics ورژن های 22 تا 28 (و ورژن اشتراک SPSS Statistics) به طور خودکار یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقه‌ای شما ایجاد می کند. با این حال، این مورد برای روش Recode into Different Variables در SPSS Statistics ورژن 21 یا ورژن های قبلی SPSS Statistics صدق نمی کند. بنابراین، در شرایط عادی، بسته به اینکه ورژن 21 یا قبل از آن یا ورژن 22 به بالا را داشته باشید، تنظیمات زیر را در SPSS Statistics ایجاد خواهید کرد:

توجه: همانطور که در بالا ذکر شد، ایجاد یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقه‌ای به دو دلیل سودمند است: (الف) انعطاف‌پذیرتر است و (ب) امکان مقایسه‌های متعدد را فراهم می‌کند. در زیر به طور خلاصه به این مزایا می پردازیم:

انعطاف پذیرتر است:

هنگامی که یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقه‌ای خود ایجاد کردید، سپس می توانید هر دسته را به عنوان یک دسته مرجع در نظر بگیرید. در مثال ما، دسته “دویدن” را به عنوان دسته مرجع در نظر گرفتیم، به این معنی که “شنا” و “دوچرخه سواری” را به معادله رگرسیون چندگانه منتقل می کردیم. با این حال، اگر بعداً نظر خود را در مورد انتخاب دسته مرجع تغییر دادید، باید دوباره روش متغیر ساختگی را اجرا کنیمد (مگر اینکه ورژن 22 یا بالاتر SPSS Statistics را داشته باشید). به عنوان مثال، فرض کنید اکنون می‌خواهیم دسته «دوچرخه سواری» را به عنوان دسته مرجع در نظر بگیریم. اکنون می‌توانیم متغیرهای ساختگی “swimming” و “running” را به معادله رگرسیون چندگانه منتقل کنیم زیرا متغیر ساختگی “running” را نیز داریم.

این اجازه می دهد تا چندین مقایسه انجام شود:

ضریب یک متغیر ساختگی نشان دهنده تفاوت بین دسته (که متغیر ساختگی نشان می دهد) و دسته مرجع است. که متغیر ساختگی نشان دهنده آن است. برای مثال، با «دویدن» به عنوان دسته مرجع، ضریب متغیر ساختگی «شنا» نشان دهنده تفاوت در متغیر وابسته بین دسته‌های «شنا» و «دویدن» است. با استفاده از این روش، ترکیب همه دسته ها امکان پذیر نخواهد بود. بلکه این مشکل با استفاده از دسته های مرجع مختلف قابل حل است. این در صورتی امکان پذیر است که همه دسته های متغیر طبقه ای دارای یک متغیر ساختگی باشند.

نحوه ایجاد متغیرهای ساختگی و کدنویسی ساختگی

دو مرحله برای تنظیم موفقیت‌آمیز متغیرهای ساختگی در یک رگرسیون چندگانه وجود دارد: (1) متغیرهای ساختگی ایجاد کنید که نشان‌دهنده دسته‌های متغیر مستقل طبقه‌ای شما هستند. (2) مقادیری را در این متغیرهای ساختگی (که به عنوان کدگذاری ساختگی شناخته می شوند) وارد کنید تا دسته بندی های متغیر مستقل طبقه‌ای را نشان دهند. ما این فرآیند را در زیر با استفاده از مثالی که در بالا ارائه کردیم توضیح می دهیم.

توضیح: متغیرهای ساختگی صرفاً متغیرهای جدیدی هستند که به عنوان “جایگاه دار” (placeholders) برای یک طرح کدگذاری خاص عمل می کنند. آنها به خودی خود حاوی هیچ داده ای نیستند. در عوض، داده ها/مقدارها باید به این متغیرهای ساختگی اضافه شوند تا بتوانند هدف خود را برای نمایش دسته های متغیر مستقل طبقه‌ای شما محقق کنند. انواع مختلفی از طرح های کدگذاری وجود دارد که مقادیر وارد شده به متغیرهای ساختگی را دیکته می کنند، اما ما از یک طرح کدگذاری بسیار رایج به نام کدگذاری ساختگی یا به طور متناوب، کدگذاری نشانگر استفاده می کنیم (نکته، متغیرهای ساختگی و کدنویسی ساختگی یکسان نیستند). کدگذاری ساختگی با استفاده از هر متغیر ساختگی برای شناسایی یک دسته خاص از یک متغیر مستقل طبقه‌ای به استثنای یک دسته مرجع، که در زیر توضیح می دهیم، کار می کند.

بیایید با در نظر گرفتن متغیر مستقل دسته ای مثال بالا، یعنی favourite_sport شروع کنیم که دارای سه دسته “شنا”، “دوچرخه سواری” و “دویدن” است. از آنجایی که سه دسته وجود دارد، باید دو متغیر ساختگی وجود داشته باشد که دو دسته از دسته‌ها را نشان دهد و یک دسته مرجع که نشان دهنده دسته سوم باشد.

توجه: از بحث بالا به خاطر داشته باشید که یک رگرسیون چندگانه از شما می‌خواهد که یک متغیر ساختگی کمتر از تعداد دسته‌های متغیر مستقل طبقه‌ای خود (به عنوان مثال، دو متغیر در مثال ما) منتقل کنید. با این حال، می توانید یک متغیر ساختگی برای هر دسته از متغیر مستقل طبقه‌ای به منظور انعطاف بیشتر و توانایی انجام مقایسه های متعدد ایجاد کنید. با این وجود، در بحث زیر ما فقط آنچه را که برای یک رگرسیون چندگانه لازم است را به شما نشان می دهیم. یعنی ایجاد یک متغیر ساختگی کمتر از تعداد دسته‌ها در متغیر مستقل طبقه‌ای شما با دسته‌ای که مستقیماً نشان داده نمی‌شود و تبدیل به «دسته مرجع» می‌شود.

به عنوان مثال، اجازه دهید متغیر ساختگی شماره 1 نشان دهنده دسته “شنا” و متغیر ساختگی شماره 2 نشان دهنده دسته “دوچرخه سواری” باشد. این هیچ متغیر ساختگی برای دسته “دویدن” باقی نمی گذارد. این دسته “مفقود” (missing) دسته مرجع است و نیازی به آن نیست. علاوه بر این، این کاملاً به تصمیم شما بستگی دارد که از کدام دسته به عنوان دسته مرجع استفاده کنید. ما می توانستیم به همین راحتی دسته «شنا» را به عنوان دسته مرجع به جای دسته «دویدن» انتخاب کنیم. تنها دلیلی که ما این کار را نکردیم این است که به طور پیش‌فرض SPSS Statistics از آخرین دسته‌ای که در Variable View برای متغیر مستقل طبقه‌ای خود کد نویسی کرده اید، به عنوان دسته مرجع استفاده می‌کند

توجه: همانطور که قبلاً در بخش تنظیم داده توضیح داده شد و همانطور که در زیر در پنجره ی Value Labels نشان داده شده است، دسته سوم و آخر متغیر مستقل طبقه‌ای ما “دویدن” بود (یعنی 3=running).

هیچ دلیلی برای ما وجود نداشت که دسته “دویدن” را به دسته سوم و آخر تبدیل کنیم با این حال SPSS Statistics، به طور پیش فرض آن را به عنوان دسته مرجع انتخاب کرد. ما به سادگی این کار را به این صورت انجام دادیم. زیرا وقتی ورزشکاران سه‌گانه در مسابقات سه‌گانه شرکت می‌کنند، ابتدا شنا می‌کنند، سپس دوچرخه سواری را انجام می‌دهند و در نهایت تا خط پایان می دوند. بنابراین منطقی به نظر می رسید که متغیر مستقل طبقه‌ای خود را به این شکل کدگذاری کنیم. با این حال، ما می توانستیم آن را به صورت 1=cycling، 2=running و 3=swimming کدگذاری کنیم. هیچ تفاوتی نمی‌کرد جز این که به عنوان دسته سوم و آخر، «شنا» به‌طور پیش‌فرض در SPSS Statistics به دسته مرجع ما تبدیل می‌شد.

هنگامی که متغیرهای ساختگی ایجاد می کنید، باید به آنها یک نام معنادار بدهید. از آنجایی که هر یک از متغیرهای ساختگی ما یک دسته از متغیر مستقل طبقه‌ای ما را نشان می دهد، مرسوم است که به هر متغیر ساختگی با نام دسته ای که نشان می دهد اشاره کنیم. بنابراین، ما متغیر ساختگی شماره 1 را “شنا” نامیده ایم زیرا نشان دهنده دسته شنا است. به طور مشابه، ما متغیر ساختگی شماره 2 را “دوچرخه سواری” نامیده ایم زیرا نشان دهنده دسته دوچرخه سواری است. با ایجاد این دو متغیر ساختگی، مانند شکل زیر، دو ستون جدید در مجموعه داده های خود در SPSS Statistics خواهیم داشت:

اکنون که دو متغیر ساختگی ایجاد کردیم و نام‌های مناسبی برای آن‌ها گذاشته‌ایم، باید مقادیری را در این متغیرها وارد کنیم تا هر متغیر ساختگی واقعاً نشان‌دهنده دسته‌بندی متغیر مستقل طبقه‌ای خود باشد. با کدنویسی ساختگی این بسیار ساده است. شما “1” (یک) را برای نشان دادن هر موردی که دارای دسته است وارد می کنید وبرای موردی که دسته را ندارد، “0” (صفر) را وارد می کنید. ابتدا متغیر ساختگی “swimming” را در نظر بگیرید، همانطور که در زیر نشان داده شده است:

اگر یکی از ورزشکاران سه گانه عنوان می کرد که “شنا” ورزش “مورد علاقه” آنها است، برای آن ورزشکار سه گانه که اعلام کرده بود شنا ورزش “مورد علاقه” آنها است، یک عدد “1” را در سلول زیر ستون متغیر ساختگی شنا (ستون شنا) وارد می کنیم. . از طرف دیگر، اگر یکی از ورزشکاران سه‌گانه بیان می‌کرد که «دوچرخه‌سواری» یا «دویدن» ورزش «مورد علاقه» آنها است، برای آن ورزشکار سه‌گانه‌ای که شنا را بیان کرده بود، علامت «0» را در سلول زیر ستون متغیر ساختگی شنا (ستون شنا) وارد می‌کردیم. چون شنا ورزش مورد علاقه آنها “نبود”. این مورد در زیر برای هر 10 ورزشکار سه گانه نشان داده شده است:

همانطور که در زیر نشان داده شده است، این فرآیند را برای متغیر ساختگی دیگر، “cycling” تکرار می کنیم:

اگر یکی از ورزشکاران سه گانه عنوان می کرد که “دوچرخه سواری” ورزش “مورد علاقه” آنها است، ما یک “1” را در سلول زیر ستون متغیر ساختگی دوچرخه سواری (دوچرخه سواری) برای آن ورزشکار، وارد می کردیم. از طرف دیگر، اگر یکی از ورزشکاران سه‌گانه بیان می‌کرد که «شنا» یا «دویدن» ورزش «مورد علاقه» آن‌ها است، برای آن ورزشکار ، «0» را در سلول زیر ستون متغیر ساختگی دوچرخه‌سواری وارد می‌کنیم. این مورد در زیر برای هر 10 ورزشکار سه گانه برجسته شده است:

با وارد کردن “1” و “0” به این روش در متغیرهای ساختگی خود، مجموعه ای از متغیرهای ساختگی ایجاد خواهید کرد که می توانید آن ها را در یک تحلیل رگرسیون چندگانه وارد کنید. در بخش Procedure که در ادامه می آید، نحوه ایجاد این متغیرهای ساختگی را با استفاده از روش Create Dummy Variables به شما نشان می دهیم.

ایجاد متغیرهای ساختگی در SPSS Statistics ورژن 22 یا بالاتر

دو روش در SPSS Statistics برای ایجاد متغیرهای ساختگی وجود دارد: روش Create Dummy Variables و روش Recode into Different Variables. در این آموزش، نحوه استفاده از روش Create Dummy Variables را به شما نشان می‌دهیم که یک روش ساده 3 مرحله‌ای است. با این حال، این تنها در صورتی در دسترس است که SPSS Statistics ورژن 22 یا بالاتر را داشته باشید.

توجه: اگر SPSS Statistics ورژن 21 یا قبل از آن دارید، نمی توانید از روش Create Dummy Variables استفاده کنید. بنابراین، حداقل روش Recode into Different Variables شما را قادر می سازد تا متغیرهای ساختگی را در SPSS Statistics ایجاد کنید. از روش Recode into Different Variables نیز برای ایجاد متغیرهای ساختگی در SPSS Statistics ورژن 22 یا بالاتر می توانید استفاده کنید. ما روش Create Dummy Variables را در این آموزش معرفی می کنیم زیرا به ایجاد متغیرهای ساختگی اختصاص دارد و بسیار ساده تر است.

مرحله (1)

مطابق شکل زیر، روی

Transform > Create Dummy Variables

در منوی اصلی کلیک کنید:

همانطور که در زیر نشان داده شده است پنجره ی Create Dummy Variables نمایش داده می شود:

مرحله (2)

متغیر مستقل طبقه‌ای، favourite_sport را با انتخاب آن (با کلیک بر روی آن) و سپس کلیک کردن بر روی دکمه فلش به کادر Create Dummy Variables for منتقل کنید. همچنین، یک نام “root” (ریشه) را وارد کنید که بتواند همه متغیرهای ساختگی جدید را در کادر Root Root Names (One Per Selected Variable) در ناحیه –Main Effect Dummy Variables– نشان دهد. ما نام ریشه “fs” را به عنوان مخفف متغیر مستقل دسته بندی خود، “favourite_sport” وارد کردیم، همانطور که در زیر نشان داده شده است:

توجه: SPSS Statistics یک عدد متوالی (به عنوان مثال، 1، 2، 3، 4، و غیره) را به انتهای نام ریشه ای که انتخاب می کنید برای نشان دادن متغیر مستقل طبقه‌ای خود اضافه می کند. برای هر یک از متغیرهای ساختگی که می خواهید ایجاد کنید یک عدد ترتیبی ایجاد می شود (به عنوان مثال، اگر دو متغیر ساختگی دارید، 1 و 2 به انتهای نام ریشه اضافه می شود، اما اگر شش متغیر ساختگی داشته باشید، 1، 2، 3، 4، 5 و 6 به انتهای نام ریشه اضافه می شود. برای این مثال پنجره Variable View به صورت زیر نشان داده شده است:

از آنجایی که متغیر مستقل طبقه‌ای ما، favourite_sport، دارای سه دسته بود (به عنوان مثال، شنا، دوچرخه‌سواری و دویدن)، روش Create Dummy Variables سه متغیر ساختگی ایجاد می‌کند (یعنی یکی برای شنا، یکی برای دوچرخه‌سواری و دیگری برای دویدن). این سه متغیر ساختگی در ستون Name در بالا برجسته شده اند: “fs_1” (برای شنا)، “fs_2” (برای دوچرخه سواری) و “fs_3” (برای دویدن). می توانید بعداً نام آنها را تغییر دهید تا معنی بیشتری پیدا کنند. ما فقط این را برجسته می کنیم تا بدانید کادر Root Names (One Per Selected Variable) چگونه کار می کند.

همچنین، نام ریشه ای که در کادر Root Names (One Per Selected Variable): وارد می کنید، نمی تواند مانند نام متغیر مستقل دسته بندی شما باشد، همانطور که در زیر نشان داده شده است. یعنی اگر برای نام ریشه، “favourite_sport” را وارد کنیم چون با نام متغیر مستقل طبقه‌ای یکی است، با کلیک بر روی دکمه OK، با پیغام خطا مواجه خواهیم شد:

مرحله (3)

بعد از این که نام ریشه ای صحیح را وارد کردید، بر روی دکمه OK کلیک کنید.

پس از انجام روش 3 مرحله ای گفته شده در بالا، متغیرهای ساختگی برای متغیر مستقل طبقه‌ای خود ایجاد خواهید کرد. در بخش بعدی، خروجی‌ای را که در Variable View و Data View Statistics پس از اجرای این روش ایجاد می‌شود، تفسیر میکنیم.

خروجی و تنظیم داده در SPSS Statistics پس از ایجاد متغیرهای ساختگی

پس از ایجاد متغیرهای ساختگی، جدول Variable Creation در IBM SPSS Statistics Viewer نمایش می دهد:

جدول Variable Creation تأیید می کند که شما با موفقیت متغیرهای ساختگی را ایجاد کرده اید. باید به اندازه تعداد متغیرهای ساختگی جدید، سطر وجود داشته باشد. از آنجایی که ما سه متغیر ساختگی ایجاد کردیم، سه ردیف در جدول وجود دارد، “fs_1″، “fs_2” و “fs_3” که منعکس کننده نام ریشه و شماره گذاری ترتیبی وارد شده در مرحله 2 روش گفته شده در بالا است. برای هر یک از این متغیرهای ساختگی، یک برچسب در جدول ارائه شده است تا مشخص شود که هر متغیر ساختگی کدام دسته از متغیر مستقل طبقه‌ای را نشان می دهد. به عنوان مثال، برچسب “favourite_sport=swimming” برای “fs_1” ارائه شده است که نشان می دهد “fs_1” متغیر ساختگی برای دسته “swimming” از متغیر مستقل طبقه‌ای، favourite_sport است.

سپس با کلیک بر روی تب Variable View به پنجره Variable View در SPSS Statistics بروید. همانطور که در زیر نشان داده شده است، سه متغیر ساختگی اضافه خواهند شد (به عنوان مثال، متغیرهای ساختگی، “fs_1″، “fs_2” و “fs_3″، در ستون Name):

توجه: می‌توانید نام متغیرهای ساختگی را در ستون Name تغییر دهید تا واضح‌تر شود که اینها چه چیز هستند. به عنوان مثال، همانطور که در زیر نشان داده شده است، “fs_1” را به “swimming”، “fs_2” را به “cycling” و “fs_3” را به “running” تغییر داده‌ایم:

در نهایت با کلیک بر روی تب Data View به پنجره Data View SPSS Statistics بروید. کدگذاری ساختگی در زیر هر یک از متغیرهای ساختگی که ایجاد شده اند نشان داده می شود. به عنوان مثال، در ردیف های زیر ستون “fs_1″، دسته، “شنا” با عدد ” 1.00 “، در حالی که دسته های، “دوچرخه سواری” و “دویدن” با عدد “.00″، مطابق شکل زیر کد گذاری می شوند:

نکته 1: با توجه به تنظیمات پیش‌فرض SPSS Statistics، متغیرهای ساختگی شما به‌ترتیب به‌جای «1» یا «0» با «1.00» یا «0.00» کد می‌شوند. آنها یکسان هستند. با این حال، اغلب کدنویسی ساختگی را می بینید که به جای اعشار، بر اساس 1 و 0 نوشته شده است.

نکته 2: اگر نام متغیرهای ساختگی را در ستون Name پنجره Variable View تغییر دهید، اینها نیز در ستون های پنجره View Data تغییر می کنند، همانطور که در زیر نشان داده شده است (به عنوان مثال، عنوان ستون زیر خط fs 1 اکنون تحت عنوان swimming است):