مقدمه
محققان علوم انسانی سالهاست که از ابزارهای تحلیل آماری برای گسترش توانایی خود در توسعه، کاوش و تأیید یافتههای پژوهشی استفاده میکنند. استفاده از روشهای آماری نسل اول مانند تحلیل عاملی و تحلیل رگرسیون در دهه 1980 بر چشمانداز پژوهش ها غالب بود. اما از اوایل دهه 1990، روشهای نسل دوم به سرعت گسترش یافتند و در برخی رشتهها، تقریباً 50 درصد از ابزارهای آماری مورد استفاده در تحقیقات تجربی را نشان میدهند.
در این سری از مقالات، قصد دارم اصول روشهای آماری نسل دوم را توضیح میدهم و پایهای را ایجاد میکنم که شما را قادر میسازد یکی از ابزارهای نوظهور نسل دوم را که به عنوان مدلسازی معادلات ساختاری حداقل مربعات جزئی (PLS-SEM) نامیده میشود، کاملا درک و استفاده کنید.
مدل سازی معادلات ساختاری چیست؟
تحلیل های آماری بیش از یک قرن است که ابزاری ضروری برای محققان علوم انسانی مطرح بوده است. کاربرد روشهای آماری با ظهور سختافزار و نرمافزارهای کامپیوتری، بهویژه در سالهای اخیر با دسترسی گسترده به روشهای بسیار بیشتر به دلیل رابطهای کاربرپسند با دانش ارائهشده توسط فناوری، به طور چشمگیری گسترش یافته است.
محققان در ابتدا برای درک داده ها و روابط بر تحلیل تک متغیره و دو متغیره تکیه کردند. برای درک روابط پیچیدهتر مرتبط با جهتهای تحقیقاتی فعلی در علوم انسانی، استفاده از روشهای پیچیدهتر تحلیل دادههای چند متغیره به طور فزایندهای ضروری است.
تجزیه و تحلیل چند متغیره شامل استفاده از روش های آماری است که به طور همزمان چندین متغیر را تجزیه و تحلیل می کند. متغیرها معمولاً اندازه گیری های مرتبط با افراد، شرکت ها، رویدادها، فعالیت ها، موقعیت ها و غیره را نشان می دهند. اندازهگیریها اغلب از نظرسنجیها یا مشاهداتی که برای جمعآوری دادههای اولیه استفاده میشوند، بهدست میآیند، اما ممکن است از پایگاههای دادهای متشکل از دادههای ثانویه نیز بهدست آیند.
جدول زیر برخی از انواع عمده روش های آماری مرتبط با تجزیه و تحلیل داده های چند متغیره را نشان می دهد.
روش های آماری که اغلب توسط دانشمندان علوم انسانی استفاده می شود، معمولاً تکنیک های نسل اول هستند (فورنل، 1982، 1987). این تکنیکها که در قسمت بالای جدول بالا نشان داده شدهاند، شامل رویکردهای مبتنی بر رگرسیون مانند رگرسیون چندگانه، رگرسیون لجستیک، و تحلیل واریانس، اما همچنین تکنیکهایی مانند تحلیل عاملی اکتشافی و تأییدی، تجزیه و تحلیل خوشهای و مقیاسبندی چند بعدی است.
این تکنیکها هنگامی که برای پاسخ به یک سؤال تحقیق به کار می رود، می توانند برای تأیید نظریه های پیشینی یا شناسایی الگوها و روابط داده ها استفاده شوند. به طور خاص، این تکنیکها هنگام آزمایش فرضیههای برگرفته از نظریهها و مفاهیم موجود، تأییدکننده هستند و زمانی که الگوهایی را در دادهها جستجو میکنند، در صورتی که دانش قبلی در مورد چگونگی ارتباط متغیرها وجود نداشته باشد یا فقط کمی وجود داشته باشد، اکتشافی هستند.
توجه به این نکته مهم است که تمایز بین تأییدی و اکتشافی همیشه آنطور که به نظر می رسد واضح نیست. به عنوان مثال، هنگام اجرای تحلیل رگرسیون، محققان معمولاً متغیرهای وابسته و مستقل را بر اساس نظریه ها و مفاهیم پیشینی تعیین شده انتخاب می کنند. سپس هدف از تحلیل رگرسیون آزمایش این نظریه ها و مفاهیم است. با این حال، این تکنیک همچنین می تواند برای بررسی اینکه آیا متغیرهای مستقل اضافی برای بسط مفهوم مورد آزمایش ارزشمند هستند یا خیر، استفاده شود. یافتهها معمولاً ابتدا بر این تمرکز میکنند که کدام متغیرهای مستقل از نظر آماری پیشبینیکنندههای معنیدار برای متغیر وابسته واحد هستند (تأییدکنندهتر) و سپس کدام متغیرهای مستقل، به طور نسبی، پیشبینیکنندههای بهتری برای متغیر وابسته هستند (کاوشگرتر). به روشی مشابه، زمانی که تحلیل عاملی اکتشافی بر روی یک مجموعه داده اعمال می شود، این روش در تلاش برای کاهش تعداد زیادی از متغیرها به مجموعه کوچکتری از عوامل ترکیبی (یعنی ترکیبی از متغیرها) روابط بین متغیرها را جستجو می کند. مجموعه نهایی عوامل ترکیبی نتیجه کاوش روابط در داده ها و گزارش روابط یافت شده (در صورت وجود) است. با این وجود، در حالی که این تکنیک ماهیت اکتشافی دارد (همانطور که از نام قبلاً مشخص است)، محققان اغلب دانش پیشینی دارند که ممکن است، برای مثال، تصمیم آنها را در مورد تعداد عوامل ترکیبی برای استخراج از داده ها هدایت کند (Sarstedt & Mooi, 2014). در مقابل، تجزیه و تحلیل عامل تاییدی اجازه می دهد تا یک عامل تعیین شده قبلی و شاخص های اختصاص داده شده را آزمایش و اثبات کند.
تکنیک های نسل اول به طور گسترده توسط محققان به کار گرفته شده است. با این حال، در 20 سال گذشته، بسیاری از محققان به طور فزاینده ای به تکنیک های نسل دوم برای غلبه بر نقاط ضعف روش های نسل اول روی آورده اند. این روشها که به آن مدلسازی معادلات ساختاری (SEM) گفته میشود، محققان را قادر میسازد تا متغیرهای غیرقابل مشاهده را که بهطور غیرمستقیم توسط متغیرهای شاخص اندازهگیری میشوند، ترکیب کنند. علاوه بر این، این روشها محاسبه خطای اندازه گیری در متغیرهای مشاهده شده را تسهیل می کنند (چین، 1998).
دو نوع SEM وجود دارد:
- SEM مبتنی بر کوواریانس (CB-SEM)
- SEM حداقل مربعات جزئی (PLS-SEM؛ که مدلسازی مسیر PLS نیز نامیده می شود).
CB-SEM در درجه اول برای تأیید (یا رد) نظریه ها (یعنی مجموعه ای از روابط سیستماتیک بین متغیرهای متعدد که می تواند به طور تجربی آزمایش شود) استفاده می شود. این کار را با تعیین اینکه چگونه یک مدل نظری پیشنهادی میتواند ماتریس کوواریانس را برای مجموعه دادههای نمونه تخمین بزند، انجام میدهد.
در مقابل، PLS-SEM در درجه اول برای توسعه نظریه ها در تحقیقات اکتشافی استفاده می شود. این کار را با تمرکز بر توضیح واریانس در متغیرهای وابسته هنگام بررسی مدل انجام می دهد.
در مورد تفاوت این دو روش مفصل در مقاله دیگری صحبت می کنم.
بهر حال روش های PLS-SEM در حال گسترش هستند که در ادامه مباحث به تشریح بسیاری از آنها خواهیم پرداخت.