ANOVA ی اندازه گیری های مکرر (Repeated Measures ANOVA)
مقدمه
ANOVA ی اندازه گیری های مکرر معادل ” ANOVA یک طرفه” برای گروه های مرتبط است و بسط یافته آزمون t وابسته است. علاوه بر این ANOVA ی اندازه گیری های مکرر نیز به عنوان ANOVA درون سوژه ای یا ANOVA برای نمونه های همبسته نامیده می شود. همه این نامها ماهیت ANOVA ی اندازه گیری های مکرر را نشان میدهند، که آزمایشی برای تشخیص هر گونه تفاوت کلی بین میانگینهای مرتبط است. طرحهای پیچیده زیادی وجود دارد که میتوانند از اندازهگیریهای مکرر استفاده کنند، اما در سراسر این راهنما، به سادهترین مورد، یعنی ANOVA ی اندازه گیری های مکرر یکطرفه (one-way repeated measures ANOVA) اشاره خواهیم کرد. این آزمون خاص به یک متغیر مستقل و یک متغیر وابسته نیاز دارد. متغیر وابسته باید پیوسته (continuous) (فاصله ای (interval) یا نسبتی (ratio)) و متغیر مستقل رستهای (categorical) (اسمی (nominal) یا ترتیبی (ordinal)) باشد.
زمان استفاده از ANOVAی اندازه گیری های مکرر
ما می توانیم برای دو نوع طراحی مطالعه، داده ها را با استفاده از ANOVA ی اندازه گیری های مکرر، تجزیه و تحلیل کنیم. مطالعاتی که یا (1) تغییرات در میانگین در سه نقطه زمانی یا بیشتر، یا (2) تفاوت در میانگین تحت سه یا چند شرایط مختلف را بررسی میکنند. به عنوان مثال، برای (1)، ممکن است در حال بررسی تأثیر یک برنامه تمرینی-ورزشی 6 ماهه بر فشار خون باشید و بخواهید فشار خون را در 3 نقطه زمانی جداگانه (مطالعه قبل، میانه و بعد از ورزش) اندازه گیری کنید. به شما امکان می دهد یک دوره زمانی برای هر اثر ورزشی ایجاد کنید.
برای (2)، ممکن است سوژه های مشابهی را برای خوردن انواع کیک (شکلات، کارامل و لیمو) بخواهید و به هر کدام از نظر طعم مقدار دهید، نه اینکه افراد مختلف هر کیک متفاوت را بچشند. نکته مهم در مورد این دو طرح مطالعه این است که افراد یکسان بیش از یک بار بر روی یک متغیر وابسته اندازه گیری می شوند (دلیل اینکه چرا به آن اندازه گیری های مکرر گفته می شود).
در ANOVA ی اندازه گیری های مکرر، متغیر مستقل دارای دسته هایی به نام سطوح یا گروه های مرتبط است. در جایی که اندازهگیریها در طول زمان تکرار میشوند، مانند اندازهگیری تغییرات فشار خون به دلیل یک برنامه تمرینی ورزشی، متغیر مستقل، زمان است. هر سطح (یا گروه مرتبط) یک نقطه زمانی خاص است. از این رو، برای مطالعه تمرینی-ورزشی، سه نقطه زمانی وجود دارد و هر نقطه زمانی سطحی از متغیر مستقل است (شماتیکی از طرح اندازهگیریهای مکرر دوره زمانی در زیر نشان داده شده است):
در جایی که اندازهگیریها تحت شرایط مختلف انجام میشود، شرایط (conditions) در واقع سطوح متغیر مستقل (به عنوان مثال، نوع کیک متغیر مستقل با شکلات، کارامل و کیک لیمو به عنوان سطوح متغیر مستقل) است. شماتیکی از طرح اندازه گیری های مکرر با شرایط متفاوت در زیر نشان داده شده است. لازم به ذکر است که اغلب به سطوح متغیر مستقل به عنوان شرایط اشاره نمی شود، بلکه به عنوان تیمار (treatments) اطلاق می شود. اینکه کدام یک را می خواهید استفاده کنید به خودتان بستگی دارد. هیچ قرارداد نامگذاری درست یا نادرستی وجود ندارد. همچنین متغیر مستقلی را خواهید دید که بیشتر به عنوان within-subjects factor شناخته می شود.
دو شکل بالا نمونهای از هر نوع طراحی ANOVA ی اندازهگیریهای مکرر را نشان دادهاند، اما شما همچنین اغلب این طرحها را به صورت جدولی مانند شکل زیر بیان میکنید:
این جدول خاص مطالعه ای را با شش سوژه (subjects) (S1 تا S6 ) که تحت سه شرایط یا در سه نقطه زمانی (T1 تا T3 ) انجام می دهند، توصیف می کند. همانطور که قبلاً اشاره شد، within-subjects factor نیز میتوانست به جای «time/condition» از برچسب treatments استفاده کرد. همه آنها به یک چیز (افراد تحت اندازه گیری های اندازهگیریهای مکرر در مقاطع زمانی مختلف یا تحت شرایط/تیمارهای متفاوت) مربوط می شوند.
فرضیه برای ANOVA ی اندازه گیری های مکرر
ANOVA ی اندازه گیری های مکرر آزمایش می کند که آیا تفاوتی بین میانگین جمعیت مرتبط وجود دارد یا خیر. فرضیه صفر (H0) بیان می کند که میانگین ها برابر هستند:
H0: µ1 = µ2 = µ3 = … = µk
که در آن μ = میانگین جمعیت و k = تعداد گروههای مرتبط هستند. فرضیه جایگزین HA بیان می کند که میانگین جمعیت مرتبط برابر نیست (حداقل یک میانگین با میانگین دیگر متفاوت است).
HA : حداقل دو میانگین تفاوت قابل توجهی دارند
در مثال تمرینی-ورزشی که در بالا اشاره شد، فرضیه صفر H0 این است که میانگین فشار خون در تمام نقاط زمانی یکسان است (قبل، 3 ماهگی و 6 ماهگی). فرضیه جایگزین این است که میانگین فشار خون در یک یا چند نقطه زمانی به طور قابل توجهی متفاوت است. ANOVA ی اندازه گیری های مکرر به شما اطلاع نمیدهد که تفاوتهای بین گروهها کجاست، زیرا این یک آزمون آماری همهجانبه است.
اگر در حال بررسی شرایط یا تیمارهای مختلف به جای نقاط زمانی هستید، همانطور که در این مثال استفاده شده است، همین امر صادق است. اگر ANOVA ی اندازه گیری های مکرر شما از نظر آماری معنیدار است، میتوانید آزمونهای تعقیبی (post hoc) را اجرا کنید که میتواند دقیقاً محل وقوع این تفاوتها را مشخص کند. میتوانید نحوه اجرای آزمونهای post hoc مناسب برای ANOVA ی اندازه گیری های مکرر در آمار SPSS را در صفحه 2 راهنمای ما بیاموزید: ANOVA اندازهگیریهای مکرر یکطرفه در آمار SPSS.
منطق ANOVA ی اندازه گیری های مکرر
منطق پشت ANOVA ی اندازه گیری های مکرر بسیار شبیه به منطق ANOVA بین سوژه ها (between-subjects ANOVA) است. به یاد داشته باشید که between-subjects ANOVA ، تنوع کل را به تنوع بین گروه ها (between-groups variability)SSb و تنوع درون گروه ها (within-groups variability)SSw تقسیم می کند، همانطور که در شکل زیر نشان داده شده است:
در این طرح، تنوع درون گروه ها SSw به عنوان تنوع خطا (error variability)SSerror تعریف می شود. پس از تقسیم بر درجات آزادی مناسب، مجموع مجذورات (mean sum of squares) بین گروه هاMSb و درون گروه ها MSw تعیین می شود و یک آزمون F به عنوان نسبت MSb به MSw یا MSerror محاسبه می شود. در زیر نشان داده شده است:
ANOVA ی اندازه گیری های مکرر یک آزمون F را به روشی مشابه محاسبه می کند:
ANOVA ی اندازه گیری های مکرر این است که “در حالی که تنوع درون گروه ها SSw تنوع خطا SSerror را در یک ANOVA مستقل (independent ANOVA) (بین سوژه ها) بیان می کند”، ANOVA ی اندازه گیری های مکرر می تواند این عبارت خطا را بیشتر تقسیم کند و اندازه آن را کاهش دهد. در زیر نشان داده شده است:
این اثر باعث افزایش مقدار آزمون F به دلیل کاهش مخرج می شود و منجر به افزایش قدرت آزمون برای تشخیص تفاوت های قابل توجه بین میانگین ها می شود. از نظر ریاضی، و همانطور که در بالا نشان داده شد، ما تنوع قابل انتساب به تفاوت بین گروه ها (SSconditions) و تنوع درون گروه هاSSw را دقیقاً همانطور که در ANOVA بین سوژه ها (مستقل) انجام می دهیم، تقسیم بندی می کنیم.
با این حال، با ANOVA ی اندازه گیری های مکرر، از آنجایی که ما از سوژه ها مشابه در هر گروه استفاده می کنیم، می توانیم تنوع را به دلیل تفاوت های فردی بین سوژه ها، که به عنوان SSsubjects نامیده می شود، از تنوع درون گروه هاSSw حذف کنیم. چگونه این امر محقق می شود؟ خیلی ساده، ما هر سوژه را به عنوان یک بلوک در نظر می گیریم. یعنی هر سوژه ای تبدیل به سطحی از عاملی به نام سوژه ها می شود. سپس این متغیر را همانطور که با هر عامل بین سوژه ای انجام می دهیم محاسبه می کنیم. توانایی تفریق SSsubjects یک عبارت SSerror کوچکتر را در اختیار ما قرار می دهد، همانطور که در زیر مشخص شده است:
محاسبه ANOVA ی اندازه گیری های مکرر
به منظور ارائه نمایشی از نحوه محاسبه ANOVA ی اندازه گیری های مکرر، با مثالی از یک مطالعه تمرینی-ورزشی 6 ماهه شروع خواهیم کرد که در آن شش سوژه سطح آمادگی جسمانی خود را در سه نوبت اندازه گیری کردند: قبل، 3 ماه و پس از آن. مطالعه داده های آنها به همراه برخی از محاسبات اولیه در زیر نشان داده شده است:
ANOVA ی اندازه گیری های مکرر، مانند سایر ANOVA ها، یک آزمون F ایجاد می کند که برای تعیین اهمیت آماری استفاده می شود. آزمون F به صورت زیر محاسبه می شود:
قبلاً با SSconditions آشنا شده اید، اما در برخی از محاسبات، SSconditions ای را مشاهده خواهید کرد که گاهی اوقات به آنها SStime گفته می شود. هر دوی آنها مجموع مربعهای تفاوت بین گروههای مرتبط sum of squares for the differences between related groups)) را نشان میدهند، اما SStime نام مناسبتری برای بررسی آزمایشهای دوره زمانی است، همانطور که در این مثال هستیم. نمودار زیر پارتیشن بندی واریانس را نشان می دهد که در محاسبه ANOVA ی اندازه گیری های مکرر رخ می دهد.
برای محاسبه یک آزمون F باید SSconditions و SSerror را محاسبه کنیم. SSconditions را می توان مستقیماً به راحتی محاسبه کرد (همانطور که در یک ANOVA مستقل به عنوان SSb با آن مواجه خواهید شد). اگرچه میتوان SSerror را مستقیماً محاسبه کرد، اما در مقایسه با استخراج آن از مجموع مربعهای دیگر که محاسبه آسانتر هستند، یعنی SSsubjects و SST یا SSw، تا حدودی دشوار است. سپس SSerror را می توان به دو روش محاسبه کرد:
هر دو روش برای محاسبه آزمون F نیاز به محاسبه SSconditions و SSsubjects دارند، اما پس از آن شما می توانید با محاسبه SST یا SSw ابتدا SSerror را تعیین کنید. هیچ روش درست یا غلطی وجود ندارد و روش های دیگری نیز وجود دارد. این فقط ترجیح شخصی است که کدام روش را انتخاب می کنید. برای اهداف این نمایش، ما آن را با استفاده از روش اول، یعنی محاسبه SSw، محاسبه خواهیم کرد.
محاسبه SStime
همانطور که قبلا ذکر شد، محاسبه SStime مانند SSb در یک ANOVA مستقل است و می تواند به صورت زیر بیان شود:
که در آن k = تعداد شرایط، ni = تعداد سوژه ها تحت هر شرط، = میانگین مقدار برای هر شرط، = میانگین کل می باشد. بنابراین، در مثال ما، داریم:
توجه داشته باشید که چون ما یک طرح اندازه گیری های مکرر داریم، ni برای هر تکرار یکسان است: این تعداد سوژه ها در طراحی ما است. از این رو، به سادگی می توانیم هر گروه را با این عدد چند برابر کنیم. برای تجسم بهتر محاسبه بالا، جدول زیر ارقام استفاده شده در محاسبه را مشخص می کند:
محاسبه SSw
تنوع درون گروهیSSw نیز به همان روشی که در یک ANOVA مستقل محاسبه میشود، به صورت زیر بیان میشود:
که در آن xi1 مقدار ikمین سوژه در گروه 1، xi2 مقدار ikمین سوژه در گروه 2 و xik مقدار ikمین سوژه در گروه k است. در مثال ما:
برای تجسم بهتر محاسبه بالا، جدول زیر ارقام استفاده شده در محاسبه را مشخص می کند:
محاسبه SSsubjects
همانطور که قبلا ذکر شد، ما هر سوژه را به عنوان یک بلوک خاص خود در نظر می گیریم. به عبارت دیگر، ما با هر سوژه به عنوان سطحی از یک عامل مستقل به نام سوژه ها برخورد می کنیم. سپس می توانیم SSsubjects را به صورت زیر محاسبه کنیم:
که در آن k = تعداد شرایط، = میانگین سوژه i، و = میانگین کل است. در مثال ما:
برای تجسم بهتر محاسبه بالا، جدول زیر ارقام استفاده شده در محاسبه را مشخص می کند:
محاسبه SSerror
اکنون می توانیم SSerror را با جایگزینی محاسبه کنیم:
که در مثال ما:
تعیین MStime، MSerror و آزمون F
برای تعیین مجموع میانگین مربعات زمان MStime ما SStime را بر درجات آزادی مرتبط با آن (k-1) تقسیم می کنیم، جایی که k = تعداد نقاط زمانی است. در مثال ما:
ما همین کار را برای مجموع میانگین مربعات خطاMSerror انجام می دهیم، این بار تقسیم بر (n (n – 1)(k – 1) درجه آزادی، که در آن n = تعداد سوژه ها و k = تعداد نقاط زمانی است. در مثال ما:
بنابراین، می توانیم آزمون F را به صورت زیر محاسبه کنیم:
اکنون میتوانیم جستجو کنیم (یا از یک برنامه کامپیوتری استفاده کنیم) تا آزمون F بحرانی (critical F-statistic) را برای توزیع F (F-distribution) خود تعیین کنیم (با درجات آزادی ما برای زمان (dftime) و خطا (dferror)) و تعیین کنید که آیا آزمون F ما یک نتیجه آماری معنی دار را نشان می دهد یا خیر.
گزارش نتیجه یک ANOVA ی اندازه گیری های مکرر
ما آزمون F را از یک ANOVA ی اندازه گیری های مکرر به صورت زیر گزارش می کنیم:
که برای مثال ما این خواهد بود:
این بدان معناست که می توانیم فرضیه صفر را رد کنیم و فرضیه جایگزین را بپذیریم. همانطور که بعداً بحث خواهیم کرد، فرضیات و اندازههای اثر وجود دارد که میتوانیم محاسبه کنیم که میتواند نحوه گزارش نتیجه بالا را تغییر دهد. با این حال، در غیر این صورت، یافتههای بالا را برای این مطالعه تمرینی-ورزشی به عنوان مثال گزارش میکنیم:
اثر آماری معنیداری زمان بر تناسب اندام ناشی از ورزش وجود داشت.
یا
برنامه تمرینی-ورزشی شش ماهه از نظر آماری تأثیر معنیداری بر سطوح آمادگی جسمانی داشت.
ارائه جدولی ANOVA ی اندازه گیری های مکرر
به طور معمول، نتیجه یک ANOVA ی اندازه گیری های مکرر در متن نوشته شده، مانند بالا، هنگام نوشتن گزارش ارائه می شود. با این حال، اکثر برنامه های آماری، مانند آمار SPSS، نتیجه یک ANOVA ی اندازه گیری های مکرر را به صورت جدولی گزارش می کنند. انجام این کار به کاربر اجازه می دهد تا درک کامل تری از تمام محاسبات انجام شده توسط برنامه به دست آورد. جدول زیر نشان دهنده نوع جدولی است که به شما ارائه می شود و نشان می دهد که معنی بخش های مختلف چیست.
اغلب، ردیف Subjects ارائه نمی شود و گاهی اوقات ردیف Total نیز حذف می شود. آزمون F یافت شده در ردیف اول (ردیف زمان/شرایط) آزمون F است که تعیین می کند که آیا بین حداقل دو میانگین تفاوت معنی داری وجود دارد یا خیر. برای نتایج ما، با حذف ردیف Subjects و Total، ما داریم:
که مشابه خروجی تولید شده توسط SPSS است.
افزایش قدرت در ANOVA ی اندازه گیری های مکرر
مزیت اصلی اجرای یک ANOVA ی اندازه گیری های مکرر نسبت به یک ANOVA مستقل این است که تست به طور کلی بسیار قدرتمندتر است. این مزیت خاص با کاهش MSerror (مخرج آزمون F) حاصل می شود که از تقسیم تنوع به دلیل تفاوت بین سوژه ها (SSsubjects) از عبارت خطای اصلی در یک ANOVA مستقلSSw (یعنی Serror = SSw – SSsubjects ) است. برای مثال ANOVA ی اندازه گیری های مکرر ما یک نتیجه (F(2, 10) = 12.53, p = .002) به دست آوردیم. اگر ما به جای آن یک ANOVA مستقل اجرا کرده بودیم نتیجه را F(2, 15) = 1.504, p = .254 به دست آوردیم.
ما به وضوح میتوانیم مزیت استفاده از سوژههای مشابه را در مقایسه با سوژههای مختلف در یک ANOVA اندازهگیریهای مکرر ببینیم. برای مثال تمرینی-ورزشی ما، تصویر زیر نشان میدهد که پس از حذف SSsubjects از SSw، یک عبارت خطا SSerror باقی میماند که تنها 8٪ به بزرگی عبارت خطای مستقل ANOVA است.
این منجر به افزایش خودکار آزمون F نمی شود زیرا تعداد درجات آزادی بیشتر برای SSw نسبت به SSerror وجود دارد. با این حال، معمولاً SSsubjects درصد زیادی از تنوع درون گروهی را در نظر میگیرند که کاهش عبارت خطا به اندازهای بزرگ است که بیش از جبران کاهش درجات آزادی باشد (همانطور که در انتخاب F توزیع استفاده میشود).
اندازه اثر برای ANOVA ی اندازه گیری های مکرر
گزارش کردن اندازه اثر در مجلات و گزارش ها رایج تر است. مربع اتا یا «اتا جزئی» (Partial eta-squared) جایی است که SSsubjects از مخرج حذف شده است (همان چیزی است که توسط SPSS تولید می شود):
بنابراین، برای مثال ما، این منجر به یک Partial eta-squared می شود:
فرضیات اساسی: نرمال بودن
مشابه سایر آزمونهای ANOVA، هر سطح از متغیر مستقل باید تقریباً به طور نرمال توزیع شود
فرضیات اساسی: کروی بودن
مفهوم کروی، برای همه مقاصد، اندازه گیری های مکرر معادل همگنی واریانس ها است. تست کروی بودن (sphericity) یک گزینه در آمار SPSS با استفاده از تست کروی بودن Mauchly به عنوان بخشی از روش اندازه گیری های مکرر GLM است. ما میتوانیم نتایج خود را بنویسیم ، که در آن تست کروی بودن Mauchly را به صورت زیر درج کردهایم:
آزمون کروی بودن Mauchly نشان داد که فرض کروی بودن نقض شده است (χ2(2) = 22.115, p < .0005) و بنابراین، تصحیح Greenhouse-Geisser استفاده شد. تأثیر زمان بر غلظت کلسترول معنیدار بود، (F(1.171, 38) = 21.032, p < .0005).
مطالب زیر را هم از دست ندهید:
نحوه تعیین خودکار تعداد خوشه ها توسط قانون آرنج
هوش مصنوعی (AI) چیست؟ 3 چیز که باید بدانید
تجزیه و تحلیل آماری: تعریف، مثال
15 پاسخ