آزمون Kruskal-Wallis
آزمون کروسکال-والیس یک آزمون غیرپارامتریک (بدون توزیع) است و زمانی استفاده می شود که فرضیات ANOVA یک طرفه برآورده نشود. هر دو آزمون Kruskal-Wallis و ANOVA یکطرفه تفاوتهای معنیداری را روی یک متغیر وابسته پیوسته توسط یک متغیر مستقل طبقهبندی (با دو یا چند گروه) ارزیابی میکنند. در بخش مواد و روش های مقاله و آنالیز واریانس، فرض میکنیم که متغیر وابسته به طور نرمال توزیع شده است و واریانس تقریباً برابری در نمرات بین گروهها وجود دارد. اما هنگام استفاده از آزمون Kruskal-Wallis، ما مجبور نیستیم هیچ یک از این فرضیات را انجام دهیم. بنابراین، آزمون کروسکال والیس را می توان هم برای متغیرهای وابسته پیوسته و هم برای متغیرهای وابسته در سطح ترتیبی استفاده کرد. با این حال، مانند اکثر آزمونهای غیرپارامتریک، آزمون Kruskal-Wallis به اندازه ANOVA قدرتمند نیست.
فرضیه های کلی آزمون کروسکال-والیس به شرح زیر است:
فرضیه صفر (H0) این است که میانه های جمعیت برابر است یا نمونه ها از جمعیت های مشابه آمده اند.
فرضیه جایگزین (H1) این است که میانه های جمعیت برابر نیستند، یا اینکه میانه جمعیت با میانه جمعیت یکی از گروه های دیگر متفاوت است. در واقع حداقل یکی از نمونه ها (گروه ها) از جمعیت متفاوتی نسبت به سایر نمونه ها (گروه ها) می آید.
مفروضات جزئی آزمون کروسکال-والیس به شرح زیر است:
- داده ها غیر نرمال فرض می شوند یا دارای توزیع اریب (Skewed) هستند. زمانی که داده ها از توزیع نرمال پیروی می کنند باید از ANOVA یک طرفه استفاده شود.
- متغیر مورد نظر باید دو یا چند گروه مستقل داشته باشد. این آزمون بیشتر در تجزیه و تحلیل سه گروه یا بیشتر استفاده می شود – برای تجزیه و تحلیل دو گروه باید از آزمون من ویتنی U استفاده شود.
- فرض بر این است که داده ها توزیع مشابهی در بین گروه ها دارند.
- دادهها باید بهطور تصادفی از نمونههای مستقل انتخاب شوند، به طوری که گروهها هیچ ارتباطی با یکدیگر نداشته باشند.
- هر نمونه گروهی باید حداقل 5 مشاهده داشته باشد تا حجم نمونه کافی داشته باشد.
این مفروضات مشابه آزمون Mann-Whitney U هستند، زیرا آزمون Kruskal-Wallis اساساً آزمون بسط یافته من ویتنی با بیش از دو نمونه مستقل است. مشابه آزمون U Mann-Whitney، آزمون Kruskal-Wallis بر اساس رتبه بندی داده ها و محاسبه آماره آزمون است.
بهترین حالت استفاده از آزمون کروسکال-والیس
آزمون کروسکال والیس و سایر آزمونهای غیرپارامتریک (یا بدون توزیع) زمانی برای آزمایش فرضیهها مفید هستند که فرض نرمال بودن دادهها برقرار نباشد. این تست ها هیچ فرضی در مورد شکل توزیع دادهها ندارند و این باعث میشود زمانی که یک مجموعه داده کوچک است، خیلی مفید باشند.
توجه کنید که هنگام انجام آزمونهای آماری غیرپارامتریک، معمولا نتیجه محافظهکارانهتری (مقدار p بزرگتر) نسبت به همتایان پارامتری خود به دست می آیند.
نکته: تست کروسکال والیس باید زمانی استفاده شود که متغیر مورد نظر پیوسته باشد (مثلا هر عددی در یک محدوده، به عنوان مثال، سن، قد، فشار خون) یا گسسته (به عنوان مثال، اندازه کفش، تعداد، تعداد مراجعه به بیمارستان، تعداد افراد یک خانوار).
مثال های استفاده از آزمون کروسکال-والیس:
- چه تفاوت هایی بین نمرات مقاطع مختلف دانش آموزان ابتدایی وجود دارد؟
- آیا نمرات رضایت شغلی بر حسب نژاد متفاوت است؟
- رابطه بین عادات خواب جوانان و سلامت ذهنی شان به چه صورت است؟ یعنی مثلا شرکت کنندگان در سه گروه خواب کمتر از 6 ساعت، بین 6 تا 8 ساعت، و بیش تر از 8 ساعت دسته بندی می شوند.
اگر تعداد مشاهدات در هر گروه 5 یا بیشتر باشد، توزیع آماره آزمون کروسکال والیس نوعی تقریب توزیع Chi-square با k-1 درجه آزادی ارائه می دهد. اگر مقدار محاسبه شده آزمون کروسکال والیس کمتر از مقدار بحرانی کای اسکوئر باشد، نمی توان فرضیه صفر را رد کرد. اما اگر مقدار محاسبه شده آزمون کروسکال والیس بیشتر از مقدار بحرانی کای اسکوئر باشد، میتوان فرضیه صفر را رد کرد و گفت که حداقل یکی از نمونهها از جامعه متفاوتی می اید.
پاسخگوی سوالات و نظرات شما هستیم