اعتبار یا روایی درونی در تحقیق
روایی درونی (Internal Validity) به این موضوع اشاره دارد که آیا طراحی و انجام یک مطالعه می تواند از وجود رابطه علی بین متغیرهای مستقل و وابسته حمایت کند یا خیر. در واقع تضمین می کند که هیچ متغیر دیگری به جز متغیر مستقل باعث ایجاد اثر مشاهده شده بر روی متغیر وابسته نشده است. انجام تحقیقاتی که از اعتبار درونی و بیرونی قوی برخوردار باشد نیازمند برنامه ریزی و طراحی مدبرانه از ابتدا است.
به جای تسریع در فرآیند طراحی، عاقلانه است که زمان کافی برای ساختاربندی مطالعه ای که روش شناختی قوی داشته و به طور گسترده قابل اجرا باشد، صرف کنید. با در نظر گرفتن دقیق عواملی که می توانند اعتبار درونی و بیرونی را در مرحله طراحی به خطر بیاندازند، می توان از رفع مشکلات بعدی اجتناب کرد.
تحقیقاتی که اعتبار درونی و بیرونی بالایی را نشان میدهند، امکان نتیجهگیری قوی درباره یافتهها را فراهم میکنند. اگرچه ممکن است به تلاش اولیه بیشتری نیاز داشاته باشید، اما اطمینان از روایی درونی و بیرونی معتبر برای تولید تحقیقات معنادار و تأثیرگذار ضروری است. در واقع روایی درونی برای اینکه بتوانیم نتایج معتبری از تحقیقات بدست آوریم بسیار مهم است چون به محققان اجازه می دهد تا توضیحات جایگزین برای یافته های مطالعه را علاوه بر عامل مورد آزمایش، رد کنند.
برای مثال، اگر برنامه ترک سیگار را اجرا کنید و شاهد بهبودی در بین شرکتکنندگان باشید، اعتبار درونی بالا به این معنی است که میتوانید مطمئن باشید که این به دلیل خود برنامه بوده است و نه تأثیرات دیگر.
اعتبار درونی سیاه و سفید نیست – یعنی در مورد سطح اطمینانی صحبت می کند که ما میتوانیم به نتایج داشته باشیم. مبنای آن بر اساس این است که چقدر خوب متغیرهایی که بالقوه می توانند نتایج را تضعیف کنند کنترل کرده ایم. هر چه یک مطالعه بیشتر از «عوامل مخدوشکننده» بالقوه اجتناب کند، اعتبار درونی آن بیشتر میشود و میتوانیم به رابطه علت و معلولی که کشف میکند اعتماد بیشتری داشته باشیم.
برای عموم مردم، اعتبار درونی مهم است زیرا به این معنی است که می توان به نتایج و نکات اولیه یک مطالعه اعتماد کرد و آن ها را به کار برد.
تهدیداتی برای اعتبار درونی
متغیرهای مخدوش کننده
متغیرهای مخدوش کننده عوامل خارجی هستند که بر متغیرهای وابسته در یک آزمایش تأثیر می گذارند و باعث ایجاد یک ارتباط گمراه کننده می شوند و جداسازی اثر واقعی متغیر مستقل را دشوار می کنند. این منغیرها اعتبار درونی را تهدید می کنند زیرا توضیحات جایگزینی برای نتایج مطالعه ارائه می دهند و مشخص نیست که آیا تغییرات در متغیر وابسته واقعاً به دلیل دستکاری متغیر مستقل است یا به دلیل متغیر مخدوش کننده.
عدم کنترل متغیرهای خارجی توانایی محققان را برای ایجاد استنتاج های علّی منطقی تضعیف می کند. با این حال، متأسفانه، کنترل متغیرهای مخدوش کننده در خارج از تنظیمات آزمایشگاهی دشوار است. به هر حال، کمپبل (1957) چندین متغیر مخدوش کننده را شناسایی کرد که می توانند اعتبار درونی را تهدید کنند.
عوامل مربوط به شرکت کنندگان
سوگیریهای واکنش شرکتکننده اعتبار درونی را تهدید میکند زیرا شرکتکنندگان ممکن است زمانی که بدانند مشاهده میشوند متفاوت عمل کنند (اثر Hawthorne). این سوگیریها شامل انتظارات شرکتکننده، واکنش مشارکتکننده، و نگرانی از ارزیابی است.
انتظارات شرکت کننده زمانی رخ می دهد که یک شرکت کننده، آگاهانه یا ناخودآگاه، تلاش می کند به گونه ای رفتار کند که آزمایشگر از آنها انتظار دارد. شرکت کننده ای که بیش از حد لازم همکاری می کند ممکن است اغلب رفتار خود را بر اساس عواملی مانند بستر و دستورات مطالعه تغییر دهد. انتظارات شرکت کننده نیز ممکن است در طول فرآیند غربالگری شرکت کننده رخ دهد. برای مثال، شرکتکنندهای که امیدوار است در مطالعهای درباره افسردگی شرکت کند، ممکن است علائم خود را در یک پرسشنامه غربالگری اغراق کند تا واجد شرایط بیشتری برای مطالعه به نظر برسد.
واکنش شرکت کننده زمانی اتفاق می افتد که شرکت کنندگان عمداً سعی می کنند برخلاف فرضیه آزمایشگر عمل کنند. به عنوان مثال، اگر در حال مطالعه اثرات قرار گرفتن در معرض نور روز بر عادات خواب باشد، یک شرکتکننده ممکن است عمداً دقیقاً در همان زمان بخوابد، صرف نظر از اینکه آیا در معرض نور روز قرار گرفته است یا خیر. عدم همکاری عمدی می تواند ناشی از تمایل به خودمختاری یا استقلال باشد (برهم، 1966).
دغدغه یا نگرانی از ارزیابی زمانی اتفاق میافتد که تمایل به داشتن ظاهری سازگار با باورهای اجتماعی یا گروهی بر پاسخهای شرکتکنندگان تأثیر بگذارد. این سبک پاسخ می تواند پاسخ ها را قطبی کند و منجر به نتیجه گیری های نامناسب شود. به عنوان مثال، از شرکت کنندگان در مورد نظرات خود در مورد یک موضوع سیاسی در یک گروه سوال می شود، و ممکن است برای انطباق با پاسخ های سایر اعضای گروه احساس فشار کنند.
به طور کلی، محققان می توانند این سوگیری ها را با تضمین ناشناس بودن شرکت کنندگان، استفاده از داستان های پوششی، مشاهدات پنهان (unobtrusive) و اقدامات غیرمستقیم کاهش دهند.
سوگیری نمونه گیری
سوگیری نمونه گیری زمانی رخ می دهد که فرآیند انتخاب شرکت کنندگان برای یک مطالعه تحقیقاتی منجر به تفاوت های کلیدی بین گروه ها شود که می تواند نتایج را منحرف کند. این امر اعتبار درونی را تهدید می کند زیرا خطای سیستماتیک را در مقایسه بین گروه آزمایش و گروه کنترل ایجاد می کند. برای مثال، فرض کنید یک مطالعه در حال آزمایش یک برنامه تدریس خصوصی ریاضی جدید است و دانشآموزان بهطور تصادفی در این برنامه شرکت میکنند (گروه آزمایش) یا به آموزش عادی (گروه کنترل) ادامه میدهند. با این حال، محقق ناخودآگاه از دانشآموزان گروه آزمایشی از کلاسهای ریاضی پیشرفته نمونهگیری میکند، در حالی که گروه کنترل از کلاسهای ریاضی معمولی نمونهگیری میشود.
در این مورد، یک سوگیری نمونهگیری اتفاق می افتد، زیرا دانشآموزان گروه آزمایش ممکن است تواناییهای ریاضی یا سطوح انگیزه بالاتری نسبت به گروه کنترل داشته باشند. در واقع، هر گونه تأثیر مثبت مشاهده شده از برنامه تدریس خصوصی می تواند صرفاً به دلیل این تفاوت های از قبل موجود باشد نه اینکه نتیجه واقعی خود برنامه باشد.
فرسایش یا ریزش
به گفته کمبل (1957)، فرسایش یا ریزش، که به عنوان مرگ و میر تجربی شناخته می شود، به ترک یا از دست رفتن متفاوت شرکت کنندگان مطالعه در گروه های آزمایش و کنترل اشاره دارد. یعنی اگر میزان ریزش بین گروه های آزمایش و کنترل تفاوت معنی داری داشته باشد، این می تواند اعتبار درونی را تهدید کند.
برای مثال، یک کارآزمایی بالینی را تصور کنید که اثربخشی یک درمان جدید برای افسردگی را آزمایش می کند. شرکت کنندگان به طور تصادفی به مدت 8 هفته یا درمان (گروه تجربی) یا بدون درمان (گروه کنترل) را دریافت می کنند.
در طول مطالعه، تعدادی از شرکت کنندگان از هر دو گروه مطالعه را ترک کرده و در پیگیری از دست می روند. اما دو برابر تعداد شرکت کنندگان از گروه کنترل نسبت به گروه آزمایش انصراف دادند. این تفاوت در ریزش، سوگیری تحقیق را مشخص میکند زیرا شرکتکنندگانی که در هر شرایط باقی میمانند دیگر معادل نیستند – گروه آزمایش اکنون تعداد بیشتری از شرکتکنندگان اصلی خود را در مقایسه با زیرمجموعه کوچکتر باقیمانده در گروه کنترل دارد.
هر گونه تفاوت مشاهده شده در سطوح افسردگی در پایان مطالعه می تواند به دلیل این عدم تعادل سیستماتیک باشد نه اینکه اثر واقعی درمان باشد.
سوگیری آزمایشگر
سوگیری آزمایشگر به زمانی اشاره دارد که انتظارات، ادراکات یا انگیزه های محقق بر نتیجه آزمایش به روش های ناخودآگاه تأثیر می گذارد. این امر اعتبار درونی را تهدید می کند زیرا توضیحی جایگزین برای نتایج در کنار متغیر مستقل مورد آزمایش ارائه می دهد.
به عنوان مثال، یک روانشناس در حال انجام آزمایشی در مورد تأثیر تحسین بر عملکرد کودک است. روانشناس این فرضیه را مطرح می کند که تمجید از کودکان باعث بهبود عملکرد آنها می شود. در طول آزمایش، او به طور ناخودآگاه تشویق و زبان بدن مثبت بیشتری را هنگام تعامل با گروه ستایش در مقابل گروه خنثی ارائه می کرد. در نتیجه، گروه ستایش عملکرد بهتری از خود نشان می دهد. با این حال، مشخص نیست که آیا این واقعاً به دلیل ستایش پیشبینیکننده است یا سوگیری سهوی آزمایشگر، جایی که کودکان از نشانههای حمایتی ظریف محقق استفاده میکنند.
این نکته نشان میدهد که چگونه سوگیری شناختی یک محقق میتواند بهطور ناخودآگاه بر پاسخها و رفتار شرکتکنندگان تأثیر بگذارد، به نحوی که رابطه علی بین متغیرها را مخدوش کند.
تاریخچه یا پیشینه
تاریخچه رویدادهای خاصی را در بر می گیرد که یک شرکت کننده در مطالعه در طول آزمایشی تجربه می کند که بخشی از خود آزمایش نیست.
این مسئله به طور خاص، اعتبار درونی آزمایشهایی را که در دورههای زمانی طولانیتری انجام میشوند، تهدید میکند. به عنوان مثال، یک کارآزمایی بالینی 12 ماهه را تصور کنید که یک روان درمانی جدید برای کاهش اضطراب آزمایش می کند. شرکتکنندگان بهطور تصادفی برای دریافت درمان جدید یا درمان موجود تقسیم میشوند. با این حال، 8 ماه پس از آزمایش، همه گیری COVID-19 آغاز می شود. این رویداد خارجی سطح اضطراب را برای مردم در همه جا افزایش می دهد. در پایان کارآزمایی، سطح اضطراب مجدداً ارزیابی می شود. گروه درمانی جدید در مقایسه با گروه درمانی موجود، کاهش بیشتری را در اضطراب نشان می دهد.
با این حال، مشخص نیست که آیا این تفاوت واقعاً به دلیل اثربخشی درمان جدید است یا متغیر مخدوشکننده COVID-19 که باعث افزایش اضطراب در گروه کنترل میشود. شاید اگر همه گیری نبود، اضطراب در هر دو گروه به طور مشابه کاهش می یافت. این نشان میدهد که چگونه تاریخچه میتواند بی نظمی ها و تبیینهای جایگزینی را معرفی کند که اعتبار درونی را تضعیف میکند.
ابزار تحقیق
ابزار تحقیق به توانایی ابزارهای تجربی برای ارائه نتایج ثابت در طول دوره مطالعه اشاره دارد.
تهدیدات ابزار زمانی اتفاق میافتد که تغییراتی در کالیبراسیون یا مدیریت ابزارها، بررسیها یا اقدامات مورد استفاده برای جمعآوری دادهها در طول یک مطالعه ایجاد شود. این مسئله می تواند خطای اندازه گیری سیستماتیک را معرفی کند و یک توضیح جایگزین برای هر گونه تفاوت مشاهده شده به غیر از متغیر مستقل ارائه دهد.
به عنوان مثال، محققی که از دستگاهی با باتری برای اندازهگیری فشار خون استفاده میکند، در آزمایشی که به منظور بررسی اثربخشی یک دارو در کاهش فشار خون انجام میشود، شاید متوجه شود که پوسیدگی پیشرونده باتری ممکن است منجر به این شود که این قرائتها در پسآزمون پایینتر از پیش آزمون نشان داده شوند.
ابزار تحقیق به ابزار الکترونیکی یا مکانیکی محدود نمی شود. به عنوان مثال، محقق تازه استخدام شده ای که از او خواسته می شود وضعیت سلامت روان شرکت کنندگان را در طول یک ماه ارزیابی کند، ممکن است با تجربه، بتواند در پس آزمون با دقت بیشتری نسبت به پیش آزمون به شرکت کنندگان امتیاز دهد.
انتشار اطلاعات بین شرکت کنندگان
انتشار اطلاعات و درمان بین بیماران می تواند اعتبار درونی را زیر سوال ببرد. اطلاعات مربوط به درمان یعنی وضعیتی که در آن شرکت کنندگان در تحقیق، مداخله ای متفاوت از مداخله ای که به آنها اختصاص داده شده است را اتخاذ می کنند زیرا معتقدند مداخلات مختلف مؤثرتر هستند. برای مثال، یک شرکتکننده کنترل در یک مطالعه کاهش وزن که میآموزد افرادی که در گروه درمان هستند بیشتر از آنها وزن کم میکنند، ممکن است مداخله گروه درمان را بپذیرد.
انتشار متفاوت اطلاعات همچنین زمانی رخ می دهد که به شرکت کنندگان دستورالعمل ها یا دستورالعمل های متفاوتی داده می شود که ممکن است توسط کسانی که مطالعه را انجام می دهند به اشتباه تفسیر شوند. به عنوان مثال، شرکت کنندگانی که از آنها خواسته می شود یک دارو را هر دو هفته یکبار مصرف کنند، ممکن است آن را دو بار در هفته یا هر دو هفته یک بار مصرف کنند.
بلوغ یا پختگی (Maturation)
بلوغ شامل هر گونه تغییر بیولوژیکی مربوط به سن یا هر چیزی می شود که با گذشت زمان رخ می دهد. این می تواند شامل گرسنگی، خستگی، بهبود زخم، بهبودی پس از جراحی و پیشرفت بیماری باشد.
بلوغ اعتبار درونی را تهدید می کند زیرا تغییرات طبیعی در طول زمان می تواند به جای خود متغیر مستقل، توضیحی جایگزین برای نتایج مطالعه ارائه دهد.
به عنوان مثال، در یک مطالعه یک ساله یک برنامه خواندنی جدید برای کودکان، دانش آموزان ممکن است در طول سال دستاوردهای خواندن را نشان دهند. با این حال، بخشی از این بهبود می تواند صرفا به دلیل رشد عصبی و رشد مهارت های خواندن باشد که با افزایش سن انتظار می رود.
اثرات بلوغ همچنین میتواند بر مطالعاتی که مدت کوتاهی دارند تأثیر بگذارد – به عنوان مثال، کودکانی که یک کار کامپیوتری تکراری انجام میدهند ممکن است در عرض یک ساعت تمرکز خود را از دست بدهند و در نتیجه عملکردشان بدتر شود.
تست کردن
آزمودن یا تست کردن به زمانی اطلاق میشود که شرکتکنندگانی که در آزمون یا ارزشیابی شرکت میکنند، میتوانند صرفاً از تجربه قبلی بهتر عمل کنند. آشنایی با آزمون به جای هر مداخله یا متغیر مستقلی که مورد مطالعه قرار می گیرد، می تواند بر نتایج تأثیر بگذارد.
به عنوان مثال، فرض کنید یک محقق در حال آزمایش روش جدیدی برای بهبود حافظه در افراد مسن است. شرکت کنندگان قبل و بعد از تکمیل برنامه آموزشی جدید حافظه، تحت ارزیابی حافظه قرار می گیرند.
با این حال، شرکت کنندگان ممکن است بهبود حافظه را در پس آزمون نشان دهند تا حدی فقط به این دلیل که این دومین بار بود که دقیقاً همان آزمون را انجام می دادند. تجربه قبلی آنها در رابطه با سؤالات و فرمت تست به نفع امتیاز آنها است.
این نشان می دهد که چگونه آزمایش های مکرر روی معیارهای مشابه می تواند اعتبار درونی را تهدید کند. این توضیح جایگزینی را ارائه می دهد که بهبودها به جای اینکه نتیجه واقعی مداخله باشد، به دلیل تأثیرات تمرینی بوده است.
چگونه می توانیم از تهدیدات اعتبار داخلی جلوگیری کنیم؟
برخی از روشهای افزایش اعتبار درونی یک آزمایش عبارتند از:
تخصیص تصادفی
تخصیص تصادفی تکنیکی است که افراد را برای گروه های درمانی بدون توجه به اراده محقق یا شرایط و ترجیح بیمار انتخاب می کند. این امر اعتبار درونی را با کاهش سوگیری آزمایشگر و انتخاب افزایش می دهد.
انتخاب تصادفی
انتخاب تصادفی شرکت کنندگان به جلوگیری از تفاوت های سیستماتیک بین گروه ها کمک می کند که می توانند توضیحات جایگزین ارائه دهند. این اطمینان را ایجاد می کند که هر عاملی که از قبل موجود بوده متوازن به طور تصادفی توزیع شده است، و توانایی نسبت دادن نتایج به متغیر مستقل را به جای مخدوشگر تقویت می کند.
کور کردن
کور کردن (یا پوشاندن) به بی اطلاعی شرکت کنندگان در کارآزمایی، ارائه دهندگان مراقبت های بهداشتی و جمع آوری داده ها از مداخله تعیین شده اشاره دارد تا تحت تأثیر دانش قرار نگیرند. این امر سوگیری در ابزار تحقیق، نرخ ریزش و سوگیری شرکت کننده را به حداقل می رساند.
گروه های کنترل
گروههای کنترل گروههایی هستند که شرط آزمایشی برای آنها اعمال نمیشود. که در واقع نشان می دهد که آیا تفاوت واضحی در نتیجه (خروجی) مربوط به کاربرد متغیر مستقل وجود دارد یا خیر.
استفاده از یک گروه کنترل در ترکیب با تخصیص تصادفی، یک کارآزمایی تصادفی کنترلی را تشکیل می دهد، که محققان آن را “استاندارد طلایی” برای تحقیقات روانشناختی یا پزشکی می دانند.
پروتکل مطالعه
پروتکلهای مطالعه، طرحهای از پیش تعریفشدهای هستند که تمام جنبههای یک مطالعه را شرح میدهند: طراحی آزمایشی، روششناسی، روشهای جمعآوری و تجزیه و تحلیل دادهها و غیره. این مسئله به اطمینان از ثبات در طول مطالعه، کاهش اثرات ابزار تحقیق و انتشار افتراقی اطلاعات بر اعتبار داخلی کمک می کند
پنهان سازی تخصیص
در یک مطالعه تحقیقاتی که دو درمان را با هم مقایسه میکند، شرکتکنندگان باید بهطور تصادفی تقسیم شوند تا نه محققین و نه شرکتکنندگان ندانند کدام درمان را زودتر از موعد دریافت خواهند کرد. این فرآیند پنهان کردن تخصیصدر آینده، پنهانسازی تخصیص نامیده میشود که خیلی مهم است زیرا اگر محققان یا شرکت کنندگان بدانند یا بر درمان کسی تأثیر بگذارند، تصادفی بودن را از بین می برد.
برای مثال، اگر محققی معتقد باشد که یک درمان بهتر است، ممکن است شرکتکنندگان بیمار را به سمت آن سوق دهد تا اینکه آنها را به طور تصادفی اختصاص دهند.
پنهان نگه داشتن تخصیص مناسب با پنهان نگه داشتن تخصیص آتی و اطمینان از تخخصیص تصادفی گروهی بی طرفانه از این امر جلوگیری می کند.
مثال اعتبار داخلی
یک محقق فرض می کند که یک برنامه آموزشی شناختی جدید حافظه و توجه را در سالمندان بهبود می بخشد. برای آزمایش این فرضیه، محقق بهطور تصادفی افراد مسنتر از یک جامعه بازنشسته مشابه را به مدت 8 هفته به برنامه آموزشی جدید (گروه آزمایش) یا برنامه آموزش بهداشت عمومی (گروه کنترل) اختصاص میدهد.
محقق آزمایش را دوبار کور می کند، بنابراین نه شرکت کنندگان و نه مدیران آزمون نمی دانند چه کسی در هر گروه است. قبل و بعد از دوره 8 هفته ای به شرکت کنندگان تست حافظه و توجه داده می شود. محقق با جمعآوری دادههای مربوط به عملکرد شناختی پایه، وضعیت سلامت، سن، سطح تحصیلات و جنسیت، هر متغیر مخدوشکننده بالقوه ای را محاسبه میکند.
پروتکل های سختگیرانه ای برای ارائه برنامه های آموزشی شناختی و بهداشتی به طور یکسان برای به حداقل رساندن سوگیری های مربی استفاده می شود. تحلیلهای آماری بررسی میکنند که ریزش تأثیر متفاوتی بر گروهها نداشته باشد. با این کنترلها، محقق میتواند اعتبار درونی قوی داشته باشد تا تعیین کند که آیا بهبودهای مشاهدهشده ناشی از آموزشهای شناختی جدید است و نه متغیرهای دیگر.
تفاوت بین اعتبار درونی و بیرونی چیست؟
روایی یا اعتبار به این اشاره دارد که یک آزمون با چه دقتی آنچه را که ادعا می کند اندازه گیری می کند. اعتبار درونی عبارت است از علیت و عدم تداخل عوامل خارجی، در حالی که اعتبار خارجی بیان کننده تعمیم پذیری یک آزمایش به موقعیت ها یا گروه های مختلف است.
چرا اعتبار درونی در یک آزمایش واقعی مهمتر از اعتبار خارجی است؟
اعتبار داخلی مربوط به استحکام یک آزمایش به خودی خود است. آزمایشی با اعتبار بیرونی اما نه درونی نمی تواند برای نتیجه گیری علیت استفاده شود. بنابراین، به طور کلی برای استنباط علمی غیر قابل اعتماد است. برعکس، آزمایشی که فقط اعتبار درونی دارد، حداقل میتواند برای ارائه روابط علی در یک زمینه محدود مورد استفاده قرار گیرد.
پاسخگوی سوالات و نظرات شما هستیم