اعتبار یا روایی درونی در تحقیق

773 Views

روایی درونی (Internal Validity) به این موضوع اشاره دارد که آیا طراحی و انجام یک مطالعه می تواند از وجود رابطه علی بین متغیرهای مستقل و وابسته حمایت کند یا خیر. در واقع تضمین می کند که هیچ متغیر دیگری به جز متغیر مستقل باعث ایجاد اثر مشاهده شده بر روی متغیر وابسته نشده است. انجام تحقیقاتی که از اعتبار درونی و بیرونی قوی برخوردار باشد نیازمند برنامه ریزی و طراحی مدبرانه از ابتدا است.

به جای تسریع در فرآیند طراحی، عاقلانه است که زمان کافی برای ساختاربندی مطالعه ای که روش شناختی قوی داشته و به طور گسترده قابل اجرا باشد، صرف کنید. با در نظر گرفتن دقیق عواملی که می توانند اعتبار درونی و بیرونی را در مرحله طراحی به خطر بیاندازند، می توان از رفع مشکلات بعدی اجتناب کرد.

تحقیقاتی که اعتبار درونی و بیرونی بالایی را نشان می‌دهند، امکان نتیجه‌گیری قوی درباره یافته‌ها را فراهم می‌کنند. اگرچه ممکن است به تلاش اولیه بیشتری نیاز داشاته باشید، اما اطمینان از روایی درونی و بیرونی معتبر برای تولید تحقیقات معنادار و تأثیرگذار ضروری است. در واقع روایی درونی برای اینکه بتوانیم نتایج معتبری از تحقیقات بدست آوریم بسیار مهم است چون به محققان اجازه می دهد تا توضیحات جایگزین برای یافته های مطالعه را علاوه بر عامل مورد آزمایش، رد کنند.

برای مثال، اگر برنامه ترک سیگار را اجرا کنید و شاهد بهبودی در بین شرکت‌کنندگان باشید، اعتبار درونی بالا به این معنی است که می‌توانید مطمئن باشید که این به دلیل خود برنامه بوده است و نه تأثیرات دیگر.

اعتبار درونی سیاه و سفید نیست – یعنی در مورد سطح اطمینانی صحبت می کند که ما می‌توانیم به نتایج داشته باشیم. مبنای آن بر اساس این است که چقدر خوب متغیرهایی که بالقوه می توانند نتایج را تضعیف کنند کنترل کرده ایم. هر چه یک مطالعه بیشتر از «عوامل مخدوش‌کننده» بالقوه اجتناب کند، اعتبار درونی آن بیشتر می‌شود و می‌توانیم به رابطه علت و معلولی که کشف می‌کند اعتماد بیشتری داشته باشیم.

برای عموم مردم، اعتبار درونی مهم است زیرا به این معنی است که می توان به نتایج و نکات اولیه یک مطالعه اعتماد کرد و آن ها را به کار برد.

تهدیداتی برای اعتبار درونی

متغیرهای مخدوش کننده

متغیرهای مخدوش کننده عوامل خارجی هستند که بر متغیرهای وابسته در یک آزمایش تأثیر می گذارند و باعث ایجاد یک ارتباط گمراه کننده می شوند و جداسازی اثر واقعی متغیر مستقل را دشوار می کنند. این منغیرها اعتبار درونی را تهدید می کنند زیرا توضیحات جایگزینی برای نتایج مطالعه ارائه می دهند و مشخص نیست که آیا تغییرات در متغیر وابسته واقعاً به دلیل دستکاری متغیر مستقل است یا به دلیل متغیر مخدوش کننده.

عدم کنترل متغیرهای خارجی توانایی محققان را برای ایجاد استنتاج های علّی منطقی تضعیف می کند. با این حال، متأسفانه، کنترل متغیرهای مخدوش کننده در خارج از تنظیمات آزمایشگاهی دشوار است. به هر حال، کمپبل (1957) چندین متغیر مخدوش کننده را شناسایی کرد که می توانند اعتبار درونی را تهدید کنند.

عوامل مربوط به شرکت کنندگان

سوگیری‌های واکنش شرکت‌کننده اعتبار درونی را تهدید می‌کند زیرا شرکت‌کنندگان ممکن است زمانی که بدانند مشاهده می‌شوند متفاوت عمل کنند (اثر Hawthorne). این سوگیری‌ها شامل انتظارات شرکت‌کننده، واکنش مشارکت‌کننده، و نگرانی از ارزیابی است.

انتظارات شرکت کننده زمانی رخ می دهد که یک شرکت کننده، آگاهانه یا ناخودآگاه، تلاش می کند به گونه ای رفتار کند که آزمایشگر از آنها انتظار دارد. شرکت کننده ای که بیش از حد لازم همکاری می کند ممکن است اغلب رفتار خود را بر اساس عواملی مانند بستر و دستورات مطالعه تغییر دهد. انتظارات شرکت کننده نیز ممکن است در طول فرآیند غربالگری شرکت کننده رخ دهد. برای مثال، شرکت‌کننده‌ای که امیدوار است در مطالعه‌ای درباره افسردگی شرکت کند، ممکن است علائم خود را در یک پرسشنامه غربالگری اغراق کند تا واجد شرایط بیشتری برای مطالعه به نظر برسد.

واکنش شرکت کننده زمانی اتفاق می افتد که شرکت کنندگان عمداً سعی می کنند برخلاف فرضیه آزمایشگر عمل کنند. به عنوان مثال، اگر در حال مطالعه اثرات قرار گرفتن در معرض نور روز بر عادات خواب باشد، یک شرکت‌کننده ممکن است عمداً دقیقاً در همان زمان بخوابد، صرف نظر از اینکه آیا در معرض نور روز قرار گرفته است یا خیر. عدم همکاری عمدی می تواند ناشی از تمایل به خودمختاری یا استقلال باشد (برهم، 1966).

دغدغه یا نگرانی از ارزیابی زمانی اتفاق می‌افتد که تمایل به داشتن ظاهری سازگار با باورهای اجتماعی یا گروهی بر پاسخ‌های شرکت‌کنندگان تأثیر بگذارد. این سبک پاسخ می تواند پاسخ ها را قطبی کند و منجر به نتیجه گیری های نامناسب شود. به عنوان مثال، از شرکت کنندگان در مورد نظرات خود در مورد یک موضوع سیاسی در یک گروه سوال می شود، و ممکن است برای انطباق با پاسخ های سایر اعضای گروه احساس فشار کنند.

به طور کلی، محققان می توانند این سوگیری ها را با تضمین ناشناس بودن شرکت کنندگان، استفاده از داستان های پوششی، مشاهدات پنهان (unobtrusive) و اقدامات غیرمستقیم کاهش دهند.

سوگیری نمونه گیری

سوگیری نمونه گیری زمانی رخ می دهد که فرآیند انتخاب شرکت کنندگان برای یک مطالعه تحقیقاتی منجر به تفاوت های کلیدی بین گروه ها شود که می تواند نتایج را منحرف کند. این امر اعتبار درونی را تهدید می کند زیرا خطای سیستماتیک را در مقایسه بین گروه آزمایش و گروه کنترل ایجاد می کند. برای مثال، فرض کنید یک مطالعه در حال آزمایش یک برنامه تدریس خصوصی ریاضی جدید است و دانش‌آموزان به‌طور تصادفی در این برنامه شرکت می‌کنند (گروه آزمایش) یا به آموزش عادی (گروه کنترل) ادامه می‌دهند. با این حال، محقق ناخودآگاه از دانش‌آموزان گروه آزمایشی از کلاس‌های ریاضی پیشرفته نمونه‌گیری می‌کند، در حالی که گروه کنترل از کلاس‌های ریاضی معمولی نمونه‌گیری می‌شود.

در این مورد، یک سوگیری نمونه‌گیری اتفاق می افتد، زیرا دانش‌آموزان گروه آزمایش ممکن است توانایی‌های ریاضی یا سطوح انگیزه بالاتری نسبت به گروه کنترل داشته باشند. در واقع، هر گونه تأثیر مثبت مشاهده شده از برنامه تدریس خصوصی می تواند صرفاً به دلیل این تفاوت های از قبل موجود باشد نه اینکه نتیجه واقعی خود برنامه باشد.

فرسایش یا ریزش

به گفته کمبل (1957)، فرسایش یا ریزش، که به عنوان مرگ و میر تجربی شناخته می شود، به ترک یا از دست رفتن متفاوت شرکت کنندگان مطالعه در گروه های آزمایش و کنترل اشاره دارد. یعنی اگر میزان ریزش بین گروه های آزمایش و کنترل تفاوت معنی داری داشته باشد، این می تواند اعتبار درونی را تهدید کند.

برای مثال، یک کارآزمایی بالینی را تصور کنید که اثربخشی یک درمان جدید برای افسردگی را آزمایش می کند. شرکت کنندگان به طور تصادفی به مدت 8 هفته یا درمان (گروه تجربی) یا بدون درمان (گروه کنترل) را دریافت می کنند.

در طول مطالعه، تعدادی از شرکت کنندگان از هر دو گروه مطالعه را ترک کرده و در پیگیری از دست می روند. اما دو برابر تعداد شرکت کنندگان از گروه کنترل نسبت به گروه آزمایش انصراف دادند. این تفاوت در ریزش، سوگیری تحقیق را مشخص می‌کند زیرا شرکت‌کنندگانی که در هر شرایط باقی می‌مانند دیگر معادل نیستند – گروه آزمایش اکنون تعداد بیشتری از شرکت‌کنندگان اصلی خود را در مقایسه با زیرمجموعه کوچک‌تر باقی‌مانده در گروه کنترل دارد.

هر گونه تفاوت مشاهده شده در سطوح افسردگی در پایان مطالعه می تواند به دلیل این عدم تعادل سیستماتیک باشد نه اینکه اثر واقعی درمان باشد.

سوگیری آزمایشگر

سوگیری آزمایشگر به زمانی اشاره دارد که انتظارات، ادراکات یا انگیزه های محقق بر نتیجه آزمایش به روش های ناخودآگاه تأثیر می گذارد. این امر اعتبار درونی را تهدید می کند زیرا توضیحی جایگزین برای نتایج در کنار متغیر مستقل مورد آزمایش ارائه می دهد.

به عنوان مثال، یک روانشناس در حال انجام آزمایشی در مورد تأثیر تحسین بر عملکرد کودک است. روانشناس این فرضیه را مطرح می کند که تمجید از کودکان باعث بهبود عملکرد آنها می شود. در طول آزمایش، او به طور ناخودآگاه تشویق و زبان بدن مثبت بیشتری را هنگام تعامل با گروه ستایش در مقابل گروه خنثی ارائه می کرد. در نتیجه، گروه ستایش عملکرد بهتری از خود نشان می دهد. با این حال، مشخص نیست که آیا این واقعاً به دلیل ستایش پیش‌بینی‌کننده است یا سوگیری سهوی آزمایشگر، جایی که کودکان از نشانه‌های حمایتی ظریف محقق استفاده می‌کنند.

این نکته نشان می‌دهد که چگونه سوگیری شناختی یک محقق می‌تواند به‌طور ناخودآگاه بر پاسخ‌ها و رفتار شرکت‌کنندگان تأثیر بگذارد، به نحوی که رابطه علی بین متغیرها را مخدوش کند.

تاریخچه یا پیشینه

تاریخچه رویدادهای خاصی را در بر می گیرد که یک شرکت کننده در مطالعه در طول آزمایشی تجربه می کند که بخشی از خود آزمایش نیست.

این مسئله به طور خاص، اعتبار درونی آزمایش‌هایی را که در دوره‌های زمانی طولانی‌تری انجام می‌شوند، تهدید می‌کند. به عنوان مثال، یک کارآزمایی بالینی 12 ماهه را تصور کنید که یک روان درمانی جدید برای کاهش اضطراب آزمایش می کند. شرکت‌کنندگان به‌طور تصادفی برای دریافت درمان جدید یا درمان موجود تقسیم می‌شوند. با این حال، 8 ماه پس از آزمایش، همه گیری COVID-19 آغاز می شود. این رویداد خارجی سطح اضطراب را برای مردم در همه جا افزایش می دهد. در پایان کارآزمایی، سطح اضطراب مجدداً ارزیابی می شود. گروه درمانی جدید در مقایسه با گروه درمانی موجود، کاهش بیشتری را در اضطراب نشان می دهد.

با این حال، مشخص نیست که آیا این تفاوت واقعاً به دلیل اثربخشی درمان جدید است یا متغیر مخدوش‌کننده COVID-19 که باعث افزایش اضطراب در گروه کنترل می‌شود. شاید اگر همه گیری نبود، اضطراب در هر دو گروه به طور مشابه کاهش می یافت. این نشان می‌دهد که چگونه تاریخچه می‌تواند بی نظمی ها و تبیین‌های جایگزینی را معرفی کند که اعتبار درونی را تضعیف می‌کند.

ابزار تحقیق

ابزار تحقیق به توانایی ابزارهای تجربی برای ارائه نتایج ثابت در طول دوره مطالعه اشاره دارد.

تهدیدات ابزار زمانی اتفاق می‌افتد که تغییراتی در کالیبراسیون یا مدیریت ابزارها، بررسی‌ها یا اقدامات مورد استفاده برای جمع‌آوری داده‌ها در طول یک مطالعه ایجاد شود. این مسئله می تواند خطای اندازه گیری سیستماتیک را معرفی کند و یک توضیح جایگزین برای هر گونه تفاوت مشاهده شده به غیر از متغیر مستقل ارائه دهد.

به عنوان مثال، محققی که از دستگاهی با باتری برای اندازه‌گیری فشار خون استفاده می‌کند، در آزمایشی که به منظور بررسی اثربخشی یک دارو در کاهش فشار خون انجام می‌شود، شاید متوجه شود که پوسیدگی پیش‌رونده باتری ممکن است منجر به این شود که این قرائت‌ها در پس‌آزمون پایین‌تر از پیش آزمون نشان داده شوند.

ابزار تحقیق به ابزار الکترونیکی یا مکانیکی محدود نمی شود. به عنوان مثال، محقق تازه استخدام شده ای که از او خواسته می شود وضعیت سلامت روان شرکت کنندگان را در طول یک ماه ارزیابی کند، ممکن است با تجربه، بتواند در پس آزمون با دقت بیشتری نسبت به پیش آزمون به شرکت کنندگان امتیاز دهد.

انتشار اطلاعات بین شرکت کنندگان

انتشار اطلاعات و درمان بین بیماران می تواند اعتبار درونی را زیر سوال ببرد. اطلاعات مربوط به درمان یعنی وضعیتی که در آن شرکت کنندگان در تحقیق، مداخله ای متفاوت از مداخله ای که به آنها اختصاص داده شده است را اتخاذ می کنند زیرا معتقدند مداخلات مختلف مؤثرتر هستند. برای مثال، یک شرکت‌کننده کنترل در یک مطالعه کاهش وزن که می‌آموزد افرادی که در گروه درمان هستند بیشتر از آنها وزن کم می‌کنند، ممکن است مداخله گروه درمان را بپذیرد.

انتشار متفاوت اطلاعات همچنین زمانی رخ می دهد که به شرکت کنندگان دستورالعمل ها یا دستورالعمل های متفاوتی داده می شود که ممکن است توسط کسانی که مطالعه را انجام می دهند به اشتباه تفسیر شوند. به عنوان مثال، شرکت کنندگانی که از آنها خواسته می شود یک دارو را هر دو هفته یکبار مصرف کنند، ممکن است آن را دو بار در هفته یا هر دو هفته یک بار مصرف کنند.

بلوغ یا پختگی (Maturation)

بلوغ شامل هر گونه تغییر بیولوژیکی مربوط به سن یا هر چیزی می شود که با گذشت زمان رخ می دهد. این می تواند شامل گرسنگی، خستگی، بهبود زخم، بهبودی پس از جراحی و پیشرفت بیماری باشد.

بلوغ اعتبار درونی را تهدید می کند زیرا تغییرات طبیعی در طول زمان می تواند به جای خود متغیر مستقل، توضیحی جایگزین برای نتایج مطالعه ارائه دهد.

به عنوان مثال، در یک مطالعه یک ساله یک برنامه خواندنی جدید برای کودکان، دانش آموزان ممکن است در طول سال دستاوردهای خواندن را نشان دهند. با این حال، بخشی از این بهبود می تواند صرفا به دلیل رشد عصبی و رشد مهارت های خواندن باشد که با افزایش سن انتظار می رود.

اثرات بلوغ همچنین می‌تواند بر مطالعاتی که مدت کوتاهی دارند تأثیر بگذارد – به عنوان مثال، کودکانی که یک کار کامپیوتری تکراری انجام می‌دهند ممکن است در عرض یک ساعت تمرکز خود را از دست بدهند و در نتیجه عملکردشان بدتر شود.

تست کردن

آزمودن یا تست کردن به زمانی اطلاق می‌شود که شرکت‌کنندگانی که در آزمون یا ارزشیابی شرکت می‌کنند، می‌توانند صرفاً از تجربه قبلی بهتر عمل کنند. آشنایی با آزمون به جای هر مداخله یا متغیر مستقلی که مورد مطالعه قرار می گیرد، می تواند بر نتایج تأثیر بگذارد.

به عنوان مثال، فرض کنید یک محقق در حال آزمایش روش جدیدی برای بهبود حافظه در افراد مسن است. شرکت کنندگان قبل و بعد از تکمیل برنامه آموزشی جدید حافظه، تحت ارزیابی حافظه قرار می گیرند.

با این حال، شرکت کنندگان ممکن است بهبود حافظه را در پس آزمون نشان دهند تا حدی فقط به این دلیل که این دومین بار بود که دقیقاً همان آزمون را انجام می دادند. تجربه قبلی آنها در رابطه با سؤالات و فرمت تست به نفع امتیاز آنها است.

این نشان می دهد که چگونه آزمایش های مکرر روی معیارهای مشابه می تواند اعتبار درونی را تهدید کند. این توضیح جایگزینی را ارائه می دهد که بهبودها به جای اینکه نتیجه واقعی مداخله باشد، به دلیل تأثیرات تمرینی بوده است.

چگونه می توانیم از تهدیدات اعتبار داخلی جلوگیری کنیم؟

برخی از روش‌های افزایش اعتبار درونی یک آزمایش عبارتند از:

تخصیص تصادفی

تخصیص تصادفی تکنیکی است که افراد را برای گروه های درمانی بدون توجه به اراده محقق یا شرایط و ترجیح بیمار انتخاب می کند. این امر اعتبار درونی را با کاهش سوگیری آزمایشگر و انتخاب افزایش می دهد.

انتخاب تصادفی

انتخاب تصادفی شرکت کنندگان به جلوگیری از تفاوت های سیستماتیک بین گروه ها کمک می کند که می توانند توضیحات جایگزین ارائه دهند. این اطمینان را ایجاد می کند که هر عاملی که از قبل موجود بوده متوازن به طور تصادفی توزیع شده است، و توانایی نسبت دادن نتایج به متغیر مستقل را به جای مخدوشگر تقویت می کند.

کور کردن

کور کردن (یا پوشاندن) به بی اطلاعی شرکت کنندگان در کارآزمایی، ارائه دهندگان مراقبت های بهداشتی و جمع آوری داده ها از مداخله تعیین شده اشاره دارد تا تحت تأثیر دانش قرار نگیرند. این امر سوگیری در ابزار تحقیق، نرخ ریزش و سوگیری شرکت کننده را به حداقل می رساند.

گروه های کنترل

گروه‌های کنترل گروه‌هایی هستند که شرط آزمایشی برای آنها اعمال نمی‌شود. که در واقع نشان می دهد که آیا تفاوت واضحی در نتیجه (خروجی) مربوط به کاربرد متغیر مستقل وجود دارد یا خیر.

استفاده از یک گروه کنترل در ترکیب با تخصیص تصادفی، یک کارآزمایی تصادفی کنترلی را تشکیل می دهد، که محققان آن را “استاندارد طلایی” برای تحقیقات روانشناختی یا پزشکی می دانند.

پروتکل مطالعه

پروتکل‌های مطالعه، طرح‌های از پیش تعریف‌شده‌ای هستند که تمام جنبه‌های یک مطالعه را شرح می‌دهند: طراحی آزمایشی، روش‌شناسی، روش‌های جمع‌آوری و تجزیه و تحلیل داده‌ها و غیره. این مسئله به اطمینان از ثبات در طول مطالعه، کاهش اثرات ابزار تحقیق و انتشار افتراقی اطلاعات بر اعتبار داخلی کمک می کند

پنهان سازی تخصیص

در یک مطالعه تحقیقاتی که دو درمان را با هم مقایسه می‌کند، شرکت‌کنندگان باید به‌طور تصادفی تقسیم شوند تا نه محققین و نه شرکت‌کنندگان ندانند کدام درمان را زودتر از موعد دریافت خواهند کرد. این فرآیند پنهان کردن تخصیصدر آینده، پنهان‌سازی تخصیص نامیده می‌شود که خیلی مهم است زیرا اگر محققان یا شرکت کنندگان بدانند یا بر درمان کسی تأثیر بگذارند، تصادفی بودن را از بین می برد.

برای مثال، اگر محققی معتقد باشد که یک درمان بهتر است، ممکن است شرکت‌کنندگان بیمار را به سمت آن سوق دهد تا اینکه آنها را به طور تصادفی اختصاص دهند.

پنهان نگه داشتن تخصیص مناسب با پنهان نگه داشتن تخصیص آتی و اطمینان از تخخصیص تصادفی گروهی بی طرفانه از این امر جلوگیری می کند.

مثال اعتبار داخلی

یک محقق فرض می کند که یک برنامه آموزشی شناختی جدید حافظه و توجه را در سالمندان بهبود می بخشد. برای آزمایش این فرضیه، محقق به‌طور تصادفی افراد مسن‌تر از یک جامعه بازنشسته مشابه را به مدت 8 هفته به برنامه آموزشی جدید (گروه آزمایش) یا برنامه آموزش بهداشت عمومی (گروه کنترل) اختصاص می‌دهد.

محقق آزمایش را دوبار کور می کند، بنابراین نه شرکت کنندگان و نه مدیران آزمون نمی دانند چه کسی در هر گروه است. قبل و بعد از دوره 8 هفته ای به شرکت کنندگان تست حافظه و توجه داده می شود. محقق با جمع‌آوری داده‌های مربوط به عملکرد شناختی پایه، وضعیت سلامت، سن، سطح تحصیلات و جنسیت، هر متغیر مخدوش‌کننده بالقوه ای را محاسبه می‌کند.

پروتکل های سختگیرانه ای برای ارائه برنامه های آموزشی شناختی و بهداشتی به طور یکسان برای به حداقل رساندن سوگیری های مربی استفاده می شود. تحلیل‌های آماری بررسی می‌کنند که ریزش تأثیر متفاوتی بر گروه‌ها نداشته باشد. با این کنترل‌ها، محقق می‌تواند اعتبار درونی قوی داشته باشد تا تعیین کند که آیا بهبودهای مشاهده‌شده ناشی از آموزش‌های شناختی جدید است و نه متغیرهای دیگر.

تفاوت بین اعتبار درونی و بیرونی چیست؟

روایی یا اعتبار به این اشاره دارد که یک آزمون با چه دقتی آنچه را که ادعا می کند اندازه گیری می کند. اعتبار درونی عبارت است از علیت و عدم تداخل عوامل خارجی، در حالی که اعتبار خارجی بیان کننده تعمیم پذیری یک آزمایش به موقعیت ها یا گروه های مختلف است.

چرا اعتبار درونی در یک آزمایش واقعی مهمتر از اعتبار خارجی است؟

اعتبار داخلی مربوط به استحکام یک آزمایش به خودی خود است. آزمایشی با اعتبار بیرونی اما نه درونی نمی تواند برای نتیجه گیری علیت استفاده شود. بنابراین، به طور کلی برای استنباط علمی غیر قابل اعتماد است. برعکس، آزمایشی که فقط اعتبار درونی دارد، حداقل می‌تواند برای ارائه روابط علی در یک زمینه محدود مورد استفاده قرار گیرد.

مفاهیم آماری

آکادمی ویرایش ایران

آکادمی ویرایش ایران از سال 1395 فعالیت حرفه ای خود را در زمینه ویرایش تخصصی مقالات علمی (ویرایش نیتیو)، ترجمه فارسی به انگلیسی حرفه ای مقالات برای ارسال به ژورنال های ISI و آموزش مقاله نویسی تخصصی و جامع آغاز کرد.

مشاهده نمونه ویرایش ها مشاهده همه آموزش ها

آکادمی ویرایش ایران

با ما تماس بگیرید

ایمیل ما

اعتبار یا روایی درونی در تحقیق