اصطلاحات سنجش آزمون
هنجار آزمون
-
اگر برای تفسیر نمرۀ یک دانش آموز آن نمره را با میانه یا میانگین نمرۀ یک گروه مرجع مقایسه کنیم به آن گروه مرجع گروه هنجار می گویند.گروه مرجع از کسانی تشکیل می یابد که به گونه ای شبیه به دانش آموز مورد نظر هستند. بنابراین، فایدۀ هنجار این است که برای قضاوت دربارۀ سطح نسبی عملکرد یک فرد به عنوان معیار به کار می رود.هنجار یابی یکی از مراحل اصلی در استاندارد کردن آزمون های وابسته به هنجار است.
در تعیین هنجار برای یک آزمون، باید سوال زیر را مورد توجه قرارداد:
آزمون در مورد چه گروهی به کار خواهد رفت؟
برای مثال اگر آزمون برای اندازه گیری ویژگیهای شخصیتی زنان به کار خواهد رفت، گروه مرجع یا گروه هنجار باید نمونه ای از تمام زنان باشد.یا اگر آزمون برای سنجش آمادگی خواندن کودکان پیش دبستانی به کار خواهد رفت، گروه مرجع باید از کودکان پیش دبستانی که هنوز آموزش خواندن را شروع نکرده اند تشکیل یابد.
هنجارهای مربوط به نمرات معیار موقعیت نسبی یک دانش آموز در یک گروه با نشان دادن فاصلۀ نمرۀ او از میانگین نمرات معلوم میشود. نمرات معیار، عملکرد هر دانش آموز را در یک آزمون، بنا بر اختلاف عملکرد او از میانگین گروه، بر حسب واحد انحراف معیار نشان می دهد .
نمرهz آن دسته از نمرات معیار که دارای توزیعی با میانگین صفر و انحراف معیار واحد(1) هستند به نمرات z (نمرات زی) شهرت دارند .
نمره T مجموعه نمرات معیار دیگری که به نمرات T (نمرات تی ) شهرت دارند برای رفع مشکلات نمرات z ابداع شده اند.
تعریف و انواع روایی آزمون
-
روایی اصطلاحی است که به هدفی که آزمون برای تحقق بخشیدن به آن درست شده است اشاره میکند.لین وگرانلاند (2000) روایی را یه صورت "یک ارزشیابی از کفایت و مناسبت تفسیرها و استفاده های نتایج سنجش" (ص73) تعریف کردهاند. کاپلان و ساکوزو (2001) گفتهاند "روایی میتوان به صورت به صورت توافق بین نمرۀ آزمون و کیفیتی که قرار است اندازه بگیرد تعریف کرد" (ص132). بنابر آنچه گفته شد، آزمونی دارای روایی است که برای اندازه گیری آنچه مورد نظر است کافی و مناسب باشد. برای مثال، یک آزمون پیشرفت تحصیلی ریاضی پنجم دبستان در صورتی یک آزمون رواست که محتوا و هدفهای آن درس را به خوبی آندازه گیری کند و بجز یادگیری دانشآموزان از آن درس چیز دیگری را شامل نباشد به عنوان مثالی دیگر از روایی، یک آزمون هوشی روا آزمونی است که تنها هوش افراد را اندازه گیری کند نه چیز دیگری را. بنابراین، یک آزمون ممکن است از جهتی روا باشد اما از جهاتی دیگر روا نباشد. پس، روایی یک امر نسبی است، نه یک ویژگی که هست یا نیست.
آزمونهای مورد استفاده در آموزش و پرورش و روانشناسی دارای سه هدف عمده هستند که به سه پرسش زیر پاسخ میدهند.
1. آیا سوالهای آزمون از محتوای درس یا موضوع مورد نظر یک نمونۀ خوب ارائه میدهند؟
2. آیا نمرات آزمون عملکرد فعلی یا آتی دانش آموزان را پیش بینی می کنند.
3. آیا نمرات آزمون به مفاهیم نظری یا سازه هایی که آزمون برای سنجش آنها درست شده است مربوط اند؟
سه مورد بالا به ترتیب سه نوع روایی محتوایی، ملاکی، و سازه را نشان می دهند.
تعریف پایایی آزمون
- پایایی یک وسیلۀ اندازه گیری عمدتاً به دقت نتایج حاصل از آن اشاره می کند. کاپلان و ساکوزوا (2001) گفتهاند" پایایی به دقت، اعتماد پذیری، ثبات، با تکرار پذیری نتایج آزمون اشاره میکند" (ص 11). رابطۀ بین روایی و پایایی از این قرار است که یک آزمون باید پایا باشد تا بتواند روا باشد. اگر آزمونی در هر بار اجرا بر روی تعدادی از دانش آموز نتایج مختلفی به دست دهد آن آزمون یک آزمون پایا نخواهد بود و در واقع هیچ چیز را به درستی اندازه نخواهد گرفت، و اگر یک آزمون چیزی را به درستی اندازهگیری نکند هیچ اطلاع مفیدی به ما نخواهد داد. برای مثال، یک آزمون حساب برای اندازه گیری محتوا و هدفهای درس تاریخ روا (مناسب) نیست، اما این آزمون می تواند مطالب حساب را که اندازه میگیرد با دقت (به طور پایا) اندازه گیری کند. پس، برای اینکه یک آزمون روا باشد باید نخست پایا باشد. یعنی پایایی شرط روایی است، اما روایی برای پایایی ضروری نیست.
-
روشهای تعیین پایایی
- روشهای تعیین پایایی متنوعاند و ما آنها را با استفاده از پیشنهادهای ایبل (1972)، ویرسما و جورس (1990)، و مرفی و دیویدشوفر(1994) به شرح زیر دسته بندی میکنیم:
- روش پایایی مصححان،
- روش بازآزمایی،
- روش فرمهای هم ارز،
- و روشهای همسانی درونی (روش دو نیمه کردن آزمون، روش کودر- ریچاردسون، و روش ضریب القای کرانباخ).
- در روش دو نیمه کردن آزمون، آزمون مورد نظر را یک بار با گروه واحدی از آزمون شوندگان اجرا می کنیم و، پس از اجرا، آن را به دو نیمه تقسیم مینماییم. در این روش، بهترین راه دو نیمه کردن آزمون این است که همۀ سوالهای فرد را یک آزمون به حساب آوریم، و همۀ سوالهای زوج را نیز آزمون دیگری بدانیم. ضریب همبستگی حاصل از نمرات دو نیمۀ آزمون ضریب پایایی هر یک از دو نیمه خواهد بود.
-
روش کورد ریچاردسون
- در روش کودر-ریچاردسون نیز آزمون تنها یک بار اجرا میشود، اما در این روش همۀ مادههای آزمون تحلیل میشوند. کودر و ریچاردسون برای همسانی درونی آزمون و تعیین پایایی آن دو فرمول مورد استفاده قرار دادهاند که به 20kR و 21 KR شهرت دارند.
-
روش ضریب الفا
- سومین روش تعیین پایایی آزمون با تاکید بر همسانی درونی روش ضریب آلفا نام دارد که به آن ضریب آلفا یا ضریب آلفای کرانباخ یا حتی آلفا نیز گفته میشود
حد تسلط آزمون
- تمیز بین حد تسلط و غیر حد تسلط :
- از آنجا که آزمونهای وابسته به ملاک دارای یک نمرۀ مرزی برای حد تسلط هستند، مثلاً نمره 85 از 100، بنابراین لازم است معلوم شود که آیا سوالهای آزمون در آن نقطه بین آزمون شوندگان قوی و ضعیف تمیز قائل می شوند یا نه. در شکل زیر حرف a معرف تعداد آزمون شوندگانی است که سوال را درست جواب داده اند اما در کل آزمون نمره ای کمتر از حد تسلط گرفته اند .همچنین b تعداد آزمون شوندگانی است که سوال را درست جواب داده اند و در نمره کل آزمون نیز به حد تسلط رسیده اند .حرف c نشان دهندۀ تعداد آزمون شوندگانی است که سوال را غلط جواب داده اند و در کل به حد تسلط نرسیده اند. و بالاخره حرف d معرف تعداد کسانی است که سوال مورد نظر را درست جواب نداده اند اما در نمره کل آزمون به حد تسلط رسیده اند. تعداد آزمون شوندگانی که به حد تسلط رسیده اند برابر است با b+d و تعداد کسانی که به حد تسلط نرسیده اند مساوی است با a+c .
- ضریب تمیز، یعنی D، برابر است با تفاوت بین سطوح دشواری سوال برای کسانی که به حد تسلط رسیده و آنهایی که به حد تسلط نرسیده اند، مطابق با فرمول زیر:
- این ضریب تمیز از 1- تا 1+ متغیر است. مقدار مثبت D نشان می دهد که سوال بین کسانی که به حد تسلط رسیده و کسانی که به حد تسلط نرسیده اند تمیز قائل شده است . وقتی که ضریب تمیز سوالی منفی است، نشان دهنده آن است که سوال در جهت خلاف سوالهای دیگر تمیز قائل می شود. چنین سوالی نیاز به بازبینی دارد.
نمرهz
- آن دسته از نمرات معیار که دارای توزیعی با میانگین صفر و انحراف معیار واحد(1) هستند به نمرات z (نمرات زی) شهرت دارند .
-
برای تبدیل نمرات خام به نمرات z از فرمول زیر استفاده می شود:
- نمرۀ z نشان می دهد که یک نمرۀ خام به اندازۀ چه تعداد از واحدهای انحراف معیار بالاتر یا پایین تر از میانگین است.
نمره T
-
مجموعه نمرات معیار دیگری که به نمرات( T Score ) شهرت دارند برای رفع مشکلات نمرات
Z ابداع شده اند. مقیاس نمرات T با ضرب نمرات Z در 10 و جمع کردن نمرات حاصل با 50 به دست می آید .بنابراین، آن دسته از نمرات معیار که دارای توزیعی با میانگین 50 و انحراف معیار 10 است توزیع نمرات T نام دارد. می توان فرمول محاسبۀ نمرات T را به صورت زیر نوشت:
T=10(z)+50
نمرات 9 بخشی
- 9- بسیار عالی ( 4% بالا)
- 8- عالی(7% بعدی)
- 7- خیلی خوب(12% بعدی)
- 6- خوب (17% بعدی)
- 5- متوسط(20%)
- 4- نسبتاً ضعیف(17% بعدی)
- 3- ضعیف(12% بعدی)
- 2- خیلی ضعیف(7% بعدی)
- 1-بیش از حد ضعیف(4% آخر)
گزینه های انحرافی
- علاوه بر تعیین ضریبهای دشواری و تمیز برای هر سوال، بررسی نحوۀ پراکندگی پاسخهای مربوط به گزینه های انحرافی هر سوال ضروری است. در تحلیل گزینه های انحرافی قاعدۀ کلی به شرح زیر است: هر گزینۀ انحرافی دست کم باید یک نفر از افراد گروه ضعیف را به خود جلب می کند تعداد افراد گروه ضعیف باید بیشتر از تعداد افراد گروه قوی باشد.دلیل این امر را به این گونه می توان توضیح داد که افراد گروه ضعیف در مجموع اطلاعات کمتری از مطالب آزمون دارند. بنابراین، در صورتی یک سوال به خوبی عمل می کند که افراد ضعیف بیشتر از افراد گروه قوی گزینه های انحرافی آن سوال را انتخاب نمایند.
- تحلیل گزینه های انحرافی به کمک منحنی ویژگی سوال:
- در نظریه سوال- پاسخ هر یک از گزینه های یک سوال چند گزینه ای ( چه گزینه درست و چه گزینه های انحرافی) می تواند اطلاعاتی دربارۀ دانش یا مهارت پاسخ دهنده به دست دهد.برای این منظور، لازم است، علاوه بر منحنی ویژگی گزینۀ درست، برای گزینه های غلط نیز منحنی ویژگی رسم کنیم.به عنوان نمونه، شکل 15-13 هم منحنی ویژگی گزینۀ درست (الف) و هم منحنیهای ویژگی گزینه های انحرافی، (ب،ج،د) را نشان می دهد. چنان که در شکل دیده می شود، گزینۀ درست یا گزینۀ الف دارای قدرت تمیز مثبت و بالاست.گزینۀ انحرافی ج نیز دارای قدرت تمیز مثبت و نسبتاً بالاست.اما گزینۀ د را کمتر کسی انتخاب کرده و قدرت تمیز ندارد.گزینۀ ب دارای قدرت تمیز منفی است، یعنی پاسخ دهندگان ضعیف بیشتر از پاسخ دهندگان قوی آن را انتخاب کرده اند.
منحنی ویژگی سوال
-
منحنی ویژگی سوال یک بازنمایی نموداری از رابطۀ بین احتمال پاسخ درست دادن به یک سوال و موقعیت آزمون شونده در صفت مورد اندازه گیری توسط آزمون است.
همچنین می توان گفت که منحنی ویژگی سوال احتمال پاسخ درست دادن را نسبت به صفت مکنون تعیین می کند.
برای تهیه منحنی ویژگی یک سوال، نسبت یا درصد آزمون شوندگانی که آن سوال را درست جواب داده اند در رابطه با نوعی ملاک یا معیار، مثلا نمرۀ کل آزمون آنها، رسم می شود. به سخن دیگر، بر روی منحنی افقی نمرۀ کل آزمون و بر روی محور عمودی نسبت آزمون شوندگانی که به سوال پاسخ درست داده اند مشخص می شود.
دقت کنید که در منحنی ویژگی سوال 1 (شکل زیر) نسبتهای درست برای این سوال همراه با افزایش نمرۀ کل آزمون افزایش می یابد.این مطلب نشان می دهد که:
هر چه نمرۀ کل آزمون یک فرد بزرگتر باشد با احتمال بیشتری به این سوال پاسخ درست خواهد داد.
از روی منحنی ویژگی سوال می توان ضریبها دشواری و تمیز را تعیین نمود. ضریب دشواری عبارت است از نمره معیاری که در ان 50 درصد آزمون شوندگان سوال درست را پاسخ داده اند.
ضریب تمیز برابر است با شیب منحنی ویژگی سوال.
اگر همه آزمون شوندگان به یک سوال جواب درست بدهند منحنی آن یک خط افقی واقع در بالای محور عمودی خواهد بود و اگر همه آزمون شوندگان به یک سوال جواب غلط بدهند منحنی ویژگی سوال آن نیز یک خط افقی خواهد بود.
در شکل زیر منحنی ویژگی های پنج سوال با هم مقایسه شده اند.
سوال الف) یک سوال ضعیف است زیرا بین آزمون شوندگان قوی و ضعیف تمیز قائل نمی شود.
سوال ب) یک سوال معیوب است زیرا این سوال با کل آزمون رابطه معکوس دارد به عبارت دیگر ضریب تمیز منفی دارد
سوال های پ) و ت) سوال های نسبتا خوبی هستند.
منحنی ویژگی سوال ث از منحنی ویژگی سوال پ و ت شیب کمتری دارد و نتیجه می گیریم که نمی تواند به خوبی سوالات پ وت تیمز بین گروه های قوی و ضعیف را انجام دهد
برازنده کردن منحنی ویژگی سوال:
برای استفاده بیشتر از منحنی سوال ، سعی می شود که مناسب ترین منحنی ریاضی آن سوال رسم شود. در صورتی که منحنی ریاضی سوال به نحو صحیحی رسم شود با کمک آن چند پارامتر مهم سوال را تعیین نمود:
1. پارامتر a که نشان دهندۀ شکل یا شیب منحنی ویژگی سوال است. چنان که قبلا دیدیم، شیب صعودی یا منحنی دارای شکل پلکانی نشان دهندۀ قدرت تمیز زیاد سوال است.
2. پارامتر b معرف آستانه یا همان ضریب دشواری سوال است. ضریب دشواری سوال برابر است با نمره ای از آزمون که آزمون که مقابل با نقطۀ تغییر یا نقطۀ عطف منحنی ویژگی سوال است.
3. پارامتر c یا پارامتر تصادف میزان حدس پذیری سوال را مشخص می کند.هر چه امکان کسب نمره از راه حدس زدن در یک سوال بیشتر باشد مقدار c برای آن سوال نیز بزرگ تر است.
ضریب تمیز
- ضریب تمیز که با d نشان داده می شود قدرت سوال را در تمایز گذاری یا تشخیص بین گروه قوی و گروه ضعیف آزمون شوندگان مشخص می کند،(بر خلاف ضریب دشواری که میزان آسان بودن یا دشوار بودن یک سوال را برای گروه آزمون شوندگان نشان می دهد،) یعنی معلوم مینماید که سوال تا چه اندازه می تواند گروه قوی را از گروه ضعیف جدا سازد. برای محاسبۀ ضریب تمیز یک سوال از فرمول زیر استفاده می شود:
-
تفسیر ضریب :
- تمیز هر قدر ضریب تمیز بزرگتر باشد، قوه تمیز آن سوال بیشتر و هر قدر این ضریب کوچکتر باشد قوۀ تمیز آن کمتر است. گاه اتفاق می افتد که ضریب تمیز سوالی منفی است.این نوع ضریب تمیز نشان می دهد مه در آن سوال گروه قوی بدتر از گروه ضعیف عمل کرده است. این گونه سوالها دارای معایب اساسی هستند که یا باید به کلی کنار گذاشته شوند یا در آنها تجدید نظر اساسی صورت پذیرد.اگر سوال دارای اشکال فنی نباشد، دلیل چنین ضریبی می تواند این باشد که افراد گروه بالا یا آن سوال را به طور کامل یاد نگرفته اند یا آن را به غلط آموخته اند.بنابراین، تمامی ضریبهای تمیز سوالهای آزمون باید مثبت باشند.
- رابطه بین ضریب تمیز و ضریب دشواری به صورت زیر است:
ضریب دشواری
- محاسبه ضریب دشواری سوال بنا به تعریف، درصد کل آزمون شوندگانی که به سک سوال جواب درست میدهند ضریب دشواری آن سوال است که با حرف P نشان داده میشود.اگر در تحلیل یک سوال کلیه افراد یا کلیه برگههای امتحانی دخالت داشته باشند برای محاسبهی ضریب دشواری سوال آن کافی است که تعداد کل افرادی را که به آن سوال جواب درست دادهاند بر تعداد کل آزمون شوندگان تقسیم کنیم و نتیجه را در 100 ضرب نماییم. رقم حاصل ضریب دشواری سوال است. مطابق فرمول زیر:
- در این فرمول R معرف تعداد کسانی است که به سوال جواب درست داده و T نشان دهنده تعداد کل آزمون شوندگان است. در مواردی که تعداد آزمون شوندگان( تعداد برگههای آزمون) زیاد است و اطلاعات ما به نحوۀ پاسخدهی افراد گروه بالا و گروه پایین محدود میشود، لازم است از فرمول زیر استفاده کنیم:
- بر اساس توضیحات بالا، هر اندازه ضریب دشواری یک سوال بزرگتر (به 100 نزدیک تر) باشد، آن سوال آسان تر است و هر اندازه که این ضریب کوچک تر (به صفر نزدیک تر) باشد سوال دشوارتر است. چنان که ملاحظه شد، فرمول بالا ضریب دشواری را بر حسب یک عدد صحیح دو رقمی نشان میدهد. برخی از متخصصان اندازه گیری و ارزشیابی ترجیح میدهند که این ضریب، مانند ضریب تمیز، بر حسب اعداد اعشاری باشد که تفسیر آن با تفسیر ضریب تمیز همانند صورت گیرد.
- تفسیر ضریب دشواری:
- اگر در تفسیر ضریب دشواری یا ضریب سهولت سوال با آزمونهای وابسته به هنجار سر و کار داشته باشیم، میتوانیم این ضریت را از دیدگاه آماری مورد بررسی قرار دهیم. یکی از انتظارات ما از آزمونهای وابسته به هنجار این است که برای آزمون شوندگان مختلف نمراتی به دست میدهد که در آن طول یک پیوستار پراکنده باشند، و هر چه این پراکندگی بیشتر باشد بهتر است. به سخن دیگر، هر چه واریانس نمرات حاصل از یک آزمون وابسته به هنجار بزرگ تر باشد آن آزمون آزمون بهتری است. در نتیجه، از لحاظ انتخاب برای گنجانیدن در فرم نهایی آزمون، سوالهایی بهتر هستند که ضریب دشواری آنها از 1 کمتر و از صفر بیشتر و به 5/0 نزدیک باشد.البته انتخاب سوالهایی با ضرایب دشواری مناسب به نوع سوالهای آزمون مربوط است. در آزمونهای صحیح – غلط ضریب دشواری5/0 P= زمانی بدست می آید که همۀ آزمودنیها با حدس زدن به سوال جواب بدهند.آلن وین (1979) گفته اند برای آزمونهای چند گزینهای سطح بهینۀ دشواری اندکی کمتر از وسط فاصلۀ بین 1 و سطح موفقیت با حدس زدن است.منظور از سطح موفقیت با حدس زدن عبارت است از نسبت پاسخهای درستی که با حدس زدن حدود 25/0 است، و لذا سطح بهینۀ دشواری در وسط 25/0 و 1 یعنی در حدود 6/0 خواهد بود. برای تعیین رقم دقیق معرف ضریب دشواری بهینۀ سوال، ابتدا سطح موفقیت 100% را از سطح عملکرد با حدس زدن (مثلاً 25%) کم می کنیم و نتیجه را به 2 تقسیم می نماییم و نقطۀ میانی را مشخص می کنیم.
- پس از آن، حاصل از محاسبات بالا ( یعنی نقطۀ میانی ) را با سطح معرف عملکرد از طریق حدس زدن جمع می کنیم . به طور کلی، ضریبهای دشواری بین 3/0 و 7/0 حداکثر اطلاع را دربارۀ تفاوت بین آزمودنیها به دست می دهند.
ضریب کورد ریچاردسون
-
در روش کودر-ریچاردسون نیز آزمون تنها یک بار اجرا میشود، اما در این روش همۀ
مادههای آزمون تحلیل میشوند. کودر و ریچاردسون برای همسانی درونی آزمون و تعیین
پایایی آن دو فرمول مورد استفاده قرار دادهاند که به20 kR و 21 KR شهرت دارند.
به فرض اینکه تمام سوالهای آزمون دارای ضریب دشواری متوسط باشند، می توان به جای فرمول 20 KR از فرمول 21 KR به شرح زیر استفاده کرد:
چنان که گفتیم، در استفاده از فرمول 21 KR فرض بر این است که همۀ سوالها یا مادههای آزمون از لحاظ درجۀ دشواری شبیه به هم هستند. هر قدر از لحاظ درجۀ دشواری میان سوالهای آزمون تفاوت وجود داشته باشد، به همان نسبت از ضریب پایایی حاصل از فرمول21 KR کاسته میشود. اگر فرض شباهت درجۀ دشواری سوالها صحیح باشد، استفاده از این فرمول بسیار سادهتر از فرمول 20 kR است، زیرا در استفاده از فرمول 21 KR نیازی به محاسبۀ نسبت پاسخهای درست برای تک تک سوالهای آزمون نیست و تنها با داشتن سه جزء اطلاع زیر:
یعنی تعداد سوالها (n) میانگین نمرات آزمون ( X ̅)
و واریانس کل آزمون محاسبۀ ضریب پایایی مسیر است.
فرض اساسی فرمولهای کودر و ریچاردسون این است که سوالهای آزمون را میتوان به صورت 1 برای پاسخ درست و 0 (صفر) برای پاسخ غلط تصحیح کرد. بنابراین نمیتوان این فرمولها را برای محاسبۀ ضریب پایایی پرسشنامههایی که پاسخهای آنها از 1 تا 4 یا 5 را شامل میشوند مورد استفاده قرار داد
ضریب آلفای کرونباخ
-
سومین روش تعیین پایایی آزمون با تاکید بر همسانی درونی روش ضریب آلفا نام دارد که به آن ضریب آلفا یا ضریب آلفای کرانباخ یا حتی آلفا نیز گفته میشود
روش آلفای کرانباخ در شرایطی که نمرات سوال نه به صورت دو ارزشی صفر و 1 بلکه به صورت چند ارزشی تعیین میشود و 20 KR برای آن مناسب نیست قابل استفاده است – مثلاً در رابطه با نمرات حاصل از پرسشنامههای شخصیت یا نگرشسنج که پاسخ دهنده به هر سوال در طیفی از مثلاً کاملاً موافق تا کاملاً مخالف (5 تا 1) جواب میدهد و هیچ یک از آنها درست یا غلط محسوب نمیشود .
اگر بخشهای آزمون یا خرده آزمونهایی که از مجموع آنها آزمون کلی تشکیل شده است به طور جداگانه نمره گذاری بشوند، در آن صورت ضریب آلفا مستلزم این نیست که سوالهای انفرادی به صورت درست و غلط تصحیح شوند
کرانباخ (1951) واضع این روش تعیین پایایی است. در این روش، اجزا یا قسمتهای آزمون برای سنجش ضریب پایایی آزمون به کار میروند. اگر قسمتهای "آزمون همان سوالهای آزمون باشند و سوالها به صورت درست (1) و غلط (0) تصحیح بشوند، ضریب آلفا برابر خواهد بود با 20 KR (روش کودر ریچارسون)که قبلا معرفی شد. اما اگر، به جای سوالها یا مادهها، آزمون از بخشها یا قسمنهایی تشکیل شده باشد، مثل زمانی که یک آزمون از تعدادی خرده آزمون تشکیل یافته است، و بخواهیم از آنها در محاسبۀ ضریب پایایی کل آزمون استفاده کنیم، آنگاه از روش کرانباخ مطابق با فرمول زیر استفاده میکنیم:
ضریب همبستگی
- همبستگی بین نمرات در تعبیر و تفسیر نمرات دانشآموزان و دانشجویان، گاه لازم میآید که رابطۀ بین دو یا چند دسته نمره را تعیین کنیم. برای مثال، اغلب سوال میشود که نمرات هوش و نمرات پیشرفت تحصیلی چه رابطهای با هم دارند، و بسیاری از معلمان علاقه مندند که بدانند بین نمرات پیشرفت تحصیلی سالهای قبل و بعد رابطهای وجود دارد یا نه .میزان رابطۀ بین دو دسته نمرۀ متعلق به گروه واحدی از دانشآموزان یا دانشجویان را با محاسبۀ ضریب همبستگی مشخص میکنند متداولترین روش تعیین همبستگی، روش محاسبۀ ضریب همبستگی گشتاوری پیرسون است.این ضریب همبستگی با r نشان داده میشود.
- تفسیر ضریب همبستگی
- 1. رابطۀ بین متغیرهای مورد نظر ممکن است از جمعیتی به جمعیت دیگر فرق کند.
-
2. هر چه افراد مورد نظر در متغیرهایی که ضریب همبستگی بین آنها محاسبه میشود نامتناجس تر باشند ضریب همبستگی حاصل بزرگتر است.
- 3. ممکن است وجود همبستگی بین دو متغیر به علت یک رابطۀ واقعی بین آن دو نباشد، بلکه دلیل آن، ارتباط بین این دو متغیر با یک متغیر ثالث باشد. برای مثال، در روزهای برفی و بارانی زمستان، بین پوشیدن پالتو و استفاده از چتر، ضریب همبستگی مثبت وجود دارد. اما بر اساس این همبستگی نه میتوان گفت که پالتو پوشیدن دلیل استفاده از چتر است، نه استفاده از چتر دلیل پالتو پوشیدن.
- 4. ضریب همبستگی را نباید به صورت درصد تعبیر کرد.اما مجذور ضریب همبستگی نشان دهندۀ درصد وجه مشترک بین دو متغیر است.
- 5. هر چه قدر م 5. هر چه قدر مطلق ضریب همبستگی بین دو متغیر بیشتر باشد، مقدار رابطۀ بین آنها بیشتر است . بنابراین، ضریب همبستگی 60/0 + بیشتر از ضریب همبستگی 55/0+ است و ضریب همبستگی 72/0- از هر دو آنها بزرگ تر است. تنها تفاوت بین ضرایب مثبت و منفی در جهت رابطۀ بین متغیرهاست.ضریب همبستگی مثبت نشان دهندۀ رابطۀ مستقیم، اما ضریب همبستگی منفی نشان دهندۀ رابطۀ معکوس است.
ضریب همبستگی دو رشته ای نقطهای
-
زمانی که از دو متغیر مورد نظر که میخواهیم بین آنها ضریب همبستگی به دست آوریم یکی پیوسته و دیگری دو مقولگی یا دو ارزشی باشد از روش همبستگی دو رشتهای نقطهای استفاده میکنیم . منظور از متغیر دو ارزشی آن است که تنها یکی از دو مقدار یک یا صفر را شامل می شود، مانند بله- نه، زن_مرد ، و قبول- رد. معمولا به منظور انجام محاسبات به یکی از این دو مقوله نمره 1 و به یکی نمرۀ صفر(0) داده میشود. نمونۀ روشن این نوع نمرۀ گذاری، نمره دادن به سوالهای آزمونهای عینی، مانند آزمونهای چند گزینهای است.در این آزمونها به هر سوال درست نمرۀ 1 و به هر سوال غلط نمرۀ 0 داده میشود.
فرمول محاسبه ضریب همبستگی دو رشته ای نقطه ای که مورد خاصی از ضریب همبستگی گشتاوری است به صورت زیر است:
ضریب همبستگی گشتاوری پیرسون
-
متداول ترین روش همبستگی، همبستگی گشتاوری پیرسون است. اگر دو دسته نمرات X و Y
برای دو درس داشته باشیم با استفاده از نمرات خام می توان از فرمول زیر ضریب
همبستگی را به دست آورد:
منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف