نمونه گیری تصادفی ساده

صفحه 5

افتراق حسی می توان کنش های ذهنی از جمله هوش را اندازه گیری کرد. همان طوری که ملاحظه می شود آزمون های او پدیده های ساده فعالیت های روانی را اندازه گیری می کردند و فاقد نرم برای مقایسه افراد بودند. چنین زاویه دیدی البته منطبق با خط مشی آزمایشگاه روان شناسی وونت بود که تلاش می کرد روان شناسی را از بحث های فلسفی قرون گذشته آزاد سازد و آن را به شیوه تحقیقات علوم نزد یک نماید. این آزمون ها امروز به علت نداشتن روایی و اعتبار کافی به کار برده نمی شوند و جای خود را به آزمون های دقیق تری داده اند. به عبارت دیگر آنها حد فاصل بین تحقیقات اولیه روان شناسی تجربی با تحقیقات مربوط به آزمون های روانی بودند و تقریبا همان شیوه های تحقیق روان شناسی تجربی را درباره اندازه گیری های تفاوت های فردی به کار می بردند. البته وونت مخالف با اهداف این گونه تحقیقات بود زیرا اعتقاد داشت که هدف روان شناسی می باید به مانند سایر رشته های علوم کشف قوانین کلی پدیده های روانی باشد نه تفاوت های موجود بین افراد.

بحث تفاوت های فردی حدود یک دهه قبل با کارهای برجسته فرانسیس گالتن در انگلستان شروع شده بود. گالتن در اصل زیست شناس بود و تحقیقات خود را به منظور بررسی وجوه مختلف وراثت در بین افراد خویشاوند انجام می داد. او برای گردآوری اطلاعات آزمایشگاه توانش های اندامی» را در شهر لندن تاسیس کرده بود (۱۸۸۴) و در آن افراد داوطلب را مورد سنجش قرار می داد. برای موفقیت در این کار او به ابداع وسائلی دست زده بود که هنوز هم در برخی از موارد استفاده می شوند. از جمله وسائل آزمایشگاه گالتن به نمونه های زیر می توان اشاره کرد:

الف: میله گالتن، برای اندازه گیری افتراق بینایی طول،

ب: سوت گالتن، برای اندازه گیری آخرین حد احساس صداهای زیر،

پ: سلسلة اوزان گالتن برای سنجش افتراق احساس وزن و لمس

گالتن تحت تأثیر جان لاک فیلسوف انگلیسی (۱۷۰۴ – ۱۶۳۲) معتقد بود که تقویت حواس باعث تقویت هوش و به ویژه دقت می گردد. او متوجه شده بود که عقب ماندگان ذهنی از لحاظ افتراق درجات گرما، سرما و درد نقص های دارند. همچنین او از

صفحه 6

پیشگامان روشهای آماری برای تجزیه و تحلیل نتایج تحقیقات مربوط به تفاوت های فردی بود. به علاوه او برای جمع آوری اطلاعات در زمینه تحقیقات خود برای اولین بار از روش پرسشنامه و تداعی های آزاد استفاده کرد.

همزمان کارهای گالت و کتل، تلاش های دیگری نیز در سایر کشورها آزمون های روانی صورت می گرفت. برخی از روان شناسان سعی می کردند فعالیت های عالی تر و پیچیده تر ذهن را اندازه گیری کنند. به طور مثال گریپلین در دهه اخر قرن نوزدهم در المان به تشخیص و معالجه بیماران روانی مشغول بود. او در سال ۱۸۹۵ با استفاده از عملیات ساده حساب و روش تداعی آزاد مجموعه آزمون هایی را برای تشخیص و استفاده در کلینیک های روان پزشکی و مدارس به وجود آورد. ازمون های کریپلین تاثیر خستگی را بر روی حافظه، تمرین و حواس پرتی می سنجیدند.

یک سال بعد از کریپلین، فراری تلاش های مشابهی را در ایتالیا شروع کرد. آزمون های او و شاگردانش سنجش حوزه های مختلف پدیده های روانی را اعم از فراخنای توجه ، کارکردهای فیزیولوژیک، فعالیت های حرکتی و تفسیر تصاویر را در بر می گرفتند. هدف اصلی فراری و همکارانش در ساختن این آزمون ها تشخیص و جداسازی افراد نابهنجار از افراد عادی بود. آنها به ویژه می خواستند جنایتکاران را از انظر روانی طبقه بندی نموده و سپس به درمان آنها بپردازند

“اینگهوس ” روان شناس دیگر آلمانی به نوبه خود آزمون های دیگری را برای سنجش حافظه و فراخنای آن ابداع نمود (۱۸۹۷). او برای این منظور از هجاهای بی معنا استفاد می کرد و سپس رابطه حد یادگیری را با دفعات تکرار هجاها، زمان سپری شده یادگیری، فاصله زمانی بین یادگیری و یادآوری و حد فراموشی مقایسه می کرد.

به این ترتیب آزمون سازی و کاربرد آن که در آغاز محدود به سنجش کاری حسی و توانش های حرکتی شده بود کم کم می رفت حوزه های عالی تر فعالیت های از جمله حافظه، دقت، فرافکنی و غیره را در بر بگیرد. در سال ۱۸۹۵ آلفرد

دبینه ویکتور هانری دفتر مجله روان شناسی را در پاریس افتتاح نمودند و در آن ضمن انتشار

صفحه 122

را به شرح زیر خلاصه کنیم

الف: هوش متبلور بازتاب تمام عیار تجارب و تماس های فرهن جهت طرز فکر قومی و آداب و رسوم محلی در آن منعکس می گردد

ب: مهارت هایی که در مدارس آموخته شده اند، حجم هوش متبلور را به مل افزایش می دهند و این افزایش به سنوات تحصیل وابسته است. هرچه ت افزایش داشته باشند هوش متبلور غنی تر عمل خواهد کرد.

پ: رشد هوش سیال در ۱۴ سالگی متوقف می شود در حالی که هوش متبلور تا آن عمر می تواند افزایش داشته باشد،

ت: هوش سیال از ۱۴ سالگی تا ۲۰ سالگی به صورت فلات در می آید و سی پیری و مرگ سیر نزولی را طی می کند.

ث: كارهوش متبلور در چارچوب هوش سیال شکوفا می گردد و در این امر عوامل دیگری از جمله داشتن انگیزه و قرار گرفتن اتفاقی در شرایط مطلوب، نقش به عهده می گیرند.

کتل معتقد است که هوش متبلور را با آزمون های متعارف هوش از جمله استانفورد بینه، آزمون های پیشرفت تحصیلی و آزمون های اطلاعات و معلومات به خوبی می توان اندازه گیری کرد در صورتی که برای سنجش هوش سیال می بایست حتما از آزمون های بری از فرهنگ کمک گرفته شود. کلمات و جملات از آنجا که حاصل یادگیری هستند و بار فرهنگی دارند باید از سئوالات آزمون های هوش سیال حذف شوند و به جای آنها از تصاویر هندسی استفاده شود. لازم است دستورالعمل های آزمون های هوش سیال | مختصر و ساده باشند تا عامل درک کلامی در کارکرد آنها تأثیر باقی نگذارد.

چنانچه بخواهیم نظریه دو عاملی کتل را با نظریات افراد قبل از او مقایسه کنیم وجوه تشابه و اختلاف متعددی را در آنها باز می یابیم. اولا هوش سیال کتل از جهاتی با عامل G اسپیرمن، همانند جلوه می کند در صورتی که می دانیم اسپیرمن برخد موروثی بودن عامل G اشاره نکرده است. ثانیأ کتل معتقد است که هوش سیال در 14 سالگی متوقف می شود و به طوری که در نظریات بینه و سیمون (—) همین عقیده را درباره هوش به طور کلی ابراز می داشتند.

صفحه 310

بازیابی، آخرین مرحله جریان حافظه را می سازد. آن به دو صورت دیده می شود

ا- بازشناسی2 – یادآوری

بازشناسی مرحله ای ساده تر از یادآوری است زیرا در آن فرد برگهای بیشتر و هدایت کننده تر برای فراخوانی اطلاعات ذخیره شده قبلی خود در اختیار دارد. در یادآوری فرد سردرگمی بیشتری را احساس می کند و چنین به نظر می رسد که در بیشتر موارد نمی داند در کدام یک از حوزه های مخزن حافظه خود به دنبال پدیده مورد نظر بگردد.

هنگامی که ما شیی ای را به آزمودنی نشان می دهیم و از او می خواهیم که نام آن را بگوید در این صورت ما از او می خواهیم که به بازشناسی شییء مورد نظر بپردازد رؤیت شییء با توجه به شکل، یا رنگ یا جنس، در این موقعیت به او کمک می کند که سریع تر و صریح تر نام پدیده مورد نظر را بازیابی کند. اما هنگامی که از او می خواهیم نام همکلاسی های سابق خود را به خاطر آورد یا بگوید که روزهای قبل چه کارهایی را انجام داده است در این صورت از او انتظار داریم که به یاد آوری بپردازد. برگه های یاد آوری در این حالت محدودتر و مبهم تر هستند و آزمودنی باید در آغاز به دنبال سرنخ هایی بگردد تا بتواند خاطرات گذشته خود را به حوزه هوشیار فراخوانی کند. چنین فراخوانی وقت و تلاش های بیشتری را می طلبد و نیاز به متغیرهای بیشتری از جمله توان نگهداشتن تمرکز به مدت طولانی تر، داشتن انگیزه بیشتر، انتخاب شیوه های مناسب ردیابی و حذف عوامل مخل مداخله گر را دارد.

آسیب های حافظه در هر یک از مراحل حافظه یا در همه آنها ممکن است اتفاق بیفتند. در مراحل رمزگردانی و اندوزش پراکندگی توجه، ناتوانی در برقرار کردن دقت، خستگی سیستم اعصاب مرکزی، مصرف داروهای روانگردان معمولا کار حافظه را مخدوش می کنند. در مرحله بازیابی علاوه بر موارد بالا عواملی از جمله پیری، مرور نکردن خاطرات در سنوات گذشته و طول مدت خاطرات نیز نقش به عهده می گیرند.

تجربه با بیمارانی که اختلال حافظه داشته اند نشان می دهد که آسیب حافظه اولین بار در حوزه یاد آوری نمایان می شود. مراجع اعتراف می کند که به هنگام مکالمات روزمره

صفحه 16

تحت تاثیر قرار می دهد. در همه این آزمون ها همان طور که ملاحظه می شود زبان کا نقش اساسی به عهده می گیرد و کسانی که استعداد کلامی بالایی دارند نمرات دریافت می نمایند. برخی از نویسندگان، آزمون های گفتاری – نوشتاری و نوشتاری نوشتاری را آزمون های مداد کاغذی می نامند.

آزمون های غیر کلامی آنهایی هستند که پاسخ به آنها غالبا مستلزم انجام فعالیتی از طرف آزمودنی است. در این آزمون ها استعدادهای کلامی (نیمکره چپ مغز) کمترین نقش را به عهده می گیرند و در عوض هوش عملی – یا مکانیکی فعال می شود (نیمکره راست مغز فعالیت بیشتری را انجام می دهد). از جمله آزمون های غیرکلامی از آزمون هوش ناوابسته به فرهنگ ا لايتر، آزمون مکعب های چوبی کهس ، آزمون قطعات چوبی ویگلی ، آزمون جعبه دکرولی می توان نام برد. آزمون لایتر برای کودکان ۲ تا ۱۸ ساله عقب مانده ذهنی ساخته شده است و در آن درک ارتباط بین طرح ها، طبقه بندی رنگ ها و وجوه اختلاف تصاویر اهمیت پیدا می کند. در آزمون مکعب های چوبی کهس آزمودنی باید با سطوح رنگی مکعب های چوبی اشکال مشابه اشکال دفترچه پرسش بسازد. آزمون ویگلی اقتضا می کند که آزمودنی با توجه به انحناها، فرورفتگی ها و برآمدگی قطعات چوبی آنها را به گونه ای پهلوی هم بگذارد که یک قطعه واحد را تشکیل دهند. جعبه دگرولی به عنوان جعبه معما به کار برده می شود و آزمودنی باید با ور رفتن به آن، رمز باز کردن در آن را بیابد که به گونه پیچیده ای مشروط به میله ها و مهره های متداخل شده است. آزمون های عملی اکثرة استعدادهای ویژه را مورد سنجش قرار می دهند و بیشتر جزو آزمون های ناوابسته به فرهنگ هستند.

در اینجا باید یادآوری نمود که علاوه بر آزمون های عملی با کلامی محض آزمون های دیگری وجود دارند که سئوالات آنها برخی کلامی و برخی دیگر عمل است. از جمله این آزمون ها به مقیاس های وکسلر و استانفورد – بینه می توان اشاره نمود. این آزمون ها را به علت تنوع و گسترش حوزه های سنجش «آزمون های جامع» می نامند.

صفحه 8

کردند و سپس برای قرار دادن سئوالات در مقاطع سنی مختلف، آنها را بر روی کودکان ساکن حاشیه رود سن پیاده کردند. پاسخ های کودکان اجازه داد که سئوالات بسیار دشوار و نامناسب را از آزمون حذف کنند و هر سئوال را با توجه به سطح دشواری آن در یکی از مقاطع سنی قرار دهند.

به این ترتیب اولین آزمون استاندارد شده هوش در سال ۱۹۰۵ با ۳۰ سئوال در زمینه های مختلف از جمله سنجش توان قضاوت، ادارک و استدلال منتشر گردید. سئوالات ۳۰ گانه آزمون در مقاطع سنی مختلف توزیع شده بود و هر سال برای خود سئوالات جداگانه داشت. قرار دادن هر سئوال در هر یک از مقاطع سنی با توجه به نسبت درصد پاسخ دهندگان همان مقطع سنی انجام شده بود. چنانچه بیشتر از ۷۵ درصد افراد یک سن به یک سئوال، درست پاسخ داده بودند چنین قضاوت شده بود که آن سئوال برای آن سن ساده است و لذا آن سئوال را برای سنین پایین تر منظور کرده بودند. آزمون به این ترتیب به صورت نردبان (اشل) تنظیم شده بود و در انتخاب و جای گزینی سئوالات دو شرط اطلاعات حاصل از روان شناسی کودک و آمار در نظر گرفته شده بود.

در سال ۱۹۰۸ بینه و سیمون در آزمون خود تجدید نظر کردند. آنها از طرفی سئوالات آزمون را گسترش دادند و از طرفی دیگر مفهوم سن عقلی را وارد آزمون خود نمودند، تعیین سن عقلی از جمع سئوالات پاسخ داده شده به کل آزمون و تبدیل آنها به معادل های سن عقلی به دست می آمد. این شیوه محاسبه اجازه می داد که قضاوت نمایند آیا یک کودک نسبت به سن تقویمی خود یک عقب مانده ذهنی است یا یک پیشرفته ذهنی؟ چنانچه سن عقلی محاسبه شده کودک از سن تقویمی او بیشتر می شد نتیجه می گرفتند که آن کودک پیشرفته ذهنی است و چنانچه برعکس، کمتر از سن تقویمی او می شد قضاوت می نمودند که آن کودک عقب ماندگی ذهنی دارد. هر چه سن عقلی از سن تقویمی کمتر می شد این نتیجه گرفته می شد که کودک از عقب مانده گی ذهنی عمیق تری برخوردار است. تجربیات بینه و سیمون نشان داده بود که سن عقلی کودکان عقب (—)

صفحه 56

اینکه از بین گزینه های هیچ، تاحدی، بیشتر اوقات همیشه، باید یکی را انتخاب کرد نمی توان به سادگی به دو نیمه مساوی تقسیم کرد. برای این گونه آزمون ها کودر وریچارسون شیوه های دیگری را پیشنهاد می کنند که در آنها نیاز به دو نیمه کردن آزمون نیست. در این شیوه ها به همه سئوالات آزمون توجه می شود و یا به عبارت دیگرهر یک از سئوالات مبنای محاسبه اعتبار آزمون قرار می گیرد.

از معروف ترین شیوه های پیشنهادی کودر و ریچاردسون به فرمول شماره ۲۰ آنها با علامت اختصاری KR۲۰ می توان اشاره کرد. در این فرمول عناصر زیر را باز می یابیم

.————– جای فرمول

1 1r = ضریب اعتبار آزمون،

n = تعداد سوالات آزمون،

s= واریانس نمره های خام آزمون

SPq = مجموع واریانس های هر یک از سئوالات آزمون برای محاسبه SPq باید اول حساب کنیم که به هر یک از سئوالات چه نسبتی از آزمودنی ها پاسخ درست (P) و چه نسبتی از آنها پاسخ غلط (q) داده اند. سپس نسبت درست هر سئوال را در نسبت غلط آن ضرب کنیم و در آخر کار مجموع این حاصلضرب ها را به دست آوریم

به طور مثال اگر دانش آموزان یکی از کلاس های سوم دبیرستان به یک آزمون هوش ۵۰ سئوالی (۵۰=n) پاسخ داده باشند و واریانس نمرات خام آنها ۵=2s و مجموع واریانس های هر یک از سئوالات آزمون

۱/۷۳=EPq شده باشد ضریب اعتبار آزمون را به شرح زیر محاسبه می کنیم

.————– جای فرمول

به طوری که از توجه به فرمول بالا بر می آید برای اینکه ضریب اعتبار آزمون مثبت معنادار باشد باید مجموع واریانس سئوال های آزمون (2Pq) به حد کافی از واریانس نمره های خام آزمون (‘s) کوچکتر باشد. از طرفی دیگر ملاحظه می شود که ضریب

صفحه 14

حوزه های سنجش را به سازگاری فرد به طور کلی یا سازگاری با خانواده، محل کار مدرسه گسترش دادند و برخی دیگر به جنبه های اختصاصی تری از رفتار از جمله پرخاشگری، سلطه پذیری، درون گرایی و غیره پرداختند.

تهیه آزمون های عملی شخصیت روش دیگری بود که برای بررسی برخی دیگر از متغیرهای رفتار در دهه اول قرن بیستم متداول شد. با اجرای این آزمون ها فرد عملا ولی بی خبر از اهداف آزمونگر در برابر صحنه ها یا شرایطی مشابه با شرایط زندگی روزمره قرار می گرفت و به عکس العمل می پرداخت. با این روش روان شناسان به مطالعه رفتارهایی از جمله درجه همکاری، پذیرش مسئولیت، میزان پشتکار، تقلب، دزدی و غیره می پراختند.

شیوه چهارم در آزمون های شخصیت، فرافکنی نام گرفت. فنون مختلفی در این زمینه نیز ابداع شد که از آن جمله به کاربردن لکه های جوهر (آزمون رورشاخ، زولیگر، هولتزمن)، ابداع داستان براساس تصاویر ( آزمون های ۵P.N. ، C.A.T، T.A.T)، تکمیل جملات یا داستان های نیمه تمام (جملات ناتمام ساکس ، داستان های نیمه تمام لوئیزا دووس)، تحلیل نقاشی ها (ترسیم خانواده اثر لوئی کورمان)، ساختن دهکده خیالی، و بازی های روان نمایشی می توان اشاره نمود. در تمام این آزمون ها روان شناس فرد را در برابر محرک یا شرایطی قرار می دهد که نیروهای کنترل کننده رفتار برداشته شوند و بنابراین لایه های زیرین شخصیت به سادگی بسر ملا کردند. در برخی از این آزمون ها (از جمله T.A.T ) فرد خود را با قهرمان داستان های ابداعی خود همانند سازی می کند و آرزوها یا امیال پنهان خود را به او نسبت می دهد، در برخی دیگر آزمودنی خود صحنه هایی ابداع می نماید که به گونه ای مبین حالات درونی او تلقی می گردند.

صفحه 53

الف: سئوالات هم وزن به کار گرفته شده در فرم های همتا گرچه از نظر صوری و سطح دشواری مشابهند لكن از نظر محتوا مغایرند. بنابراین بسته به اینکه آزمودنی ها با کدام یک از این محتواها آشنایی بیشتری داشته باشند در سنتی یا نادرستی پاسخ آنها از فرمی به فرم دیگر فرق خواهد کرد. در نتیجه روان شناس باید برخی از اختلافات نمرات به دست آمده از اجرای اول و دوم را به حساب تفاوت های تصادفی ناشی از انتخاب مادة سئوالات بگذارد و آن را تحت عنوان واریانس خطای نمونه گیری از محتوا، به فرمول واریانس كل خطای اندازه گیری آزمون بیفزاید.

ب: فاصله زمانی اجرای دو فرم و تقدم و تأخر آنها باید در تفسیر نمرات دخالت داده شود. در صورتی که اجرای دوم فرم آزمون بدون فاصله در یک جلسه انجام شود در این صورت تاثیر گذشت زمان بر روی اختلاف نمرات حذف می شود و در نتیجه واریانس مشاهده شده در نمرات را باید بیشتر به حساب اختلافات موجود در دو فرم موازی آزمون گذاشت. برعکس چنانچه بین اجرای فرم اول و اجرای فرم دوم آزمون زمان مناسب منظور گردد اختلاف نمرات دو مرحله اجرا را باید هم برای تأثیر گذشت زمان و هم برای اختلافات موجود در دو فرم آزمون منظور کرد.

از طرفی دیگر تجربه نشان می دهد که تقدم و تأخر اجرای دو فرم آزمون در واریانس نمرات آنها موثر واقع می شود. این مسئله در متون کلاسیک روان سنجی تحت عنوان واریانس ناشی از گذر از یک موقعیت به موقعیت دیگر مطرح شده است و به هنگام اجرای آزمون برای آن اهمیت قائل می شوند. بدیهی است که به هنگام پاسخ به دفترچه اول آزمون پاسخ دهندگان به اصول، راه حل ها و مقوله های مطرح شده آشنا می شوند و به همین علت نمرات آنها در دفترچه دوم آزمون افزایش می یابد. تهیه کنندگان آزمون های روانی به این امر واقف هستند. و به همین دلیل نخست تأثیر واریانس نمرات را در زمانی که می خواهند. جداول عددی آزمون را تهیه کنند. در تبدیل نمرات خام به نمرات میزان شده ازمون دخالت می دهند، و دوم شرایط استفاده مطلوب از فرم های موازی ازمون را ذکر می کنند.

صفحه 9

ذهنیت عمیق (کانا) از مرز ۳ سالگی عقلی، کودکان کالیو از مرز ۷ سالگی عقلی و کودکان کودن از مرز ۱۰ سالگی عقلی تجاوز نمی نماید.

در سال ۱۹۱۱ بینه و سیمون با توجه به اطلاعات تجربی به دست آمده و انتقاداتی که از آزمون آنها شده بود اخرین تجدید نظر خود را بر روی آن انجام دادند. آنها اولا تعداد سئوالات آزمون خود را تا مرز ۵۴ عدد گسترش دادند، و ثانيا سئوالات جدیدی را جایگزین برخی از سئوالات ضعیف قبلی نمودند. آزمون ۱۹۱۱ کودکان را از ۳ سالگی الى پایان ۱۵ سالگی مورد سنجش قرار می داد و تعدادی سئوال (۵ عدد) نیز تحت عنوان بزرگسالان در نظر گرفته شده بود که چنانچه کودکی ۱۴ یا ۱۵ ساله بسیار باهوش به سئوالات ویژه سن خود پاسخ داده باشد به آنها نیز پاسخ دهد.

بینه در سال ۱۹۱۲ فوت نمود و چنانچه بعدا خواهیم دید آزمون او در سال ۱۹۱۶ وارد جامعه آمریکا شد و تحولات وسیعی در زمینه سنجش هوش دراین کشور ایجاد کرد.

ادامه دهندگان

ورود آزمون بینه – سیمون به آمریکا و تغییرات وسیعی که در فاصله سال های ۱۹۱۶ الى ۱۹۳۷ در آن انجام شد کم کم آن را به صورت یک آزمون بین المللی در آورد. فرم های تجدید نظر شده و انطباق یافته آن به مرور به اکثر زبان های دنیا ترجمه شدند و برای هر جامعه مجددا استاندارد گردیدند. از آنجا که ما این آزمون را به طور مفصل در فصل ششم این کتاب مطالعه می کنیم در اینجا از معرفی بیشتر آن خودداری می نماییم. همین قدر می افزاییم که با انتشار آزمون بينه و سیمون نگرش به ماهیت هوش و محتوای آن تغییر اساسی بافت و ابعاد آن مشخص تر گردید. از طرفی دیگر آزمون بینه و سیمون برای ساخته شدن آزمون های دیگری زمینه قرار گرفت که امروز از شهرت کافی برخوردار هستند.

در فرانسه پروفسور زازو استاد مؤسسه تحقیقات عالی با همکاری ژیلی و راد فرم تجدید نظر شده جدیدتری از این آزمون را در سال ۱۹۶۶ منتشر کردند.بسیاری از

صفحه 38

معتبر و مشهور. در این حالت اگر هر دو آزمون همزمان برای یک گروه پاسخ دهندگان اجرا شوند می توان به نتایج حاصله بیشتر اعتماد کرد. برای مثال می توان نمرات حاصله از افراد یک کلاس را در آزمون جدید هوش با نمرات حاصله از اجرای آزمون مشهور استانفورد – بینه در همان کلاس مقایسه کرد و چنانچه بین آنها همبستگی بالا به دست آمد آنرا دلیل روایی آزمون جدید دانست. می دانیم که آزمون استانفورد – بینه از ۱۹۱۶ به این طرف بارها بر روی هزاران نفر نرم یابی شده است و از آن تاریخ تا کنون به عنوان یکی از رواترین آزمون های هوش در جامعه آمریکا به کار برده می شود. معمولا آزمون هایی را که به این گونه به عنوان ملاک به کار می برند اصطلاحا «آزمون مرجع) می نامند.

۲ – مقایسه نمرات به دست آمده از آزمون مورد نظر با پیشرفت تحصیلی. از آنجا که بین هوش و یادگیری همبستگی مثبت وجود دارد می توان انتظار داشت کسانی که در کلاس درس نمرات درخشان کسب می کنند در آزمون هوش نیز نمرات بسیار خوب بگیرند و کسانی که جزو شاگردان آخر کلاس هستند کمترین نمرات را در آزمون هوش به دست آورند. آزمون هوشی که به این ترتیب با نمرات دانش آزمون همبستگی مثبت نشان دهد یک آزمون روا محسوب خواهد شد.

به نظر خواهی از افراد خبره. این گونه بررسی روایی در مورد آزمون های بررسی مهارت های حرفه ای، هنری، آزمون های شخصیتی از نوع روان پزشکی کارآیی بیشتری دارد. به طور مثال می توان از گروهی روان پزشک مشهور خواست که به معاینه و طبقه بندی تعدادی مریض روانی بپردازند و سپس آزمون جدید روان پزشکی را که مدعی طبقه بندی بیماران روانی بر بنیاد نشانگان امراض روانی است بر روی آنها اجرا کرد. همبستگی بالای بین طبقه بندی روان پزشکان مشهور و طبقه بندی به دست امده از اجرای آزمون به حساب روایی خوب آزمون گذاشته خواهد شد. در این گونه بررسی روایی مهم نیست که اول از روان پزشکان نظر خواهی شود و بعد آزمون اجرا گردد. و یا اینکه برعکس عمل شود. آنچه که يقين است این است که اگر اول آزمون اجرا شده باشد. روان پزشکان نباید از نتایج آن اطلاع حاصل کنند زیرا اطلاع از نتیجه آزمون ممکن است قضاوت های آنها را تحت تأثیر قرار دهد. تحت تأثیر قرار گرفتن قضاوت در روان سنجی

آزمونهای بررسی سطح اطلاعات در هر یک از مشاغل

۴- آزمون های بالینی: اعم از آزمونهای اختلالات خواندن یا نارساخوانی (دیس الکسی)، آزمونهای اختلال تولید گفتار یا درک گفتار (آفازی)، آزمون های اختلالات حرکتی (آپراکسی ۳)، آزمونهای تشخیص ضایعات مغزی ، آزمونهای پندارتند آزمونهای جانبی بودن اعضای بدن (نیمکره های مغز)، آزمونهای اختلالات حافظه آمیزی) * کلیه آزمونهای عصبی – روانپزشکی

۵- پرسشنامه های شخصیت: اعم از، پرسشنامه های سنجش علایق، طرز نگرش ها میزان سازگاری، افسردگی، اضطراب، ترس های مرضی، عزت نفس، پندار از خود خلق و خوی، پرخاشگری، وسواس، شیدایی

۶- آزمونهای عینی شخصیت: از جمله آزمون های سنجش فشارهای روانی استرس ها)، آزمونهای درون گرایی و برون گرایی، آزمون های سنجش هوش اجتماعی، آزمون های سنجش خلاقیت.

۷- آزمونهای فرافکنی شخصیت:۱۱ اعم از آزمون های ساخته شده با لکه های جوهر (رورشاخ، زولیگر)، آزمونهای ابداع داستان بربنیاد تصاویر (

T.A.T, C.A.T ) آزمونهای جملات یا داستان های ناتمام، آزمون های سنجش نا کامی (روزن زوایگ).

۸- چک لیست های مصاحبه:۱۴ برای استفاده در جلسات مصاحبه تشخیصی روانپزشکی، مصاحبه های استخدامی

9- ابزار روان سنجی: نیرو سنج ها، دستگاه های بیوفیدبک ۱۳، ابزار سنجش آستانه های کارکرد حواس از قبیل اودیومتر ۱۴، ویزیومتره.

علاوه بر تقسیم بندی های فوق که از جامعیت نسبتا قابل دفاعی برخوردارند، اصطلاحات دیگری در زمینه تقسیم بندی آزمون ها به کار برده می شوند که نشانگر دو

طبقه بندی آزمونها از نظر هدف

از نظر هدف کاربرد، آزمونها را به دو دسته آزمون های تشخیصی و آزمون های پیش بینی تقسیم می کنند. در آزمون های تشخیصی می خواهیم ویژگی های فعلی روانی آزمودنی را بشناسیم، و در وضعیت پیش بینی می خواهیم بدانیم آزمودنی در آینده دارای چه ویژگی هایی خواهد بود. اطلاعات اخیر، ما را مجهز خواهد کرد که در برنامه ریزی برای آینده فرد با اطمینان بیشتری اقدام کنیم.

طبقه بندی آزمونها از نظر روش اجرا

در اینجا نیز ما با دو حالت روبه رو هستیم: ۱- اجرای فردی، ۲- اجرای گروهی، در صفحات قبل ملاحظه شد که اجرای گروهی آزمون ها از دهه دوم قرن بیستم به این طرف متداول شد. از طرفی دیگر برخی از آزمون ها به گونه ای ساخته شده اند که آنها را هم به روش فردی و هم به روش گروهی می توان اجرا کرد.

طبقه بندی آزمونها از نظر محتوا

از این نظر آزمون ها به گروه ها و دسته های مختلف تقسیم شده اند. به طور مثال «مرکز روان شناسی کاربردی» فرانسه کل آزمون های خود را به ۹ طبقه زیر تقسیم کرده است:

۱- آزمون های هوش: اعم از فردی یا گروهی، مداد کاغذی یا عملی، ویژه زرگسالان یا ویژه کودکان، نوجوانان، شیرخواران. و غیره … |

۲- آزمونهای استعداد: اعم از استعدادهای وابسته به هوش، استعدادهای مربوط به فعالیت های حرکتی دست ها، استعدادهای ویژه وابسته به مشاغل مختلف، آزمون های رشد ادراک دیداری، آزمونهای تشخیص کور رنگی، آزمونهای ادارک فضایی، آزمون های سنجش استعدادهای هنری، آزمون های سنجش مهارت انگشت ها، ازمون های تجزیه جملات از نظر دستوری، آزمون های سنجش توانش های مکانیکی

۳- آزمونهای معلومات و اطلاعات تحصیلی و شغلی: از جمله آزمونهای یادگیری و پیشرفت تحصیلی، آزمون های سنجش سطح نگارش، حساب کردن، املا،

خود، یا ناسازگاری عقیدتی یک فرد با محیط زندگی خود نمی تواند به حساب کم هوشی او گذاشته شود. در اینجا رابطه بین هوش و شخصیت به طور تنگاتنگ، در مواجهه با سئوالات مطرح می شوند و این همان چیزی است که وکسلر در تفسیر پاسخ های مریض های روانی به آزمون خود مورد توجه قرار داده است.

پ: هوش به عنوان ظرفیت یادگیری

این نظریه، هوش را یک ظرفیت بالقوه یادگیری می داند که حد آن در نزد افراد متفاوت است و همین تفاوت ها حجم یادگیری افراد را تعیین می کنند. در کلاس های مدارس عملا می بینیم که برخی از دانش آموزان مقدار بیشتری از مطالب درسی را با صرف وقت کمتری فرا می گیرند در صورتی که برخی دیگر برای آموختن همان مقدار مطالب درسی به تکرار بیشتری نیاز دارند. توان آموزش پذیری به این ترتیب در این نظریه ملاک هوشمندی تلقی می گردد. کالوین و وودرو دو نفر از کسانی اند که این نظریه را بیشتر از هر کس دیگر پرورانیده اند. به نظر آنها تمامیت دانش آموخته شده به عبارتی می تواند درجه هوشمندی افراد را تعیین کند. آنان که مطالب دشوارتری را می توانند فرا بگیرند از هوش بالاتری برخوردارند و کسانی که در یادگیری ناتوانی نشان می دهند دارای سطح هوش کمتری هستند.

ت : هوش به عنوان قدرت تفکر انتزاعی

ترمن استاد دانشگاه استانفورد یکی از اولین کسانی بود که از این نظریه دفاع می کرد. به نظر او افراد به همان اندازه باهوش ترند که انتزاعی تر هستند. تفکر انتزاعی با استعدادهای کلامی، قدرت حل مسئله و «باهم نگری» پدیده ها همبستگی مثبت بالایی جلود. از نظر مراحل رشد هوش امروز ماتفكر انتزاعی را در آخرین مرحله قرار میدهیم و معتقدیم که در اواخر دوران نوجوانی یعنی در حد فاصل بین ۱۴ الی ۱۸ سالگی به کمال خود می رسد. بنابراین، ملاک تفکر انتزاعی، در مورد نوجوانان و بزرگسالان

از مطلوب ترین آنها استفاده از جدول دو بعدی مشخصات آزمون است. در این جدول هدف یا خرده هدف هایی که آزمون به منظور سنجش آنها درست شده است در ستون اول افقی بالای جدول و محتوای موضوعی سئوالات در ستون اول عمودی طرف راست جدول نوشته می شوند. جدول مذکور به این ترتیب دارای تعدادی ستون افقی و عمودی خواهد شد که کم یا زیادی آنها به وسعت هدفها و گستره موضوعی محتوای آزمون مربوط خواهد شد. سپس سئوالات آزمون به ترتیب، یکایک انتخاب شده و بعد از تعیین نقش آن در آزمون از نقطه نظر هدف و محتوا در یکی از چهار خانه های مناسب جدول علامت زده می شود. شمارش علامت های هر خانه در نهایت معلوم خواهد کرد که چند سوال در کل آزمون برای هر یک از موضوعات در ارتباط با هدف های آزمون منظور شده است و این تعداد سئوال در رابطه با تعداد سئوالات مقوله های دیگر کافی است یا خیر؟

با تنظیم جدول دوبعدی مشخصات آزمون تفسیر روایی محتوای آن از حالت کیفی به حالت کمی تبدیل می شود و بررسی های عینی تری را به دنبال می آورد. ناگفته پیدا است که از این شیوه مقوله بندی سئوالات هم در مواقعی که می خواهیم روایی محتوای یک آزمون ساخته شده قبلی را که قصد به کار بردن آن را داریم و نیز زمانی که می خواهیم یک آزمون جدید بسازیم، استفاده می کنیم. در حالت اخیر تنظیم جدول دو بعدی مشخصات آزمون در تنظیم لیست پیش نویس سئوالات آزمون به ما کمک شایانی خواهد کرد و ما را از سردرگمی احتمالی نجات خواهد داد.

روایی صوری

روایی صوری وجهی دیگر از روایی محتواست و آن توجه کردن به وضع ظاهری سئوالات به جای ماهیت محتوایی آنهاست. از این زاویه دید سئوالات آزمون می بایست از لحاظ کلمات و جملات و محتوای ظاهری به گونه ای انتخاب شوند که رغبت پاسخ دهندگان را برانگیزند. برای رسیدن به این هدف ضروری است که:

اولا: سطح درک آزمودنی ها برای تنظیم نوع جملات در نظر گرفته شود. بدیهی است که جملات پیچیده با کلمات و سبک بیان ویژه بزرگسالان رغبت به پاسخ را در کودکان بر

ازمونهایی که طبقه بندی اشیاء را برحسب رنگ، اندازه یا شکل پیشنهاد می کنند. از نمای کاملا تنظیم شده اند. آزمون مکعب های چوبی کهسا، «آزمون تشخیص رنگ ها» و آزمون تشکیل مفاهیم» هانمان و نازانین”، جزو آزمون های کام تنظیم شده طبقه بندی می گردند.

ساختن دهکده های خیالی از جمله «دهکده آرتوس » و «دهکده دکتر مابید و دهکده موک شي اللي » در زمره آزمون های نیمه هدایت شده قرار می گیرند.

عیب آزمون های کاملا آزاد دشواری در نمره گذاری آنهاست. در این آزمون ها مشاهده اساس کار قرار می گیرد و سیلقه شخصی آزمونگران در ارزشیابی ها کاملا دخالت می نماید.

آنها نسبت پاسخ های درست در گروه قوی به نحو معناداری بیشتر از نسبت پاسخ های درست گروه ضعیف نباشد نامطلوب تلقی می گردد. این سئوالات یا از کل سئوالات آزمون حذف می شوند و یا اینکه جانشین هایی برای آنها پیشنهاد می گردد.

در شیوه دوم بین نمرات پاسخ های درست یا نادرست به هر یک از سئوالات آزمون و نمره کل آزمون، ضریب همبستگی در رشته ای محاسبه می شود. این بار نیز چنانچه این همبستگی ها از نظر آمار معنادار باشند، سئوال مورد نظر نگهداری می گردد، در غیر این صورت از بین سئوالات آزمون حذف می شود.

بدیهی است که از این دو شیوه سنجش به جای مقایسه نمره هر سئوال با کل آزمون می توان از مقایسه نمره هر خرده آزمون یعنی آزمونهای فرعی، با نمره کل آزمون نیز استفاده کرد. در این صورت معلوم خواهد شد که هر خرده آزمون تا چه حد با اهداف کلی آزمون همسو و یا اینکه مغایر با آن می باشد.

مقایسه با آزمونهای معروف

شیوه مقایسه با آزمون های دیگر را در بحث روایی ملاکی مورد مطالعه قرار دادیم. همین شیوه را در مورد بررسی روایی سازه آزمونها نیز می توانیم به کار گیریم، مشروط بر اینکه هر دو آزمون مدعی سنجش سازه مشترکی باشند. به طور مثال می توانیم روایی سازه آزمون هوش جدید را با محاسبه ضریب همبستگی آن با آزمون های استانفورد – بینه و یا وکسلر ارزشیابی کنیم و یا اینکه روایی آزمون های روان پزشکی جدید را با آزمون 1. M.M.P

یا 90 SCL تأیید و وارد نماییم. در تمام این موارد اگر آزمون جدید با آزمون معروف موجود همبستگی سطح بالایی نشان داد نتیجه میگیریم که آن نیز مانند آزمون معروف از روایی سازه قابل دفاعی برخوردار است.

در متون روان سنجی دهه های اخیر در همین زمینه از دو اصطلاح روایی همگرا و روایی افتراقی سخن به میان می آید. در روایی همگرا محقق سعی دارد ثابت کند که آزمون جدید از نظر سنجش سازه، همسو و هماهنگ با آزمون های معتبری است که

آزمودنی ها با نمرات اجرای بار دوم آنها محاسبه می شود و سپس قضاوت بر بنیاد آن صورت می گیرد. ضریب همبستگی را که با این شیوه محاسبه می شود اصطلاحا ضریب پایایی می نامند. این ضریب هرچه به یک نزدیک تر باشد نتیجه می گیریم که آزمون از اعتبار بیشتری برخوردار است.

برنيه اختلاف نمرات بار اول و بار دوم اجرای آزمون را به عواملی نسبت می دهد که آنها را به صورت زیر می توان خلاصه کرد:

Sv = واریانس واقعی،

SEM = واریانس خطای اندازه گیری،

SEA = واریانس خطای وابسته به شرایط زمان اجرای آزمون،

S’EH= واریانس خطای پاسخ های تصادفی،

S’ES= واریانس خطای ذهنیت گرایی در نمره گذاری،

SIVF = واریانس ایجاد شده در نمره واقعی از یک موقعیت به موقعیت دیگر.

در این صورت فرمول پراکنش (واریانس) كل نمرات هر بار اجرای آزمون را به شرح زیر می توان نوشت.

s’X=S’V+S’EM+S’EA+S’EH+S’ES+S’VF

محاسبه اعتبار به سبک بازآزمایی دارای معایبی است که باید به آنها توجه نمود: اول اینکه آشنایی آزمودنی ها در مرحله اول اجرا به محتویات آزمون باعث می شود که آنها در مرحله دوم اجرا بهتر پاسخ دهند و لذا نمرات آنها افزایش یابد. دوم اینکه اگر فاصله زمان دو مرحله اجرا بسیار زیاد شود در این صورت معلوم نیست که واریانس به دست آمده را باید به حساب خطای اندازه گیری گذاشت با تغییرات به دست آمده از رشد و تحولات افراد. سوم اینکه آزمون در مرحله دوم اجرا تازگی خود را از دست می دهد و لذا بی تفاوتی در آزمودنیها ایجاد میکند.

اصطلاح سرایت معیار یا آمیختگی ملاک نام گرفته است. سرایت معیار در مورد بحث خصیصه هایی که بیشتر ذوقی هستند و ضوابط اندازه گیری کمتری را می پذیرند از جمله قضاوت های هنری، بیشتر صادق است.

۴- مقایسه نمرات به دست آمده از اجرای آزمون با موفقیت های شغلی، مقبولیت های اجتماعی و یا شکست و ناکامی های افراد در زندگی این گونه بررسی ها بدیهی است که مستلزم پیگیری های طولانی و صرف وقت بسیار است که فقط از عهده مؤسسات تحقیقاتی یا ادارات دولتی و یا کارخانه ها بر می آید.

۵- مقایسه نمرات گروه های شناخته شده متضاد این شیوه بررسی روایی گرچه از قطعیت کمتری برخوردار است لكن ملاحظه می شود که بسیاری از تحقیقات از آن استفاده کرده اند. معمولا در این گونه بررسی ها از دو گروه متضاد مثلا پیشرفتگان ذهنی و عقب ماندگان ذهنی استفاده می کنند که قبلا شناخته شده اند و در محیط های مخصوص عقب ماندگان ذهنی و پیشرفتگان ذهنی مشغول به تحصیل اند. چنانچه نمرات این دو گروه در یک آزمون هوش در دو قطب کاملا متضاد حداکثر و حداقل قرار گیرند این امر را می توان نمودار روایی آزمون تلقی کرد. بدیهی است که از شیوه گروه های متضاد می توان علاوه بر بررسی روایی آزمون های هوش برای بررسی روایی سایر آزمون ها از جمله آزمونهای یادگیری، پیشرفت شغلی، درون گرایی و غیره نیز استفاده کرد.

روایی پیش بین

روایی ملاکی را معمولا تحت دو عنوان روایی پیش بین و روایی همزمان مورد مطالعه قرار می دهند. در محاسبه روایی پیش بین، روان شناس می خواهد به این سئوال پاسخ دهد که تا چه حد نمرات به دست آمده از اجرای یک آزمون می تواند ملاک پیش بینی برای آینده افرادی باشد که به آن پاسخ داده اند. از آنجا که یکی از اهداف مهم به کارگیری آزمون های روانی، راهنمایی حرفه ای و تحصیلی است محاسبه روایی

۲ – اقتصادی بودن

منظور از اقتصادی بودن آزمون، با صرفه بودن از نظر هزینه های تهیه آزمون با اجرا و تصحیح نتایج آن است. از نظر تهیه آزمون ملاحظه می شود که در برخی از آزمون ها تهیه کنندگان مطالب را به گونه ای تنظیم کرده اند که پاسخ دهندگان ناگزیر می بایست پاسخ خود را در همان دفترچه آزمون بنویسند. گذشته از اینکه تصحیح این گونه پاسخ ها وقت گیر است، دفترچه این گونه آزمون ها یکبار مصرف بوده و هزینه های چاپ زیادی را در بر می گیرند. در برخی از آزمون های دیگر تهیه کنندگان بر عکس همان ماده سئوالات را چنان ماهرانه در صفحه نهاده اند که می توان برگ های پاسخ جداگانه برای آنها تنظیم کرد. این برگ ها را می توان در پرونده آزمودنی ها، به عنوان سابقه سنجش، بایگانی کرد و دفترچه های آزمون را برای مصارف بعدی به کار گرفت.

از طرفی دیگر در مواردی که سنجش نه به منظور مشاوره با تشخیص بالینی، بلکه با هدف تحقيق انجام می شود، می توان آزمون را گروهی اجرا کرد. اجراهای گروهی همیشه کم خرج بوده و مقرون به صرفه اند. در این اجراها موارد ضروری پیش بینی شده و در دفترچه راهنمایی آزمون آورده شده است. از طرفی دیگر تصحیح برگ پاسخ این دفترچه ها با کلید انجام می شود و لذا هم در جریان اجرا و هم هنگام تصحیح می توان از دستیارانی کم هزینه تر استفاده کرد.

البته ناگفته نماند که همه آزمون ها را نمی توان یا صلاح نیست گروهی اجرا کنیم. در مواردی که می خواهیم مشکلات ویژه فردی را که با هدف جستجوی راه حل به ما مراجعه کرده است رفع کنیم می بایست آزمون را انفرادی اجرا کنیم تا از طریق مشاهده پاسخ های کیفی او بهتر او را بشناسیم. شک و تردیدها، سکوت، تغییر عقیده در پاسخ،حالات عاطفی از جمله هیجان زدگی، طرز جمله بندی، سرعت عکس العمل یا کندی در برخی از پاسخ ها از جمله مواردی اند که فقط با مشاهده مستقیم قابل مطالعه هستند. کشف رابطه این پاسخ ها با پاسخ های کمی آزمودنی همیشه امکان ابداع فرضیه هایی را به روانشناس می دهد که در راهنمایی مراجع مفید واقع می شوند.

مسئله دیگر صرفه جویی در وقت اجرای آزمون یا در وقت نمره گذاری پاسخ های ازمودنی هاست. البته وقت اجرای آزمون، در رابطه با تعداد سئوالات و محتوای

حرکات بدنی رشد میکند. در این زمان مفاهیم آغازین علیت، پایداری شیئی ، پندار از خود و از دیگران ساخته می شوند. در دوره دوم کودک مفاهیم متعدد زبان و نمادهای ارتباطی را یاد میگیرد و یا به عبارت دقیق تر آنها را در خود می سازد. این دوره از ۲ سالگی تا حدود ۷ سالگی ادامه دارد و به علت تسلط حالت خود مداری ، هوش کودک رنگ قضاوت شخصی به خود می گیرد. در مرحله عملیات عینی، کودک به علت جامعه پذیری، واقع نگرتر می شود و همین امر وی را به شناخت روابط اجتماعی، صفات عینی پدیده ها و برخی از قوانین حاکم بر اشیاء قادر می سازد. این دوره از ۷ سالگی تا حدود ۱۲ سالگی طول می کشد. مفاهیم نگهداری عدد (۷ سالگی)، جرم (۷ سالگی)، وزن (۹ سالگی)، حجم (۱۲ سالگی) به همراه توان طبقه بندی اشیاء با در نظر گرفتن صفات چندگانه آنها در این مدت حاصل می شوند. |

در دوره عملیات صوری افراد به توان عالی هوش یعنی تفکر منطقی و فلسفی دست پیدا می کنند. در این دوره که از ۱۲ سالگی به بعد ادامه خواهد داشت قوانین تعمیم یافته علمی درک می شوند، کلیات و مجموعه ها مورد توجه قرار میگیرند و اخلاق از حالت قضاوت های وابسته به موقعیت به صورت قضاوت های جهان شمول متحول می گردد

پیاژه با شاگردان و همکارانش به ساختن آزمون های تحولی – شناختی که بتوانند کارکرد افراد را در دوره های مختلف هوش ارزشیابی کنند نیز دست زده است. از معروفترین این آزمونها، می توان به آزمونهای زیر اشاره کرد: «مراحل هوش حسی – حرکتی» اثر پیاژه، کاستی، لزين، «مقیاس تحول ذهنی» اثر لورندو و پینار برای کودکان ۲ تا ۱۲ سال (۱۹۶۲- ۱۹۷۰)، «جعبه ارزشیابی مفاهیم پایداری» اثر گلداشمیت ۱۲ و بنتلر ۱۳ (۱۹۷۵) برای کودکان شیرخوار از ۲ هفتگی تا ۲ سالگی. برخی

دوم این که مقصود از «هنجار شده، آن است که آزمون قبلا درباره گروه نمونه ای از افراد مورد نظر اجرا شده و نتایج آن به صورت تابلوهای عددی ارائه شود. این تابلوها مبنای قضاوت نمرات خام افرادی قرار می گیرند که در آینده می بایست به آزمون مورد نظر پاسخ دهند. به همراه هنجاریابی آزمونها اعمال دیگری از جمله بررسی روانی و اعتبار آزمون انجام می شود. این اعمال که به کمک فرمول ها و محاسبات آماری انجام می شوند امکان مقایسه آزمون ها را با یکدیگر فراهم می سازند.

سوم این که آزمون های روانی به اندازه گیری نمونه ای از رفتار، آزمودنی ها می پردازند. نمونه های رفتاری می بایست معرف کل رفتار باشند تا معتبر شناخته شوند. در اینجا کار روان سنج همان طوری که آناستازی می نویسد به کار متخصص شیمی که خون بیمار یا آب آشامیدنی محل را نمونه برداری می کند شبیه می گردد. با این وصف تفاوت هایی بین نمونه برداری رفتاری و نمونه برداری شیمیایی می توان یافت که باید به آنها توجه نمود. در نمونه برداری شیمیایی هر واحد نمونه عینا دارای همان ویژگی هایی است که در کل نمونه یافت می شوند. در نمونه برداری های رفتاری این کار شدنی نیست زیرا پدیده های روانی از پیچیدگی بیشتری برخوردارند و از موقعیتی به موقعیت دیگر تغییرات اساسی پیدا می کنند. از طرف دیگر نمونه های رفتاری نمی بایست عينا همان هایی باشند که افراد در زندگی روزمره خود به انجام آنها عادت دارند. این گونه رفتارها آموخته شده اند و لذا فاقد توان سنجش ویژگی ها بالقوه آزمودنی ها خواهند بود. بنابراین سئوالات آزمونها از طرفی ضروری است که معرف تمام حوزه های رفتاری باشند که آزمون قصد سنجش آنها را دارد و از طرفی دیگر نمی بایست عين همان رفتارهای متعارف با همان وجوه ظاهری انتخاب گردند. به این ترتیب ابداع سئوالات بکر در آزمون های روانی اهمیت پیدا می کند و هر چه این سئوالات بیشتر باشند آزمون از قدرت تشخیص و پیش بینی بیشتری برخوردار خواهد بود.

توان تشخیص و پیش بینی، دو صفت مميزه آزمون های روانی اند. به گونه ای که براساس آنها می توان قضاوت نمود، مثلا فلان آزمون بهتر از آزمون دیگر ساخته شده

نمی انگیزد کرد و برعکس کلمات و جملات کودکان بزرگسالان را به تلاش لازم دعوت نخواهد کرد.

ثانيا: نوع کلمات و محتوای سئوالات می بایست متناسب با علایق شغلی و گرایش های اجتماعی پاسخ دهندگان برگزیده شود. به طور مثال اگر آزمون برای سنجش برای کارمندان اداری درست شده است در تنظیم سئوالات آن ضروری است که : الامکان از اصطلاحات، عناوین، مسائل و مشکلات موجود در ادارات کمک گرفته شود.

ثالثا: صفحه آرایی دفترچه سئوالات، انتخاب نوع تصاویر در آزمون های تصویری، انتخاب نوع حروف چاپی، تیترهای به کار برده شده باید همه با عنوان آزمون و اهداف سنجش آن هماهنگی داشته باشند.

روایی صوری به این ترتیب در ایجاد همدلی آزمودنی با آزمونگر وجدی گرفتن آزمون از طرف پاسخ دهندگان موثر خواهد افتاد و به همین جهت رعایت آن را شرط لازم سنجش بسیاری از آزمون ها از جمله آزمون های هوش، رغبت سنج ها و پرسشنامه های شخصیت تلقی می کنند. با این وصف در برخی دیگر از آزمونها که هدف نهایی سنجش باید از چشم پاسخ دهندگان پنهان بماند توصیه می کنند که از افراط در آن خودداری کنیم.

۔ روایی ملاکی

گاهی درجه روایی یک آزمون را در مقایسه با یک ملاک خارجی که می تواند نمرات کسب شده دانش آموزان در درس به خصوص، یا کارآیی کارگران در فعالیت های عملی حرفه ای، یا نمرات پذیرفته شدگان در یک مسابقه ورودی، و یا درجه موفقیت در یک برنامه پیشنهادی خاص باشد مورد بررسی قرار می دهند. همبستگی های سطح بالای بین نمرات افراد در یک آزمون به خصوص مثلا مکانیکی و مهارت آنها در فعالیت های حرفه ای مکانیکی روزمره معمولا نشانه ای از روایی آن آزمون تلقی می شود. در این زمینه، از ملاک های مختلفی نام برده می شود که اهم آنها را در زیر می توانیم خلاصه کنیم

– مقایسه نمرات پاسخ دهندگان به آزمون مورد نظر با نمرات آنها به یک آزمون

وجه معارض در روان سنجی هستند. این اصطلاحات، تقسیم بندی های جدیدی را ارائه می کنند. به شرح زیر:

۱- آزمونهای ملاک مرجع در مقایسه با آزمون های گروه مرجع (نرم – مرجع). وقتی که ما اطلاعات برآمده از تجربه یا متون علمی را برای ساختن و برگزیدن سئوالات آزمون به کار می گیریم در این صورت به ملاک خارجی متوسل می شویم. آزمون هایی که به این گونه ساخته می شوند آزمونهای ملاک مرجع نامیده می شوند. آزمون های گروه مرجع آنهایی هستند که پاسخهای یک گروه نمونه از آزمودنی ها را وسیله تفسير عملکرد آزمودنی های جدید قرار دهند. در آزمون های گروه – مرجع به این ترتیب نرم یا نمرات پاسخ دهندگان قبلی، اهمیت پیدا میکند در صورتی که در آزمون های ملاک مرجع، اهمیت اصلی به ملاک های خارجی داده می شود.

۲- آزمونهای استعداد در مقایسه با آزمونهای پیشرفت؟ کلمه استعداد تاکنون بحث های زیادی را در متون روان شناسی برانگیخته است. برخی آن را بمانند واژه های هوش یا انگیزه ابداع شده از سوی روان شناسان می دانند و معتقدند که وجود برخی از کلمات در زبان های ملل دلیل بر وجود محتوای آنها نیست. گروهی دیگر استعداد را توان بالقوه فرد در یک فعالیت مشخص معرفی می کنند و در پدیدایی آن بیشتر به عوامل وراثتی تکیه می کنند. مثل استعداد موسیقی، درک ریاضی و غيره.

آزمونهای پیشرفت آنهایی هستند که روند یادگیری با پیشرفت موفقیت یک فرد را در انجام یک وظیفه خاص ارزشیابی می کنند بدون اینکه به زمینه های وراثتی آنها توجه داشته باشند. آزمونهای استعداد و پیشرفت از نظر صوری یا محتوای سئوالات تفاوت چندانی ندارند و تفاوت اصلی آنها بیشتر در اهداف کاربردشان برجسته می گردد. به طور مثال بسیاری از سئوالات آزمونهای استانفورد – بینه یا وکسلر در زمینه محاسبات یا درک لغات، یادگیری های گذشته افراد را می سنجند و از این نظر می توانند در یک مقوله

می دانیم که هر آزمونی برای اندازه گیری یک یا چند خصیصه مشخص درست شده است. منظور از روایی یک آزمون بررسی این واقعیت است که آیا آزمون مورد نظر می تواند در عمل و به درستی همان چیزی را که مدعی است مورد سنجش قرار دهد؟ اگر چنین است میزان موفقیت آن در این کار تا چه حد است؟ آیا احتمال ندارد که به همراه خصیصه مورد نظر عوامل مخل وارد حوزه سنجش آزمون شده باشند؟ در این صورت آن عوامل کدام هستند و درجه ترکیب آنها به چه میزان است؟

برای ساختن یک آزمون روانی خوب که از روایی بالایی برخوردار باشد روان شناس باید در وهله اول تعریف عملیاتی دقیقی از موضوعی که قصد سنجش آن را دارد به عمل آورد تا ابعاد و محدوده کار را به خوبی مشخص کرده باشد. سپس او باید به فراهم کردن سئوالاتی بپردازد که تمام وجوه حیطه مورد نظر را تحت پوشش قرار دهند. این سئوالات باید جامع و مانع باشند و در هر وجه نسبت تعداد آنها متناسب با اهمیت مشارکت آن وجه در کل موضوع تعریف شده باشد. در آخر کار او باید با در نظر گرفتن سطح دشواری و قدرت تشخیص سئوالات آنها را از ساده به دشوار تنظیم کند و یا اینکه با توجه به رابطه همبستگی شان آنها را دسته بندی کرده و در خرده آزمونهای مشخص جای دهد. لازمه همه این کارها احاطه به موضوع مورد سنجش، آگاهی از نظریه های زیربنایی آن برای انتخاب یکی از آنها، صرف وقت برای برگزیدن سئوالات مناسب و استفاده از محاسبات آماری مطلوب است. در عمل ملاحظه می کنیم که آزمونهای روانی، حتی مشهورترین آنها، از این نظرها بی عیب نیستند و به همین جهت هنگام به کار بردن آنها باید نقاط ضعف یا قوت آنها شناسایی گردند. همان طوری که آناستازی می نویسد گرچه نام آزمونها برچسب های کوتاه و مناسبی برای شناسایی آنها هستند اما نشان نمی دهند که آزمون به درستی چه چیزی را می سنجد.

“روایی هر آزمون باید در ارتباط با کار بردهای خاصی تعیین گردد که برای آن پیش بینی

۳- نمونه گیری طبقه ای

در این شیوه نمونه گیری اول افراد جامعه به طبقات مورد نظر مثل زنان، مردان، دانش آموزان، کارمندان، کسانی که درآمد بالاتر در ماه دارند و غیره تقسیم می شوند و از بین آنها افراد گروه نمونه را به نسبت هایی انتخاب می کنند که ترکیب جامعه دیکته می کند.

۴- نمونه گیری خوشه ای

این شیوه نمونه گیری وقتی به کار گرفته می شود که جامعه مورد تحقیق وسیع باشد. مثلا کلیه دانش آموزان یک شهر. در این صورت اول به طور تصادفی ساده چند مدرسه از بین مدارس شهر برگزیده می شوند و سپس از بین دانش آموزان آن مدارس افراد نمونه مورد نظر به طور تصادفی انتخاب می شوند.

۵- نمونه گیری خوشه ای چند مرحله ای

وقتی که جامعه مورد مطالعه، بسیار وسیع باشد از نمونه گیری خوشهای چند مرحله ای استفاده می شود. مثلا آن گاه که بخواهیم آزمون هوش برای کلیه افراد زیر ۱۸ سال جامعه درست کنیم در این صورت اول مناطق کشور را براساس استان ها تقسیم بندی می کنیم، سپس از هر استان چند شهر را برمی گزینیم، آنگاه از هر شهر چند محله را انتخاب میکنیم، و سپس از هر محله افراد مورد نظر را به شیوه تصادفی ساده انتخاب می نماییم.

به طوری که ملاحظه می شود در این شیوه نمونه گیری از جامعه دقت زیادی باید معمول شود زیرا در هر مرحله نمونه ها باید به گونه ای انتخاب شوند که معرف وجوه مختلف جامعه کثیرالابعاد باشند. مثلا سن، جنسیت، میزان درآمد، سطح تحصیلات والدین، زبان و غیره.

به منظور از اعتبار، ثبات نمرات پاسخ دهندگان به آزمون در سنجش های مکرر بر روی افراد واحد و همسانی درونی ماده سئوالات آزمون است. چنانچه آزمونی را چند بار با فاصله زمانی نه چندان زیاد، مثلا چند روز یا چند هفته، بر روی یک فرد اجرا کنیم و هر بار با نمرات متفاوت از دفعه قبل رو به رو شویم در این صورت خواهیم گفت که آزمون از اعتبار کافی برخوردار نیست زیرا نمی توان به نتیجه اجرای آن اعتماد کرد

به هنگام بررسی درجه اعتبار آزمون، روان شناس نمی خواهد مشخص کند که آزمون واقعا چه چیزی را می سنجد، بلکه می خواهد بداند که آزمون در سنجش همان چیزهایی که انجام می دهد تا چه حد دقیق است. به عبارت دیگر او با خطاهای اندازه گیری با | متغیرهای مزاحم آزمون سرو کار دارد و می خواهد درجه دخالت و مقاومت آنها را در جریان سنجش تعیین کند متغیرهای مزاحم از آزمونی به آزمون دیگر فرق می کنند و به سه دسته زیر تقسیم می شوند:

الف: متغیرهای وابسته به آزمودنی . از جمله نوسانات علاقه مندی با همدلی به جریان سنجش، خستگی پذیری، مریضی، از دست دادن کنجکاوی با دقت …

ب: شرایط محیط زمان سنجش. تغییر سالن، عوامل حواس پرتی از قبیل سروصدا، نوسانات نور، حرارت، شخصیت آزمونگران ..

پ: ویژگی های ساختار آزمون. تعداد سئوالات و طولانی بودن متن آنها، جمله بندی آنها، ابهام یا دو پهلو بودن معانی آنها، سهل الوصول بودن آنها برای نگهداری در حافظه، غير متجانس بودن آنها …)

برخی از عوامل فوق به طور نسبی قابل کنترل هستند، از جمله آنهایی که به شرایط زمان سنجش مربوط می شوند. و برخی دیگر از کنترل روان شناس خارجند. بنابراین می توان ادعا کرد که هیچ گاه نتایج اجرای دوبار آزمون به طور کامل یکسان نخواهد شد و این امر درباره همه آزمونها حتی آزمون های مشهور صادق است. آنچه که در اینجا

یک آزمون روانی علاوه بر روایی و اعتبار سطح بالا باید ویژگی های دیگر را داشته باشد تا یک آزمون خوب محسوب شود. گروهی از مؤلفان از جمله کلاپارد ویژگی ها را با عنوان های متعدد، حتی تا ۲۰ عنوان، نیز ذکر کرده اند. از آنجا که برخی این ویژگی ها می توانند در هم ادغام شوند ما برای اجتناب از طولانی شدن، آنها را در عنوان زیر معرفی میکنیم

(1- رغبت برانگیز بودن )

می توان رغبت برانگیز بودن را با عنوان روایی صوری آزمون نیز مطالعه کرد. بدیهی است که اگر آزمونی بسیاری از ویژگی های یک آزمون خوب را دارا باشد لكن فاقد شرایط لازم برای برانگیختن آزمودنی ها به ارائه پاسخ باشد، نمی توان ادعا کرد که خصوصیات مورد نظر را به طور رضایت بخش سنجیده است. در این گونه موارد معلوم نیست که عدم موفقیت، با موفقیت نسبی پاسخ دهندگان باید به حساب ناتوانی آنها گذاشته شود یا بی رغبتی آنها. برای ایجاد رغبت در آزمودنی ها باید بسیاری از ویژگی های شخصیت آنها در نظر گرفته شود. از جمله سن، جنسیت، گرایش های شغلی، پایه تحصیلی، سطح توانایی ها و غیره. به عبارت دیگر آزمون باید از تمام جهات با مشغولیات ذهنی آزمودنیها هماهنگی داشته باشد.

در برخی از آزمونها سئوالات ساده در صفحه اول دفترچه آزمون آورده می شود و به مرور به دشواری سئوالات افزوده می شود. این امر در آن دسته از آزمون هایی که محتویات همسان بسیار بالا دارند خستگی ایجاد میکند و نتیجه سنجش را تحت تاثیر قرار می دهد. از این نظر می توان گفت آزمونی مطلوب است که هم بتواند رغبت پاسخ دهندگان را برانگیزد و هم اینکه بتواند آن را تا پایان آزمون در همان سطح نگاه دارد.

با توجه به تعداد و تنوع آزمون های روانی ابداع شده از آغاز قرن بیستم تاکنون ارای تعریفی که بتواند به طور جامع و مانع همه آنها را اعم از آزمونهای استعداد، شخصیت یادگیری … در بر گیرد کاری دشوار می نماید. تعاریف ارائه شده در کتابچه های راهنما آزمون ها یا متون کلاسیک روان سنجی اغلب وجهی از سنجش روانی را ملاک نظر قرار داده اند و یا اینکه با رویکرد یک آزمون ویژه، به تعریف آزمون به طور کلی پرداخته اند به طور مثال برخی در تعریف آزمون به سنجش استعدادها و برخی دیگر به ارزشیابی صفات شخصیت توجه کرده اند. از بین تعاریف موجود آنهایی که سنجش رفتار را اساس تعریف خود قرار داده اند، قانع کننده تر و تعمیم یافته تر جلوه می نمایند. آناستازیا در آمریکا و پیشوا در اروپا از زمره این افرادند. آناستازی در کتاب «روان آزمایی می نویسد:

: آزمون روانی وسیله ای است عینی و هنجار شده که برای اندازه گیری نمونه ای از رفتار» به کار برده می شود

پیشو نیز تعریفی کم و بیش مشابه دارد. او در کتاب «آزمون های روانی» می نویسد: آزمون عبارت است از یک موقعیت آزمایشی هنجار شده که به عنوان محرک برای دریافت یک رفتار مشخص مورد استفاده قرار می گیرد.»

در این تعاریف با اینکه یکی آن را وسیله و دیگری آن را موقعیت در نظر گرفته اند سه ویژگی مهم به شرح زیر دیده می شود:

نخست این که آزمون پدیده ای است عینی که آن را برای اندازه گیری توانایی افراد به کار می بردند. منظور از عینیت آزمون مشخص بودن دقیق محتوای سئوالات، حوزه های سنجش، شیوه اجرا و نمره گذاری است. در هر آزمون زمان اجرا، دستورالعمل های شفاهی، مثال ها برای پاسخ به سئوالات به خوبی مشخص می شوند تا نظر شخصی اجرا کنندگان در آنها دخالت نداشته باشد.

هوش یا کاملا نادیده گرفته می شود و یا اینکه تحت الشعاع بررسی تحولات کیفی آن قرار می گیرد. در جریان سنجش این آزمون ها روان شناس به کمک شیوه های طراحی شده سعی میکند پی ببرد آزمودنی در کدام یک از مراحل تحول رفتار یا قضاوت وشمندانه قرار گرفته است و حالت ویژه او در آن مرحله چگونه است. بنابراین همه سئوالات، شیوه های سنجش و ابزار برگزیده در این آزمون ها وقتی از روایی برخوردار خواهند بود که به گونه ای افتراقی منطبق با ویژگی هایی باشند که در مراحل رشد شناختی، به گونه نظری منظور شده اند.

ملاک دیگری که در بررسی سازه آزمونها از آن می توان استفاده کرد کشف و استخراج عوامل موجود در آزمون و تعیین همبستگی آنها با هم و با اهداف کلی آزمون است. تعیین عوامل موجود در آزمون با شیوه هایی انجام می شود که اصطلاحا تحليل عوامل” نامیده شده اند. در این شیوه ها برخلاف موارد بالا که عمدتا به صورت نظرى به کار گرفته می شوند از آمار و فرمول های مربوط به آن استفاده می شود. کلیه متغیرهای به کار رفته در آزمون در آغاز استخراج و به تناسب نوع همبستگی شان خوشه بندی می شوند، سپس وزن عاملی هر یک از آنها تعیین و رابطه آنها با هم سنجیده می شود. همبستگی با ناهمبستگی این عوامل با یکدیگر و با کل آزمون نشان خواهد داد که آزمون تا چه حد از روایی سازه مطلوب برخوردار است.

همسانی درونی

محاسبه همسانی درونی سئوالات آزمون، شیوه دیگری است که در بررسی روایی سازه برخی از آزمونها، به ویژه آزمون های شخصیت، به کار برده می شود. در این محاسبه، نمره کل آزمون ملاک قضاوت قرار می گیرد و نمرات یکایک سئوالات آزمون با ان سنجیده می شود. برای رسیدن به این هدف، دو شیوه مختلف به کار می رود.

در شیوۀ اول نمرات افرادی که به آزمون پاسخ داده اند، ابتدا از زیاد به کم ردیف شده به سه گروه قوی، متوسط و ضعیف تقسیم می گردند. سپس کارکرد گروه قوی با کارکرد روه ضعیف در هر یک از سئوالات آزمون با یکدیگر مقایسه می شود. سئوالاتی که در

قرار گیرند. در برخی از متون روان سنجی چنین متداول است که آزمون های هوش را آزمونهای استعداد کلی و آزمون های پیشرفت را آزمون های استعداد خاص تلقی کنند

۳- آزمونهای وابسته به فرهنگ در مقایسه با آزمونهای ناوابسته به فرهنگ بری از فرهنگ)

زبان، بستر انتقالات فرهنگی است و لذا هر آزمونی که سئوالات آن کلامی باشد۔ وابسته به فرهنگ تلقی می گردد. به هنگام پاسخ به این آزمونها کسانی که در عوامل کلامی پیشرفته ترند نمرات بهتری دریافت می دارند زیرا از طرفی مفهوم سئوال را بهتر درک می کنند و از طرفی دیگر پاسخ خود را با کلمات و جملات قابل قبول تری ارانه می نمایند.

سئوالات آزمونهای ناوابسته به فرهنگ به گونه ای انتخاب می شوند که متغیرهای فرهنگی؛ از جمله زبان و یادگیری های قبلی، در آنها نقشی نداشته باشند. برای این منظور معمولا از سئوالات تصویری، به ویژه تصویرهای هندسی، سئوالات عملی، محاسبات سادة عددی، سئوالات جور کردنی اشیاء، یا کاربرد ساده آنها استفاده می کنند. در آزمونهای جامع؛ از جمله آزمونهای استانفورد – بینه و وکسلر، سئوالات مربوط به درک لغات، ضرب المثل ها، ساختن جملات یا قافیه با کلمات، و استنباط معنا از یک متن شنیداری یا نوشتاری جزو سئوالات وابسته به فرهنگ طبقه بندی می شوند. در عوض، در همین آزمون ها سئوالات مربوط به جور کردن مکعب ها، طبقه بندی اشیاء از نظر شکل یا رنگ، پرسیدن دست راست یا دست چپ، تشخیص تشابه یا اختلاف تصاویر جزو سئوالات ناوابسته به فرهنگ هستند.

آزمون هایی ساخته شده اند که تمام سئوالات آنها به فرهنگ ناوابسته اند. این آزمون ها به هدف حذف عامل زبان و یادگیری در سنجش هوش درست شده اند بهترین وسیله برای تحقیقات بین فرهنگی به شمار می آیند. آزمون ریون”، 148 ( آنستی، آزمون لايتر، آزمون ادرا ک فضایی ترستون ۴ از جمله آزمونهای ناوابسته به

گرایشها، روابط اجتماعی و نگرش ها را می سنجد. این آزمون ها برخلاف آزمون های موش یا معلومات که نتایج آنها منحصرا به صورت کمی بیان می شوند بیشتر گرایش به توصیف و طبقه بندی خصیصه های روانی دارند. از این روی اصطلاحات سنجش یا اندازه گیری در این آزمون ها مفهوم وسیع تری به خود می گیرند و هم شامل مقادیر کمی و هم توصیف کیفی می گردند.

روش های متداول در بررسی شخصیت نیز به همین نسبت از تنوع و تمایز بیشتری برخوردارند. از نظر تاریخ پیدایش «تداعی آزاد کلمات» که در سال ۱۸۹۵ از سوی کرپیلین به کار برده می شد اولین روش ابداعی در بررسی شخصیت به حساب می آید. کریپلین تعداد کلمات متنوع را یک به یک به مریض های روانی ارائه می نمود و از آنها می خواست آنچه را که در برابر شنیدن هر کلمه بی درنگ به ذهنشان خطور می کرد به زبان آورند. او به این ترتیب تأثیر خستگی، گرسنگی و داروها را بر روی کارکرد شخصیت بررسی می کرد و به این نتیجه رسیده بود که این عوامل باعث افزایش تداعی های سطحی می شوند. روش ابداعی کریپلین بعدها در روانکاوی گسترش یافت و بالاخره در سال ۱۹۰۴ منجر به پیدایش آزمون «تداعی کلمات فراخوان» از سوی یونگ ا گردید.

تنظیم پرسشنامه و پاسخ به سئوالات خبری آن روش دیگری بود که همزمان با پیدایش کلمات متداعی شکل گرفت. در آغاز پیشگامانی از قبیل گالتن، پیرسون و کتل به آن پرداختند، سپس در جریان جنگ جهانی اول منجر به پیدایش پرسشنامه خود سنجی از جانب وودورث ” روان شناس آمریکایی گردید. پرسشنامه و و دورث «برگ احوال شخصی» نامیده می شد و به منظور تشخیص سربازان روان نژند؟ از سربازان عادی مورد استفاده قرار می گرفت. پاسخ دهندگان به پرسشنامه در برابر نوع پاسخ خود به هر سئوال نمره ای دریافت می نمودند و در آخر سر مجموع نمرات آنها گویای حالات روانی آنها تلقی می گردید.

بعد از جنگ، «برگ احوال شخصی» وو دورث در مؤسسات دیگر جز ارتش نیز به کار رفت و به اقتباس از آن پرسشنامه های دیگری نیز ساخته شد. برخی از این پرسشنامه ها

اعتبار محاسبه شده با تعداد سئوالات آزمون نیز وابسته است. هر چه تعداد سئوالات آزمون بیشتر باشد به همان نسبت ضریب اعتبار آزمون بالاتر خواهد شد.

فرمول دیگری را که کودر و ریچاردسون پیشنهاد کرده اند به فرمول شماره ۲۱ شهرت یافته است. با این فرمول نیز مشابه فرمول شماره ۲۰، آزمون یک بار اجرا می شود و همه سئوالات آزمون در محاسبه دخالت داده می شوند. مفروضات فرمول شماره ۲۱ به شرح زیر است

جای فرمول

,1 = ضریب اعتبار آزمون،

n = تعا۔ اد سوالات آزمون

ایکس= میانگین نمرات آرمول

s = واریانس نمرات آزمون

به طور مثال اگر میانگین یک آزمون ۶۰ سنو الی برابر ۴۵ و واریانس آن ۱۵ شده باشد ضریب اعتبار از خواهد شد

جای فرمول

ناگفته نماند که با شیوه های پیشنهادی کودر و ریچاردسون، مشابه حالت دو نیمه کردن آزمون، همسانی درونی سئوالات آزمون محاسبه می شود

ث: روش قضاوت نمره گذاران

مقایسه قضاوت نمره گذاران برای بررسی اعتبار آزمونهایی به کار برده می شود که مارک های عینی همه پسندی برای ارزشیابی پاسخ به آنها ابداع نشده باشد. به طور مثال در آزمون های خلاقیت، انشائی پیشرفت تحصیلی، برخی از آزمونهای فرافکن با عملی

الف – نظریه های عاملی

تحلیل عوامل به مجموعه فعالیت های آماری گفته می شود که به کمک آنها می توان سئوالات متعدد و پراکنده یک آزمون را به دسته ها یا خوشه های همبسته به یکدیگر تقسیم نمود تا مقایسه و قضاوت درباره آنها ساده تر گردد. برای این منظور در آغاز سئوالی را که بهترین شاخص یکی از عامل های احتمالی است انتخاب می کنند و سپس همبستگی سایر سئوالات را با آن محاسبه می نمایند. چنانچه برخی از سئوالات با شاخص موردنظر همبستگی سطح بالا نشان دادند آنها را جزو یک عامل تلقی کرده و نامی مناسب برای آنها انتخاب می نمایند. به طور مثال اگر در یک آزمون هوش معلوم شود که مثلا ۵ سئوالی که در آغاز به هدف های متفاوت در آزمون گنجانیده شده اند یک عامل مشترک، مثلا ادراک فضائی را می سنجند، از آن پس ادراک فضایی را جزو حوزه های مورد سنجش آن آزمون معرفی می نمایند.

لازمه تحلیل عوامل، تنظیم جدول کامل همبستگی بین تمام ماده سئوالات موجود در آزمون است. این جدول ها را اصطلاحا «ماتریسهای همبستگی» می نامند. ماتریس های همبستگی نشانگر درجه یا وزن عددی اشباع آزمون از هر یک از عوامل کشف شده در آن هستند. با مراجعه به این ماتریس ها می توان دریافت که اولا هر آزمون دارای چند عامل است و ثانیا میزان مشارکت هر عامل در کل آزمون چقدر است. از طرفی دیگر مقایسه ماتریس های آزمون های مشابه وجوه تشابه یا تفاوت آنها را برای ما آشکارتر می سازند. با مراجعه به ماتریس همبستگی آزمون ها می توانیم آزمونی را انتخاب کنیم که ما را به هدف سنجش مورد نظر نزدیکتر نماید.

روش تحلیل عاملی را اولین بار پیرسون در سال ۱۹۰۱ پیشنهاد کرد و سپس در سال ۱۹۰۴ اسپیرمن آنرا پرورد. افراد مختلفی تاکنون در این زمینه به شهرت رسیده اند که از

است. منظور از تشخیص، قدرت آزمون در طبقه بندی افراد از نظر تفاوت های ف امراض روانی، صفات شخصیتی و یا ویژگی های وابسته به سن و جنسیت است. مراد پیش بینی، بیان این واقعیت است که تا چه اندازه می توان بر بنیاد پاسخ های فعلی افراد آزمون حد پیشرفت با کارایی آنها را در آینده نزدیک یا دور برآورد کرد؟ گرچه هی آزمون ها را می توان؛ هم به منظور تشخیص و هم به منظور پیش بینی، به کار برد لك برخی از آنها بیشتر به منظور تشخیص به کار برده می شوند تا پیش بینی. به طور مثال اکثر آزمونهای فرافکن از جمله آزمون رورشاخ و آزمون

T.A.T ، همچنین بعضی از پرسشنامه های شخصیتی از جمله M.M.P.I بیشتر برای تشخیص در محیط های بالینی یا کلینیک های راهنمایی و مشاوره مورد استفاده قرار میگیرند. به کار بردن این آزمون ها در جریان ابتلای افراد به اختلالات روانی به روان شناس اجازه می دهد که نوع و درجه اختلال را در نزد آنها تعیین کند و بعد از بهبودی نشان خواهد داد که درمان تا چه حد موفق بوده است.

ابزارهایی بپردازد که آن خصایص را به گونه کمی مورد سنجش قرار می دهند.

لازم به ذکر است که بررسی روایی سازه آزمونها بعد از دو مورد دیگر، یعنی روایی محتوا و روایی ملاکی وارد متون روان سنجی شده است. در سال ۱۹۵۴ انجمن روان شناسی آمریکایی

P.A.۱۸ به دنبال بحثهایی که در سالهای قبل در بین روان شناسان درگرفته بود به آن رسمیت بخشید و آن را شرط ضروری آزمونهایی قرار داد که محتوای موضوعی آنها صراحت کمتری دارند. در بحث های بررسی روایی سازه شواهد به دست آمده از روایی محتوا و روایی ملاکی نیز به کار گرفته می شوند تا به تجزیه و تحلیل آزمونها عینیت بیشتری داده شود.

ملاک های مختلفی وجود دارند که به کمک آنها می توان روایی سازه را در آزمونها مورد بررسی قرار داد. این ملاکها از آزمونی به آزمون دیگر فرق می کنند و معمولا ساخت کلی آزمون چهارچوب داوری مباحث را تعیین می کند. به طور مثال در همه آزمون هایی که به قیاس از آزمون بینه – سیمون ساخته شده اند، اعم از آزمون ترمن و مریل، رنه زازو، ایرن لزین، ساخت کلی آزمون بربنیاد سن زمانی و مقاطع مختلف آن استوار گردیده است. در این آزمونها فرض بر این است که هوش از بدو تولد به بعد تا سن معینی (۱۵ تا ۱۶ سالگی) به طور فزاینده ای رشد پیدا کرده و سپس ثابت باقی می ماند. روایی سازه چنین آزمون هایی معمولا در ارتباط با سن تقویمی (زمانی) مورد تجزیه و تحلیل قرار میگیرد. در این آزمون ها باید ثابت کرد که به نسبت افزایش سن تقویمی، سن هوشی نیز افزایش می یابد و اگر چنین شد یقین حاصل می شود که حداقل از این زاویه دید، آزمون از روایی سازه مطلوبی برخوردار است.

در آزمون های ساخته شده بر بنیاد رویکرد شناختی برعکس به جای اینکه به کمیت رشد هوش بیشتر توجه به کیفیت تحولی آن بیشتر توجه می شود. در این آزمونها سئوالات به گونه ای طراحی شده و ردیف می گردند که مراحل تحول هوش را از حالت حسی حرکتی به مراحل پیش عملیاتی، عملیات عینی و هوش انتزاعی بسنجند. نمونه گویای این آزمون های آزمون های ساخته شده بر بنیاد نظریه رشد شناختی پیاژه و آزمون های بررسی رشد اخلاقی کھلبرگ هستند. در این آزمون ها مطالعه رشد کمی

بین دو نیمه آزمون به دست می آید. البته افزایش حاصل همیشه به یک نسبت نخواهد بود. در مواردی که ضریب همبستگی دو نیمه آزمون کمتر یا زیادتر از حد معمول باشد مقدار افزایش کمتر از موقعی خواهد بود که ضریب همبستگی بین ۰/۴۰ تا ۰/۶۰ محاسبه شده باشد.

شرط به کارگیری ضریب اعتبار اسپیرمن – براون یکسان بودن واریانس نمره های دو نیمه آزمون است. در صورتی که واریانس نمره های دونیمه آزمون یکسان نباشد از ضریب آلفای گرنباخ استفاده می شود. به شرح زیر:

– ۲S – (Sx + Sy)

S’t

در این فرمول علائم به کار برده شده عبارتند از:

a = ضریب اعتبار آزمون از راه دو نیمه کردن آن،

St = واریانس كل نمرات،

Sx = واریانس نمرات نيمه اول آزمون،

Sy = واریانس نمرات نیمه دوم آزمون

باید توجه داشت که ضریب آلفای گرنباخ حد پایین ضریب اعتبار آزمون را برآورده میکند و احتمال دارد که ضریب اعتبار واقعی آزمون از آن بیشتر باشد.

همان طوری که ملاحظه می شود ضریب اعتبار به شیوه دو نیمه کردن آزمون با همسانی درونی ماده سئوالات آن سروکار دارد نه ثبات نمرات در فاصله دو بار اجرا. به عبارت بهتر در این نوع بررسی اعتبار، تأثیر گذشت زمان بر روی نمرات آزمون مورد توجه قرار نمی گیرد بلکه همبستگی سئوالات با هم و درجة انسجام آنها محاسبه می گردد.

۴- آزمونهای سرعت در مقایسه با آزمون های قدرت

در آزمون های سرعت، وقت ارائه پاسخ به گونه محدود در نظر گرفته می شود تا آزمودنی ها در اسرع وقت به بیشترین سئوالات پاسخ دهند. در این آزمون ها برای مقایسه بهتر افراد سطح دشواری سئوالات یکسان نگاه داشته می شود تا پاسخ به سئوالی از پاسخ به سئوال دیگر نیاز بیشتر به وقت نداشته باشد. دو پدیده صحت و سرعت در چنین آزمون هایی ملاک قضاوت هستند و بنابراین هرکس که بیشتر پاسخ داده باشد و اغلاط کمتری داشته باشد پیشرفته تر قلمداد خواهد شد.

در آزمون های قدرت، برعکس، سئوالات هرچه بیشتر به پیش برده می شوند دشوارتر می گردند و در عوض وقت به حد کافی به آزمودنی ها داده می شود.

۵- آزمونهای موقعیتی در برابر آزمونهای پرسش و پاسخ

مشاهده نوع رفتار آزمودنی ها در موقعیت های استرس زا یا در شرایطی که می باید به سرعت برای رفع مشکل پیش آمده تصمیم بگیرند اطلاعات با ارزشی ارائه می کند. چنین اطلاعاتی را به هیچ وجه نمی توان از آزمونهای هوش با آزمون های شغلی و حرفهای متعارف به دست آورد. این آزمون ها را معمولا برای موقعیت های مشخص که قبلا «تعریف عملیاتی» دقیق شده اند استاندارد می کنند. کاربرد این آزمون ها در حال حاضر در آرتش، در کارخانه ها، در مؤسسات اداری و تجاری، متداول است و نمره گذاری در آنها بر پایه چک لیست های مشاهده انجام می شود.

کارگران می بایست در گروه مرجع پذیرفته شوند. در اینجا رعایت برخی دیگر از ضوابط نمونه گیری از جامعه مورد نظر نیز بر جستگی می یابد. برای مثال اگر کارگران جامعه با زنان کارگر تشکیل می دهند باید به کارگران گروه نمونه نیز از زنان کارگر انتخاب شوند. و یا اینکه اگر به زنان کارگر بی سواد هستند باید به زنان کارگر گروه نمونه نیز بی سواد باشند.

عدد های پاراگراف بالا در جمله از روی فایل درچ شود

بعد از اینکه افراد گروه نمونه با دقت کافی انتخاب شدند باید آزمون مورد نظر بر روی آنها اجرا گردد. در اینجا نیز شرایط و ضوابط پیش بینی شده در دفترچه راهنمای آزمون باید کلا اعمال شوند تا به نتایج آن بتوان اعتماد کرد. هرگونه تغییر یا نوآوری در دستورالعمل اجرای آزمون موجب تغییر نمرات به دست آمده خواهد شد و پاسخ های گروه مرجع (= نمونه را از اعتبار خواهد انداخت.

کمیت های به دست آمده از پاسخ های گروه نمونه بعد از تبدیل به نمرات تراز شده در جداول مربوط جای داده می شوند و به عنوان هنجار با نرم آزمون با دفترچه های آزمون انتشار می یابند.

بنابراین هنجار با نرم یک آزمون به ما امکان می دهد که نمره فردی را که اخيرة آزموده ایم با نمرات افراد گروه مرجع مقایسه کنیم و معلوم کنیم که آیا معادل میانگین افراد گروه مرجع نمره دریافت کرده است؟ در صورت منفی بودن پاسخ، اختلاف نمرة او تا چه اندازه است؟

راه های نمونه گیری

از آنچه که گفته شد چنین برمی آید که انتخاب افراد نمونه باید با دقت انجام شود تا معرف جامعه تحقیق باشند. در صورتی که افراد نمونه با نسبت مناسب از جامعه انتخاب نشوند کجی در منحنی نمونه ایجاد می شود و در این حالت نمرات به دست آمده از تحقيق قدرت پیش بینی لازم را نخواهند داشت. مناسب ترین شیوه انتخاب افراد گروه مرجع، نمونه گیری تصادفی از جامعه موردنظر است. برای این منظور به اقتضای جامعه تحقیق به یکی از روش های پنجگانه زیر می توان اقدام نمود:

ب – نظریه های فرایند مداری هوش

توجه به فرایند کارکرد هوش به جای کمیت بازده آن پدیده ای است نو که در های اخیر با گسترش نظریه شناختی وارد حوزه روان سنجی شده است. در این باید به اندازه گیری تفاوت های فردی، مانند اکثر آزمون های متعارف هوش، توجه می شود بلکه بیشترین اهمیت به شیوه ای داده می شود که آزمودنی ها برای ارائه پاسخ در پیش می گیرند. برای روشن شدن مطلب مثالی بزنیم. دو معلم را در نظر بگیرید که در دو کلاس موازی دبیرستان مشغول به تدریس دروس ریاضی هستند. به هنگام تصحيح اوراق، معلم اول به راه حل دانش آموزان توجه نمی کند و فقط به استناد درستی یا نادرستی عدد جواب هر مسئله به دانش آموزان نمره می دهد. معلم دوم برعکس اتخاذ راه حل ها را مهمتر از درستی یا نادرستی جوابها تلقی می کند و به همین جهت مسیری را که هر دانش آموز برای حل هر مسئله طی کرده است با دقت مورد بررسی قرار می دهد. این معلمان هر دو به ارزشیابی می پردازند لکن یکی نتیجه کارکرد را ملاک ارائه نمره ها قرار می دهد و دیگری فرایند کارکرد را.

آزمونهایی که بربنیاد نظریه فرایند مداری هوش ساخته شده اند نیز فرایند فعالیت های هوشمندانه را ارزشیابی می کنند. در این آزمون ها پاسخ هر فرد با نرم های به دست آمده از پاسخ افراد دیگر سنجیده نمی شود بلکه با در نظر گرفتن مراحل رشد هوش، آنگونه ارزشیابی می شود که در نظریه های شناختی هوش ارائه شده اند.

از بین کسانی که به فرایند رشد هوش توجه داشته اند پیاژه ۲ و برونر” از همه معروف تر هستند. از آنجا که نظریات این افراد در دروس روان شناسی عمومی و روان شناسی کودک به طور مفصل آورده شده اند ما در اینجا مختصرا به یاد آوری آنها می پردازیم.

سئوالات تعیین می گردد. در بحث اعتبار گفتیم که هرچه به تعداد سئوالات آزمون افرون شود اعتبار آزمون نیز افزایش می یابد. بنابراین منظور ما در اینجا کاهش سئوالات مطلوب آزمون نیست بلکه انتخاب محتواهایی برای آنهاست، که در عین سنجش دقة همان مطلب، وقت کمتری را طلب کنند.

از طرفی دیگر سبک نمره گذاری برخی از آزمونها بسیار وقت گیر است و این مطلب؛ به ویژه برای آن دسته از روان شناسانی که می بایست در کلینیک ها در مدت کم مراجعان بسیاری را بپذیرند مشکل ایجاد میکند. در این گونه موارد روان شناسان کاربرد آزمونهایی را که حتی از دقت کمتری برخوردارند به آنهایی که دقیق ولی وقت گیرند ترجیح می دهند. بدیهی است که اگر آزمون سازان به هنگام تهیه آزمون به این نکات عملی توجه کنند شیوه هایی را بر خواهند گزید که هم مدت اجرای آزمون مورد نظر و هم مدت نمره گذاری آن را تقلیل خواهد داد.

٣- سهولت تفسیر نتایج)

تفسیر نتایج آزمون به کمک اطلاعات نظری خلاصه شده و جداول عددی به دست آمده از تحقیقات ممکن می گردد. لذا در دفترچه معرفی آزمون می بایست نظریه یا نظریه های زیربنایی آن به طور خلاصه ولی جامع و مانع ارائه شود. از طرفی دیگر جداول عددی ارائه شده در دفترچه کاربرد آزمون می بایست امکان مقایسه سهل و سریع نتایج هر سنجش با آنها را بدهد. برای رسیدن به این اهداف اعداد ارائه شده باید یا بر بنیاد مقاطع سنی، یا جنسیت، با تحصیلات، با مشاغل، با اختلاف کمیتهای سنجیده شده در آزمون تنظیم گردند و عنوان های کاملا کوتاه ولی رسا، جداول ارائه شده را از یکدیگر متمایز سازند. همچنین باید اطلاعات مربوط به اعتبار، ضریب همبستگی خرده آزمونها، قدرت پیش بینی آزمون و همبستگی آن با اندازه های ملاک به روشنی ذکر شوند تا تفسیر نتایج به استناد آنها عمیق تر شود.

ساده، روشن، خلاصه و جامع الاطراف بودن دفترچه راهنمای آزمون به این ترتیب جزء جدایی ناپذیر یک آزمون خوب محسوب می شود و هنگام فروش آزمون می بایست در اختیار خریداران گذاشته شود.

را نداریم از روش دو نیمه کردن آزمون استفاده می کنیم. در این حالت آزمون را یک بار اجرا می کنیم و سپس آن را به دو نیمه مساوی تقسیم کرده و همبستگی نمرات دو نیمه أن را با یکدیگر حساب می کنیم. برای تقسیم آزمون به دو نیمه یکسان می توان یکی از دو شیوه متداول زیر را برگزید. در روش اول سئوالات آزمون را به ترتیب به صورت فرد و زوج از هم جدا میکنیم و سپس سئوالات فرد را به مثابه یک آزمون و سئوالات زوج را به مثابه آزمون دیگر تلقی کرده و همبستگی آنها را به دست می آوریم. در روش دوم بدون توجه به فرد یا زوج بودن سئوالات، كل سئوالات آزمون را به دو قسمت تقسیم می کنیم و آنگاه مانند حالت بالا همبستگی آنها را با هم محاسبه می نماییم. روش اول برای آزمونهایی که سئوالات آنها از تنوع بیشتری برخوردارند و روش دوم برای آنهایی که سئوالاتشان یکنواخت بوده و وزن مساوی دارند مناسب تشخیص داده شده اند.

از آنجا که آزمون در این شیوه سنجش به دو نیمه تقسیم می شود ضریب همبستگی حاصله، ضریب اعتبار نیمی از آزمون تلقی می گردد. برای محاسبه ضریب اعتبار کل آزمون فرمول پیشنهادی اسپیرمن – براون به شرح زیر به کار گرفته می شود.

۳۱۱=

۱+r

در این فرمول علائم به کار گرفته عبارتند از :

R11 ضریب اعتبار کل آزمون،

R11: ضریب همبستگی بین دو نیمه آزمون،

به طور مثال اگر ضریب همبستگی بین دو نیمه آزمون

۰/۶۵ به دست آمده باشد ضریب اعتبار کل آزمون خواهد شد

– = ۰/۷۸ ۱/۶۵

۲X۰/۶۵ ۱ + ۰/۶۵

۱۱

ملاحظه می شود ضریب اعتبار کل آزمون همیشه بیشتر از ضریب همبستگی

عنوان یک پدیده بسیط به کار گرفته شوند یا اینکه ترکیب یافته از عوامل زیر ساز مختلف منظور گردند. سپس باید به دنبال ابزار مناسبی بود که همه وجود پایانه مورد نظر و فقط پدیده مورد نظر را بسنجد و از تداخل توانش های دیگر جلوگیری کند. این کار، گرچه ناممکن نیست لکن با دشواری هایی رو به رو است که از قاطعیت سنجش خواهد کاست و به همین جهت همیشه از کسری از روایی صحبت به میان می آید نه از روایی کامل. تحقیقات معمولا ضرایب روایی از

۱/۴۰ یا ۰/۵۰ به بالا را معطاء ب معرفی می نمایند و با در نظر گرفتن ماهیت موضوع مورد سنجش، حتی ضریب های ضعیفی مثل ۰/۲۰ یا ۰/۳۰ را نیز بعد از تفسیر و توجیه می پذیرند. آنچه که در اینجا یقینی است این است که عدد محاسبه شده باید به مقداری برسد که در سطح قابل قبولی (۱٪ یا ۵.) از لحاظ آماری معنادار تلقی شود.

بحث روایی آزمون ها از همان آغاز شروع روان سنجی مطرح بوده است و در دهه های اخیر روان سنج ها از عناوینی از جمله روایی وابسته به محتوا ، روایی وابسته به ملاک، روایی وابسته به سازه “، روایی همزمان ، روایی پیش بیند، روایی عاملی ، روایی صفت یا خصیصه، روایی همگراه، روایی افتراقی، روایی تجربی و بالاخره روایی صوری صحبت کرده اند. از آنجا که بسیاری از این روایی ها می توانند زیر مجموعه با مترادف عناوین دیگر قرار گیرند متون روانسنجی سال های اخیر پیشنهاد می کنند که ما مجموعه آنها را تحت سه عنوان برجسته: روایی محتوا، روایی ملاکی و روایی سازه مورد مطالعه قرار دهیم.

در چنین حالتی روایی های تجربی، همزمان، پیش بین وابسته به روایی ملاکی، روایی های صفت یا خصیصه، عاملی، همگرا و افتراقی وابسته به روایی سازه و روایی صوری وابسته به روایی محتوا معرفی خواهند شد.

فعالیت های جاری، که مقایسه با آنها می بایست صورت گیرد باید قبلا به اثبات رسیاه باشد. به طور مثال اگر آزمون جدید یک آزمون هوش یا سنجش توان یادگیری باشد، می توان نمرات آن را با نمرات جاری امتحانات دانش آموزان در دروس مختلف مقایسه کرد. یا اینکه اگر آزمون جدید یک آزمون تشخیص امراض روانی است می توان آن را همزمان با تشخیص طبی روانپزشکان از مراجعه کنندگان به درمانگاه روانی بیمارستان اجرا نمود و نمرات آن را با تشخیص روان پزشکان مقایسه کرد.

۳- روایی سازه

روایی سازه و جه سوم مباحث مربوط به روایی آزمون ها را تشکیل می دهد و بسته به نوع آزمون، دو پدیده زیر در آن مورد توجه قرار میگیرد

الف: خصیصه های مورد سنجش در آزمون و نظریه های زیربنایی آنها،

ب: همسانی درونی ماده سئوالات آزمون.

در بررسی روایی سازه باید تعیین نمود که چه صفت یا خصیصه هایی با آزمون سنجيده می شوند؟ آیا این صفات یا خصیصه ها با هم و با نظریه زیربنایی آزمون هماهنگی دارند؟ در صورت مثبت بودن تا چه حد آزمون در سنجش این متغیرها تواناست؟

اصطلاح سازه در روان شناسی شامل آن دسته از مباحثی می شود که ماهیت آنها به گونه نظری مورد تأیید برخی از افراد قرار می گیرد. مقوله هایی از قبیل هوش، حافظه، استعدادهای هنری، سلطه گری، درون گرایی و برون گرایی، سلامت روانی و غیره همه گرچه مباحث مهم روان شناسی را تشکیل می دهند لكن سازه هایی هستند که به گونه نظری ابداع شده اند. هر یک از این سازه ها در چارچوب یک نظریه مشخص قابل تعریف هستند و خود نیز نظریه های کوچک دیگری را شامل می شوند. ملاک های همه پسندی برای مطالعه آنها در دست نیست. برای ساختن آزمونی که بتواند آنها را به گونه عینی مورد سنجش قرار دهد، روان شناس باید اول یکی از نظریه های موجود مربوط را انتخاب کند و یا اینکه لااقل خود فرضیه هایی را به وجود آورد، سپس باید متغیرهایی را که در آن سازه مشارکت دارند مشخص نماید و در آخر سر به گرد آوری شیوه ها یا

پیش بین آزمونها اهمیت و کاربرد گسترده یافته است.

برای بررسی روایی پیش بینی آزمونها معمولا همبستگی نمرات اخذ شده از کاری حرفه ای یا تحصیلی فعلی افراد را با نمرات به دست آمده از اجرای ماهها یا سال های ق آزمون بر روی آنها محاسبه می کنند. چنانچه این همبستگی مثبت بود به تناسب درجات بالای همبستگی قضاوت می کنند که آزمون از روایی پیش بین سطح بالایی برخوردار است و در صورت منفی بودن میگویند که آزمون فاقد روایی پیش بین مطلوب است

بنابراین در بررسی روایی پیش بین آزمون ها به جای اینکه بیشترین توجه، معطوف به محتوای آزمون شود، به نمرات به دست آمده از آزمون و جداول عددی تنظیم شده برای آنها جلب می گردد. از آنجا که نمرات اجازه می دهند متغير ملاک را که همان موفقیت تحصیلی یا شغلی آینده باشد پیش بینی کنیم پاسخ ها برجستگی بیشتری می یابند.

به همین دلیل است که از روایی پیش بین که محاسبه آن مدت ها بعد از اجرای آزمون و طی تجربیات شغلی تحصیلی یا بعد از اخذ آنها ممکن می گردد تحت عنوان روایی تجربی نام برده اند.

روایی همزمان

به طوری که ملاحظه شد روایی پیش بین آزمون ها را فقط وقتی می توان محاسبه کرد که مدتی از اجرای آنها گذشته باشد و جمعیتی که به آنها پاسخ داده اند در فعالیت های حرفه ای یا تحصیلی به کار مشغول شده باشند. در برخی از موارد آزمون ساز می خواهد روایی آزمون ساخته شده را همزمان با تهیه آن محاسبه کند تا به نقاط ضعف و قوت آن پی ببرد. در این صورت ممکن است به یکی از دو شیوه زیر عمل کند

۱- آزمون جدید را همزمان، به همراه یک آزمون شناخته شده و معروف اجرا کند و بعد از به دست آوردن دو مجموعه نمره، آنها را با هم مقایسه کرده و همبستگی آنها را به دست آورد.

۲ – فقط آزمون جدید را اجرا کند و نمرات آن را با نمرات سایر فعالیت های جا آزمودنی ها مقایسه کند. در صورت اخير همبستگی محتوای سئوالات ازمون و

است. آزمونهای استانفورد – بینه و وکسلر از این نوع هستند. برخی دیگر از آزمون ها گرچه در آغاز به صورت فردی تنظیم کرده اند اما به صورت گروهی نیز می توان به کار برد: از جمله آزمون رورشاخ یا T.A.T . حال باید دید که محاسن و معایب هر یک از ان اجراها کدامند.

محاسن اجراهای گروهی

1- با صرفه بودن. اجرای آزمون ها به صورت گروهی هم از نظر وقت و هم از نظر بودجه با صرفه است. چنانچه در یک محیط آموزشی یا تجاری سالن مناسب، بلندگو و یا وسائل نورپردازی، وجود داشته باشد می توان در آن واحد گروه کثیری از افراد را ارزشیابی کرد. از اجراهای گروهی در مواقعی که منظور شناسایی کارمندان مريض از غير مریض بوده است استفاده کامل نموده اند. همچنین در تحقیقات معمولا از آزمون هایی استفاده میکنند که اجرای گروهی آنها ممکن است.|

۲- عدم نیاز به متخصص. روش اجرا و نمره گذاری آزمون های گروهی، استاندارد شده اند و ماده سئوالات آنها به گونه ای انتخاب شده اند که پاسخ به صورت بله یا خیر و یا انتخاب یکی از گزینه ها انجام می شود. در چنین حالاتی هم در زمان اجرا و هم در زمان نمره گذاری و تصحیح پاسخ ها می توان از کارشناسان فنی و دستیاران کم تجربه نیز استفاده کرد. تصحیح پاسخ های این آزمونها معمولا با کلید انجام می شود و به صورت های کمی ساده ارائه میگردد.

٣- نرمها یا هنجارهای آزمون های گروهی قابل اعتمادتر از نرم های آزمونهای فردی است. این امر به علت تعداد کافی افرادی است که قبلا در گروه مرجع به آزمون مورد نظر پاسخ داده اند. برای استاندارد کردن آزمون های فردی، محقق علاوه بر نیاز به وقت کافی به بودجه قابل ملاحظه نیز احتیاج دارد. اجرای این آزمونها بر روی یک نفر معمولا زمانی در حد بین ۲۰ دقیقه الی یک ساعت و نیم را طلب می کند. از طرفی دیگر جمع بندی نتایج و تفسیر آنها نیز وقت قابل ملاحظه ای را به خود اختصاص می دهند.

– نمونه گیری تصادفی ساده

در این شیوه نمونه گیری تمام افراد جامعه مورد نظر موقعیتی مساوی و مستقل برای انتخاب شدن را دارند. به همین منظور محقق اول فهرست نام افراد جامعه مورد نظ تهیه می کند، سپس به طور تصادفی به هر یک از آنها یک شماره می دهد، آنگاه با مراج. به جدول اعداد تصادفی، افراد گروه نمونه را از بین آنها انتخاب می نماید.

جدول اعداد تصادفی شامل یک مجموعه اعداد پنج رقمی است که با رایانه و به گونه تصادفی تهیه شده است. پژوهشگر برای شروع کار، به اختیار، یکی از سطرها با ستون ها را انتخاب میکند و تمام اعداد آن سطر را برمی گزیند. چنانچه افراد برگزیده کافی نبودند این کار را با انتخاب اختیاری یکی از سطرها و یا ستون های دیگر ادامه می دهد. و این عمل را تا انتخاب تعداد مورد نظر ادامه می دهد. در صورتی که افراد گروه نمونه کم باشند به جای انتخاب روش جدول اعداد تصادفی، پژوهشگر می تواند از شیوه سنتی قرعه کشی استفاده کند. در این صورت نام ها در کیسه ای ریخته می شوند و هر بار به قید قرعه یکی از آنها از کسیه خارج می شود تا همه جمعیت مورد نظر انتخاب شوند.

حل نمونه گیری تصادفی منظم

در شیوه نمونه گیری تصادفی منظم، اول فهرست افراد جامعه را که قبلا تهیه شده است به دست می آوریم مثلا فهرست دانش آموزان مدرسه یا کارمندان یک کارخانه سپس تعداد آنها را به تعداد افراد نمونه پیش بینی شده تقسیم می کنیم. به این ترتیب معلوم خواهد شد که از چند نفر به بعد یکی از افراد فهرست را باید انتخاب کنیم. مثلا اگر حاصل تقسیم، عدد ۱۱ باشد یازدهمین نفر، سپس بیست و دومین نفر، سپس سی و سومین نفر و غیره را تا آخر بر می گزینیم.

در این شیوه گزینش ملاحظه می شود که انتخاب هر فرد کاملا مستقل از افراد دیگر نیست. یعنی به محض اینکه اولین نفر برگزیده شده لاجرم افراد دیگر خود به خود برگزیده می شوند. لذا شرط ضروری این شیوه این است که فهرست های مورد استفاده به صورتی تصادفی تهیه شده باشند. مثلا با توجه به حرف اول هر اسم.

پایگاه علمی سعید سان دانلود رایگان مقالات علمی کنفرانس و ژورنال

نمونه گیری تصادفی ساده

دیدگاهتان را بنویسید لغو پاسخ

نمونه گیری تصادفی ساده

مطالب پشنهادی برای شما:

دیدگاهتان را بنویسید لغو پاسخ