«آزمونهـاي روانـي»
مقدمـه :
يكي از هدفهاي عمدة هر علم ، اندازه گيري پديده هاي مورد نظر و دادن جنبة كمي به آنهاست. وقتي پديده اي را با اعداد و ارقام نشان مي دهيم براحتي مي توانيم آن را طبقه بندي و قوانين دربارة آنها وضع كنيم.
هر علم روان شناسي، مجموعه شيوه هايي كه به ما كمك مي كند تا ويژگيهاي رواني اسنان را از حالت كيفي به حالت كمي درآوريم.
اصطلاحاً «روش روان سنجي» ناميده مي شود. روان سنجي، در معناي وسيع كلمه، يعني استفاده از روش آزمايش. اما در معناي محدود كلمه يعني بهره گيري از آزمونهاي رواني براي اندازه گيري توانائيهاي ذهني.
تعريف آزمون رواني :
اگر استعداد را امكان انجام دادن يك عمل يا آشكار ساختن يك رفتار در نظر بگيريم. آزمون رواني به فن يا شيوه اي كه به طور علمي تهيه مي شود و امكان ارزشيابي عين استعدادهاي فردي را فراهم مي آورد تعريف مي كنيم.
استعمال روزافزون آزمون ها و ظهور انواع مختلف آزمايشهاي رواني باعث شده تا تعريف آزمونها از دقت و صراحت بيشتري نسبت به گذشته برخوردار شوند.
تعاريف مختلف آزمون عبارتند از:
پروفسور آندره زي (1970ـ پاريس) آزمون رواني را چنين تعريف مي كند: وسيله تمايز بين افراد براساس يك درجه بندي.
تعريف آناستازي (1970ـ لندن) از آزمون: اندازة استاندارد و عيني از چگونگي يك رفتار.
تعريف پيرپيشو (روان شناس معاصر فرانسوي) از آزمون: يك موقعيت استاندارد شده كه به عنوان انگيزه براي يك رفتاربه كار مي رود. اين رفتار، كمي يا كيفي، با ميانگين افراد ديگري كه در همان موقعيت قرار گرفته اند مقايسه مي شود. اين مقايسه اجازه مي دهد تا رفتار فرد به صورت كمي نمره گذاري شود يا از نظر تيپ شناسي طبق بندي گردد. به عبارت ديگر، رفتار فرد به صورت عددي يا توصيفي ارزشيابي شود.
تعريف پيرپيشو از آزمون، چهار مورد را ايجاب مي كند:
الف) موقعيت تجربي (محيط اجراي آزمون، مواد آزمون، نگرش آزماينده و …) بايد به طور كامل تعريف شود و همة موارد بطور يكسان تكرار گردد.
ب) ثبت رفتاري كه آزمودني در مقابل آزمون نشان مي دهد بايد صريح و عيني باشد. بر حسب موارد آزمون، بسيار متنوع خواهد بود.
ج) رفتار ثبت شده بايد، نسبت به رفتار گروهي از آزمودنيها مقايسه و ارزشيابي اماري قرار گيرد. اين مقايسه الزامي است و آزمايش كه مقايسه آماري نداشته باشد آزمون رواني به حساب نمي آيد.
د) طبق بندي آزمودني نسبت به گروه مرجع هدف نهايي يك آزمون مي باشد.
تعريف انجمن بين المللي پيسكوتكنيك1 از آزمون كه نسبت به تعاريف فوق كاملتر است. عبارت است از: يك آزمايش معين كه انجام فعاليتي را ايجاب مي كند، براي همة آزمودنيها يكسان است.
شيوة مشخص براي برآورد موفقيت يا شكست يا درجه بندي عددي موفقيت دارد. فعاليت
آزمودن ممكن است شامل معلومات اكتسابي (ازمونهاي معلومات)، كنشهاي حس ـ حركتي يا
رواني (آزمونهاي روان شناختي) باشد.
انواع آزمونهاي رواني :
شروع واقعي آزمونهاي رواني از سال 1896، با مقاله اي كه توسط آلفرد بينه و ويليام هانري در مجلة روان شناس منتشر كردند آغاز شد و در آن مقاله اكثر آزمونهاي موجود را كه به نظر آنها فقط اعمال بسيار ساده و پائين ذهن را اندازه مي گرفتند مورد انتقاد قرار دادند. آنها ، براي اندازه گيري استعدادهاي واقعي ذهن، آزمونهايي را پيشنهاد كردند كه به رفتار زندگي واقعي نزديكتر بود. آزمون يك روش نظامه اي براي سنجش نمونه اي از رفتار و يك وسيلة اندازه گيري در روان شناس و تعليم و تربيت است. اندازه گيريهاي رواني و تربيتي، علاوه بر آزمون كه معروفترين وسيلة اندازه گيري است، با روشهاي ديگري مثل مشاهده و مصاحبه و پرسشنامه و فهرست خصوصيات و مطالعات باليني و … نيز انجام مي گيرد. با توجه به تعداد بسيار زياد آزمونها و كثرت و پيچيدگي جنبه هاي مختلف رفتار آدمي، طبقه بندي انواع آزمونهاي رواني و تربيتي بسيار مشكل است و نمي توان رضايت همگان را جلب كرد. طبقه بندي هايي كه از آزمونها به عمل مي آيد، ديدگاههاي مختلفي را منعكس مي كند. البته هر نوع طبقه بندي اي كه به عمل آيد مطلق نخواهد بود بلكه تا اندازه اي نظر شخصي مؤلف را منعكس خواهد كرد. طبقه بندي آزمونها به خاطر تسهيل در كار انجام مي گيرد.
مي توان آزمونها را از ديدگاههاي مختلف طبقه بندي كرد:
1ـ طبقه بندي از نظر عملكرد .
2ـ طبقه بندي از نظر ماهيت محتوا .
3ـ طبقه بندي از نظر شيوة كاربرد .
4ـ طبقه بندي از نظر هدف عملي .
5ـ طبقه بندي از نظر فن تهيه .
كه ما در مورد هي يك توضيحي مختصر مي دهيم.
1ـ طبقه بندي از نظر عملكرد :
اين نوع از طبقه بندي جنبة بنيادي دارد و تقريباً در همة كتابهاي پيسكوتكنيك مورد قبول واقع شده است. مثلاً مي گويند كه فلان آزمون، هوش، استعداد، شخصيت، رغبت و … فرد را اندازه مي گيرد. با توجه به نظر فوق آزمونها، مي توان دو گروه آزمون تشخيص داد كه تا اندازه اي مستقل از يكديگرند:
الف) آزمونهاي كارآيي (بازده) .
ب) آزمونها شخصيت (كيفي) .
الف) آزمونهاي كارآيي يا بازده : اين آزمونها ايجاب مي كنند تا آزمودني بازدهي را از خود نشان دهد و يك واقعيت عيني را تحقق بخشد. اين آزمونها زمينة غيرقابل اعتراض روان سنجي را تشكيل مي دهند و نيز رضايتبخش ترين طبقه بندي كه براساس درجه كمي متغير مورد آزمايش انجام مي گيرد، مي باشد. در ميان آزمونهاي كارآيي، مي توان آزمونهاي هوش كلي و آزمونهاي استعداد را تشخيص داد.
آزمونهاي هوش كلي نيز به نوبة خود به دو گروه تقسيم مي شوند :
الف) آزمونهاي سني (رشد) .
ب) آزمونهاي هوش كمي (مطلق) .
الف) گروه اول آزمونهاي سني : هوش را به عنوان كنش در نظر مي گيرد كه به موازات پختگي متحول مي شود. گروه دوم آزمونهاي هوش كمي، سعي مي كند تا استعداد ذهني را مستقل از عامل رشد اندازه بگيرد و مخصوصاً اندازه گيري هوش بزرگسال را مورد توجه قرار مي دهد. واقعيت اين است كه بسيار از آزمونها به هر دو گروه تعلق دارند. تنها شيوة بيان نتايج فرق يم كند. بعضي از آزمونها نيز به طبقة آزمونهاي كارآيي تعلق دارند اما در كاربرد آنها جنبه هاي كيفي از اهميت بيشتري برخوردار است. مانند مقياسهاي تحليلي و آزمونهاي تفكر مفهومي.
مقياسهاي تحليل از سريهاي مختلف تشكيل مي شوند كه هر يك بطور جداگانه نمره گذاري مي شود و بعد جمع كل نمرات به دست مي آيد. بنابراين اين آزمونها نه تنها سطح روان بلكه ساخت آن را نيز مشخص مي كنند. آزمونهاي تفكر مفهومي سعي مي كنند بيشتر به روش باليني نزديكتر شوند و در اجراي آنها آزمايشگر سعي مي كند تا شيوة تشكيل مفاهيم را در نظر بگيرد نه نتايج تشكيل آنها را. با وجود اين آزمونهاي تحليلي بازده را نيز در نظر مي گيرند. به كمك آنها مي توان سطوح خاص و سطح كل را كه از مجموع سطوح خاص حاصل مي شود، به دست آورد. اين آزمونها اجازه مي دهند تا افراد از نظر بازده مطلق خود و از لحاظ ساخت ذهني خود مورد مقايسه قرار گيرند.
ب) آزمونهاي شخصيت يا كيفي : آزمونهاي شخصيت به تعيين منش، جنبه هاي كيفي و عناصر غيرشناختي (غيرقابل اندازه گيري) رفتار زمينة روان توصيفي1 تعلق دارند. مي توان آزمونهاي شخصيت را كه امروزه تعدادشان بسيار زياد است به طور كلي به دو گروه بزرگ تقسيم كرد:
آزمونهاي تحليلي (عيني) ، آزمونهاي فرافكن (تركيبي) .
در مورد آزمونهاي شخصيت، معمولاً آزمونهاي عيني در مقابل آزمونهاي فرافكن سخن به ميان مي آورند. در واقع آزمونهاي عيني و فرافكن، نه دو مقولة كاملاً مخالف، بلكه آزمونهاي عين شخصيت معمولاً شامل يك دسته سؤالات مكتوب هستند كه پاسخ آنها به صورت صحيح يا غلط، آري يا نه، موافق يا مخالف و يا جوابهايي از اين قبيل داده مي شود. نمره گذاري اين آزمونها كاملاً عيني است. زيرا پاسخهاي آزمون شونده فاقد ابهام است. پرسشنامة شخصيتي كاليفرنيا، پرسشنامة شخصيتي چند وجهي مينه سوتا و آزمون زمينه يابي خلق و خويي گيلفرود ـ زيهرمان در شمار آزمونهاي عيني شخصيت به حساب مي آيند.
در آزمونهاي فرافكن، آزمون شونده معمولاً بايد پاسخ خود را با استفاده از اطلاعات بسيار محدود ارائه نمايد و از آنجا كه در ارزيابي پاسخها به جاي شمردن سؤالاتي كه پاسخ معيني به آنها داده شده بايد به تعبير و تفسير پاسخها پرداخت، نمره گذاري اين آزمونها جنبة ذهني تري دارد. توسعة آزمونهاي فرافكن با اين فرض همراه بوده كه وقتي شخص در مقابل يك وضعيت مبهم قرار داده شود، به ايجاد پاسخهايي مي پردازد كه برگرفته از شخصيت بي همتاي خود اوست. آزمونهاي فرافكن شخصيت، از نظر اجرا، نمره گذاري، و تعبير و تفسير نتايج نيازمند افراد حرفه اي و كاملاً آموزش ديده هستند. آزمون لكه هاي جوهر رورشاخ، آزمون اندريافت موضوع از جمله آزمونهاي فرافكن هستند.
بسيار اتفاق مي افتد كه يك آزمون كارآيي در عين حال به عنوان يك آزمون شخصيت نيز به كار مي رود. نتيجة عددي، سطح بازدهي آزمون را بيان مي كند، رفتار هر جريان آزمايش و شيوة حل مسأله، شخصيت او را منعكس مي سازد. اما در آزمون كارآيي فقط بازده فرد مورد نظر است، در حالي كه در آزمون شخصيت، حتي اگر ايجاب كند كه نتايج به صورت كمي درآيند، شيوة بودن فرد مورد توجه است.
2ـ طبقه بندي از نظر ماهيت (محتوا ظاهري) :
مي توان دو نوع آزمون تشخيص داد: آزمونهاي كلامي و آزمونهاي غيركلامي (عملي) .
در آزمونهاي كلامي سعي مي شود توانايي آزمودني را در زبان گفتاري و نوشتاري اندازه بگيرد كه البته بيشتر درك كلام مطرح است نه طرز بيان آن. در آزمونهاي غير كلامي، توانائيهاي ملموس و واقعيتهاي عملي را به كار مي گيرند. اين تقسيم بندي به اين صورت توجيه مي شود كه دو نوع هوش يا دو نوع سازگاري وجود دارد: انتزاعي و ملموس، كلامي و عملي. به علاوه، در بعضي موارد به كار بردن آزمونهايي كه زبان گفتاري و زبان نوشتاري را اندازه بگيرند امكان پذير نيست. كودكان خردسال، نابهنجارها، كر و لالها، بيسوادها، افرادي كه زبان آزمايشگر را نمي دانند. زماني كه اندازه گيري تواتائيهاي لازم براي مشاغل فني مورد نظر است، آزمونها الزاماً بايد عملي باشند.
3ـ طبقه بندي از نظر شيوه كاربرد :
از لحاظ شيوة كاربرد نيز دو نوع آزمون وجود دارد: آزمونهاي فردي و آزمونهاي گروهي .
تا سال 1917 همة آزمونهاي روان شناختي كاربرد انفرادي داشت، فقط آزمونهاي تحصيلي بودند به صورت گروهي اجرا مي شدند. آزمونهاي ارتش، نقطه شروع آزمونهاي گروهي را تشكيل مي دهد. محاسن و معايت آزمونهاي گروهي و آزمونهاي فردي :
مهمترين امتياز اجراي آزمونهاي گروهي :
1ـ صرفه جويي در زمان: از آنجا كه آزمودنيها در يك ساعت معين تحت آزمايش قرار مي گيرند، همة دستورالعملهاي يكساين را دريافت مي كنند.
2ـ تضمين يكنواختي موقعيت آزمايش.
3ـ لزومي ندارد كه اجراكنندة اين آزمونها تخصص داشته باشد.
4ـ نمره گذاري در مجموع بسيار ساده، سريع و عيني انجام مي گيرد: در بسياري از موارد سعي مي شود، پاسخها را با ماشين تصحيح كنند.
5ـ تهيه فرمهاي موازي آزمونهاي گروهي به پيچيدگي تهيه فرمهاي موازي آزمونهاي فردي نيست.
6ـ مقرون به صرفه بودن از نظر هزينه: زيرا فقط يك نوع مواد لازم دارند كه معمولاً به صورت /// در اختيار داوطلبان قرار مي گيرد، گاهي يك مواد و يك كاغذ كفايت مي كند.
با اين وجود آزمونهاي گروهي معايبي نيز دارند. در مورد كودكان خردسال قابل اجرا نيستند. چون اين كودكان غالباً در خانواده زندگي مي كنند، جمع آوري آنها دشواراست. به همين دليل كاربرد آزمونهاي گروهي را محدود مي سازد. اين آزمونها را در مورد عقب مانده هايي كه نمي توانند با گروه پيش بروند، نمي توان به كار برد. در اجراي اين آزمونها نمي توان رفتار آزمودني را در جريان آزمايش يادداشت كرد. خطر رونويسي از ورقة پهلودستي و مسابقة تمرين، در آزمونهاي گروهي بيستر در آزمونهاي فردي است. خطر افشا و انتشار آزمونهاي فردي بسيار كم است. تصحيح آزمونهاي گروهي به دليل غيابي بودن در صورت ابهام در پاسخها مشكل است و نمي توان آنها را روشن كرد.
هر موقع به يك بررسي عميق نياز باشد بايد حتماً از آزمونهاي فردي كمك گرفت. از آزمونهاي فردي در مورد برخي از گروههاي جمعيت مانند كودكان خردسال، افراد معلول ذهني، بيماران رواني و … استفاده مي شود. بعضي از آزمونهاي فردي عبارتند از: مقياس هوش استنفورد بينه، مقياسهاي هوش و كسلر، و مقياسهاي بيلي از رشد اطفال و پرسشنامه شخصيتي كاليفرنيا، شخصيت سنج جند وجهي مينه سوتا (MMPT)، آزمون استعداد تحصيلي SAT ، نمونه هايي از آزمونهاي گروهي است.
4ـ طبقه بندي از نظر هدف عملي:
مي توان آزمونها را به دو گروه آزمونهاي تشخيص و آزمونهاي پيش بيني تقسيم كرد. هدف گروه اول اين است كه حالت فعلي آزمايش شونده را تعيين كند تا اقداماتي در مورد او به عمل آيد. هدف گروه دوم اين است كه پيش بيني كم و پيش دراز مدتي را در مورد افراد به عمل آورد. مثلاً آزمونهاي راهنمايي شغلي. اين تقسيم بندي براساس ماهيت مواد آزمونها انجام نمي گيرد. بلكه براساس كاربرد آنها انجام مي گيرد. هر آزموني الزماماً يك آزمون تشخيص است، اما اين تشخيص، در بعضي موارد، ارزش يك پيش بيني را دارد.
5ـ طبقه بندي از نظر فن تهيه:
از اين نظر نيز آزمونها دو گروه متمايز هستند: استفاده از روش هاي غيرتجربي براي تعيين روايي و تحليل عاملي براي تعيين روايي.
گروه اول را معمولاً در مقابل گروه دوم قرار مي دهند. روايي گروه اول رويهمرفته به معيارهاي ذهني استوار است. در حالي كه روايي گروه دوم بر تحليل /// تكيه مي كند. در مودر اين قسمت در بخش ويژگيهاي آزمونها بخش روايي توضيح كاملتري خواهيم داد.
ويژگي هاي آزمون: تهيه علمي آزمون بايد به صورتي باشد كه داراي ويژگيهاي خارجي و داخلي باشد تا نتايج قابل اطمينان و قابل مقايسه اي را فراهم آورد. مؤلفان شرايط يا ويژگيهاي بسيار زيادي را براي يك آزمون قايلند مانند كلاپارد، كه بيست ويژگي را نام مي برد.
ويژگيهاي آزمون به دو دسته ويژگيهاي اصل و ويژگيهاي فرعي تقسيم مي شود:
ويژگيهاي اصلي يك آزمون عبارتند از:
روايي، درجه بندي، اعتبار يا ثبات. استاندارد بودن اين چهار ويژگي مستقل از يكديگر نيستند، بلكه متقابلاً بر يكديگر اثر مي گذارند.
روايي: در لغت نامه دهخدا، روا يعني اين كه آزمون بايد حاجت آزمايشگر را برآورده كند. يك آزمون هوشي زماني روايي خواهد داشت كه اطلاعات صحيحي از آنچه معمولاً هوش ناميده مي شود در اختيار ما بگذارد نه از حافظه و يا از توانائيهاي ديگري كه رابطة بسيار كمي باهوش دارد.
سنجش روايي :
چگونه بايد روايي يك آزمونر را تعيين كرد؟ بنا به گفتة كلاپارد، چگونه بايد تستها را تست كرد؟
براي سنجش روايي آزمون راهنماي مختلفي وجود دارد. در غالب اين موارد همبستگي نمره هاي آزمون با معيار مورد نظر محاسبه مي شود كه اين موارد عبارتند از:
1ـ معني دار بودن آماري: اولين شرط روايي و مفيد بودن يك آزمون هنجاري است. معني دار بودن آماري اين مفهوم را دارد كه رابطة بين نمره هاي آزمون با معيار مورد نظر ناشي از تصادف نباشد. در كاربدر روشهاي آماري، معني دار بودن را معمولاً با احتمال خطاي 5% يا كمتر معلوم مي كنند. به اين ترتيب، اگر يك آزمون همبستگي معني داري با يك معيار نداشته باشد نمي توان گفت كه آن آزمون براي سنجش صفت مورد نظر روايي دارد.
2ـ محاسبة خطاي معيار برآورد: شاخص ميزان اشتباه در پيش بيني يك متغير مستقل (يا متغير ملاك) از يك متغير تابع (يا آزمون) است. فرمول محاسبة اين شاخص عبارت است از: ////
در اين فرمول: /// انحراف معيار متغير ملاك، /// مجذور همبستگي ميان متغير پيش بين (n) و متغير ملاك (y) است.
3ـ استفاده از جدولهاي انتظار: نمره هاي آزمون يكي از ابعاد جدول است و احتمال نسبت موفقيت در كسب هر نمرة آزمون در بدنة جدول ارائه مي شود. نسبت افرادي كه در يك آزمون در مقايسه با معيار معين به موفقيت مي رسند در جدول انتظار نشان داده مي شود. مثلاً از روي نمرات كنكور دانش آموزان مي توان سطح موفقيت دانشجويان در رشته هاي مختلف را پيش بيني كرد. يعني هرچه نمرة آنها در آزمون سراسري بالاتر باشد، احتمال موفقيت آنها در امتحانات دانشگاهي نيز بيشتر است. مهمترين مزيت جدولهاي انتظار براي تعيين روايي آزمون اين است كه فهم آن براي همگان آسان است. اين جدولها در مشاورة دانشجوي و تعيين ميزان موفقيت آنها در رشته هاي مختلف تحصيلي نيز مفيد است.
4ـ روش استفاده از نرخهاي پايه: نرخ پايه را در يك خصوصيت معين را به عنوان نسبت افرادي از جمعيت كه داراي آن خصوصيت هستند تعريف مي كنيم. اين نرخها با استفاده از سوابق تجربه شدة موضوع و محاسبة تعداد دفعاتي كه يك واقعة معين در زماني خاص روي مي دهد محاسبه مي شود. مثلاً براي تعيين نرخ پايه در موفقيت در آزمون سراسري دانشگاهها براي تحصيلات فوق ليسانس در رشته اي خاص، نسبت افراد شركت كننده به افراد پذيرفته شده در يك دوره زماني معين را محاسبه مي كنيم. در صورتي كه نرخ پايه در يك آزمون خيلي كم يا خيلي زياد باشد، نمي توان به روايي آن اعتماد كرد و مي گوئيم كه آن آزمون قدرت تشخيص كافي ندارد.
5ـ نسبتهاي انتخاب: يعني نسبت افرادي است كه از يك گروه موجود برگزيده مي شوند. مثلاً پذيرش دانشجو براي دورة كارداني ادبيات فارسي دانشگاه آزاد نسبت به تعداد داوطلبان بسيار زياد است. در چنين مواردي موقعي يك آزمون را داراي روايي بالا و مربوط به ملاك مورد نظر مي دانيم كه نرخ انتخاب پائين باشد و به اين ترتيب افرادي را كه نمره هاي خيلي بالايي دارند انتخاب مي كنيم.
6ـ استفاده از تئوريهاي تصميم: در اين روش از تحليلهاي آماري براي تصميم گيري در شرايط معين استفاده مي شود كه سعي مي شود از استراتژيهايي استفاده كنند كه بهترين تصميم گيري دربارة افراد به عمل آيد. مثلاً براي انتخاب افراد براي يك شغل يا براي آموزشهاي معين از اين روش استفاده مي شود. سؤال اصلي در تئوري تصميم اين است كه حداقل نمرة قابل قبول براي يك آزمون بايد چقدر باشد. در اين موارد تصميم گيرنده بايد عوامل گوناگوني را مورد نظر قرار دهد تا انتخاب افراد مناسب به بهترين صورت ممكن انجام گيرد و از اين طريق روايي لازم فراهم آيد.
انواع روايي:
1ـ روايي ظاهري: يعني اين كه مواد يا سؤالات آزمون از نظر ظاهر شبيه موضوعي باشد كه مورد اندازه گيري است.
2ـ روايي محتوا: يعني اين كه آزمون بايد ارتباط كامل با كل زمينة مورد نظر داشته باشد. روايي محتوا بيشتر در آزمونهاي پيشرفت تحصيلي مورد نظر است.
3ـ روايي پيش بيني: يعني اين كه بين نتايج حاصله از اجراي آزمونها و نتايجي كه بعداً به دست مي آيد همبستگي و قرابت وجود داشته باشد. اصولاً كاربرد روزافزون آزمونها به خاطر روايي پيش بيني آنهاست.
4ـ روايي همزمان: نتايج آزمونها را با نتايجي كه همزمان با اجراي آنها پايه فاصلة كمي بعد از اجراي آنها به دست مي آيد مقايسه مي كنند. مثلاً اگر ازموني بسازيم و در همان زمان بخواهيم روايي آن را تعيين كنيم مي توانيم نتايج آن را با نتايج آزمون ديگري كه در همان زمينه وجود دارد و دربارة همان گروه اجرا مي شود مقايسه كنيم.
5ـ روايي سازه (روايي مفهومي): عبارت است از تطابق نتايج يك آزمون با پيش بيني هايي كه توسط يك نظريه يا ساير واقعيات شناخته شده به عمل آمده است. مثلاً نظريه هاي زيادي در مورد هوش وجود دارد. از جمله اين كه هوش موجب سازگاري با موقعيت تازه مي شود. بنابراين، اگر نتايج حاصله از اجراي يك آزمون بر روي يك گروه، با نتايج حاصله از قدرت سازگاري همان گروه، كه براساس معيارهاي مورد قبول فراهم آمده است، همبستگي نشان دهد، خواهيم گفت كه آزمون مذكور داراي روايي سازه يا رويايي مفهومي است.
درجه بندي:
درجه بندي يك آزمون يعني تعيين درجات موفقيت و واحدهاي رفتار به منظور مقايسة عيني نتايج افراد مختلف. اين واحدها و اين هنجارها، كه امكان مقايسة افراد را فراهم مي آورد، برحسب ماهيت متغير مورد ارزشيابي، متفاوت است.
چگونه آزمونها را درجه بندي مي كنند؟ آزمونها را درباره گروههايي كه از تعداد زيادي آزمودني تشكيل شده اند اجرا يم كنند. تعداد آزمودنيها حتماً بايد زياد باشد تا خطاهاي تصادفي جبران شود و اين شرط از ضروريات وضع قوانين آماري است. بايد اين گروهها معرفِ مجموعة كساني باشند كه آزمون بعداً دربارة آنها اجرا خواهد شد. به عبارت ديگر، لازم است كه نمونة اوليه روايي داشته باشد. ترمن نيز آزمونهاي مقياس خود را در مورد هزاران كودكي كه به همة طبقات اجتماعي و به اكثر ايالات كشورش تعلق داشتند، بدون انتخاب قبلي، اجرا كرد و با اين طريق سؤالاتي را كه رويهمرفته توسط يك گروه سني پاسخ داده شده بود تعيين نمود. در واقع سؤالي را براي يك گروه سني مناسب مي دانند كه 75% آن گروه پاسخ صحيح بدهند. اگر سؤالي توسط همة افراد يك گروه سني پاسخ داده شود، بسيار آسان خواهد بود و قدرت تمايز نخواهد داشت. در اين صورت گروههاي كودكان همان سن، نسبت به متغير، متجانس نخواهند بود. گروههاي سني معمولاً افرادي را شامل مي شوند كه تاريخ تولد آنها بين 12 ماه توزيع مي گردد. به اين ترتيب، گروه سني 8 ساله ها كودكاني را شامل خواهد شد كه بين 7 سال و 6 ماه و 8 سال و 6 ماه سن دارند.
چون محيط اجتماعي هميشه در مورد اكثر تواناييهايي كه توسط آزمونها اندازه گيري مي شود تا
اندازه اي اثر مي گذارد، يا لااقل شيوة تجلي آنها از لابلاي رفتار را تحت تأثير قرار مي دهد، لازم است كه درجه بندي آزمونها براي محيطهاي تقريباً محدود صورت بگيرد.
بنابراين، آزمون مورد نظر هرچه باشد، نتيجة خام آن معنايي نخواهد داشت، زيرا به صورت نسبي نيست. براي اين كه نتيجة خام معناي روشني داشته باشد بايد با هنجارها (نورمها) مقايسه شود. فقط در اين صورت مي توان از بالاتر يا پايين تر، از بهنجار يا نابهنجار صحبت كرد.
بعضي مؤلفان از ظرافت، حساسيت و قدرت تشخيص آزمونها حرف مي زنند. همة اين خصايص به درجه بندي آزمونها بستگي دارد. هر اندازه يك آزمون امكان اندازه گيري تفاوتهاي بسيار كوچك را بيشتر فراهم آورد به همان اندازه بيشتر حساسيت خواهد داشت. هر اندازه گستردگي مقياس بزرگتر باشد، به همان اندازه حساسيت كمتر خواهد بود. در بسياري از موارد، آزمونهاي هوشي بزرگسالان فاقد حساسيت لازم است. اين آزمونها نمراتي را فراهم مي آورد كه فاصلة زيادي از يكديگر دارند و تغييرات ضعيف را نشان نمي دهند. زماني كه اندازه گيري كنشهاي سطوح پايين مورد نظر است، مثلاً اندازه گيري زمان واكنش، سرعت حركات و آستانه هاي حسي، تهية ابزار حساس چندان مشكل نيست. بعضي روان شناسان آن قدر پيش مي روند كه سرعت اَعمال را تا يك صدم ثانيه اندازه مي گيرند، چيزي كه در عمل ضروري به نظر نمي رسد. بتدريج كه در مقياس كنشهاي رواني بالاتر مي رويم، دشواري تهية وسايل دقيق و حساس افزايش مي يابد. زيرا، هر چند تفاوتهاي افراد در اعمال عالي ذهن بسيار آشكار است، اين تفاوتها بطور نامحسوس از كميت محض به كميت آميخته با كيفيت تبديل مي شود.
5ـ اعتبار (ثبات ـ ///) :
منظور از اعتبار عبارت است از اعتمادي كه مي تواني به نتايج يك ازمون (يا مجموعة آزمونها)، كه از كاربردهاي متوالي آن حاصل مي شود، داشته باشيم. بنابراين در اين جا انسجام داخلي آزمون مورد نظر است. نتايج يك آزمون مي تواند تا اندازه اي تحت تأثير تغييرات محيط و تمايل لحظه اي آزمودني قرار گيرد.
براي محاسبة درجه بندي اعتبار و ثبات چهار روش پيشنهاد شده است:
الف) اجراي مجدد يك آزمون: اگر آزموني را با فاصلة زماني كم و بيش طولاني در مورد گروهي از آزمودنيها دوبار اجرا كنيم، نتايج ناپايدار و متغيري به دست آوريم، ديگر نمي توانيم به آن اعتماد داشته باشيم. زيرا درجة موفقيت در آن تحت تأثير عواملي قرار مي گيرد كه براي ما پوشيده بوده يا كنترل آنها براي ما دشوار است. بدون ترديد نمي توان اميد داشت كه نتايج دو نوبت هميشه يكسان باشد، مخصوصاً اگر فاصلة زماني بين آنها تا اندازه اي طولاني گردد؛ اما تغيير نتايج هم نبايد از حدود معيني تجاوز كند. اگر آزموني را دوبار و به فاصلة كمي در مورد يك فرد اجرا كنند معمولاً ضريب همبستگي 70% را قابل قبول مي دانند، اما اگر همين آزمون روي گروههاي افراد اجرا شود ضريب همبستگي 90% مورد قبول خواهد بود.
ب) اجراي فرمهاي موازي: دو فرم را وقتي موازي مي گويند كه در تعيين روايي و در درجه بندي آنها روش يكساني به كار رود. بنابراين، دو فرم موازي يك آزمون ارزش تشخيصي يكساني دارد و فقط از نظر محتواي ظاهري از يكديگر متفاوت است. مثلاً مقياس اصلي ترمن از دو فرم تشكيل شده بود: فرمهاي M و L . آزمونهاي نابسته به فرهنگ كتل نيز داراي دو فرم است: A و B . كاربرد دو فرم موازي يك آزمون براي اين است كه از تغييرات ناشي از يادآوري و تمرين قبلي جلوگيري شود. اگر آزمونها به كنشهاي سطوح پايين (قدرت ماهيچه اي، زمان واكنش، دقت حركات) تعلق داشته باشد، آثار يادآوري و تمرين يا وجود نخواهد داشت يا كم خواهد بود. به هر حال، تمرين، برحسب افراد مختلف، آثار متفاوتي به همراه دارد. افراد متوسط بهرة بيشتري از آن كسب مي كنند. آزموني كه اعتبار كمي دارد شبيه ساعتي است كه برحسب موقعيت جلو مي رود
يا عقب مي ماند، بدين معني كه مكانيسم آن به عوامل حرارت، درجة رطوبت هوا، طرز قرار گرفتن در دست، … بستگي پيدا مي كند.
به فاصلة چند ماه اجرا، ضرايب همبستگي مجموعه آزمونهاي مختلف بين 54% تا 84% ، آزمونهاي مهارت حركتي فقط 40% و آزمونهاي هوش بين 70% تا 93% به دست آمده است. لازم به يادآوري است كه ارزش ضرايب اعتبار، به نسبت افزايش فاصله بين دو اجرا، كاهش مي يابد. در مجموع مي توان گفت كه ضرايب 80% الي 90% اعتبار رضايت بخشي را براي آزمونها تضمين مي كند.
ج) روش فرد ـ زوج: گاهي از يك آزمون دو فرم موازي در دست است اما امكان اجراي آن در دو نوبت وجود ندارد، گاهي هم از يك آزمون دو فرم موازي موجود نيست. در اين گونه موارد، براي تعيين اعتبار يك آزمون، از روش فرد ـ زوج استفاده مي كنند. بدين ترتيب كه وقتي آزمون بطور طبيعي اجرا شد و هر سؤال نمره گذاري گرديد، به جاي محاسبة نمرة كل، آزمونر را به دو قسمت تقسيم مي كنند و نمرة هر قسمت را جداگانه به دست مي آورند. معمولاً سؤالات را به دو گروه فرد و زوج تقسيم مي كنند تا آثار تمرين، خستگي و دشواري در هر دو قسمت بطور يكسان توزيع شود. اين روش را در مورد همة آزمايش شوندگان به كار مي برند و بين دو سري نتيجه ضريب همبستگي به دست مي آورند. ضريب به دست آمده اعتبار نصف تست خواهد بود. براي محاسبة اعتبار تمام تست از فرمول اسپيرمن ـ براون، كه به صورت زير نوشته مي شود، استفاده مي كنند:
فرمول تايپ شود.
در اين فرمول، 11r = ضريب اعتبار تمام تست، r = ضريب همبستگي بين دو نيمة تست.
مثال: اگر ضريب همبستگي بين دو نيمة آزمون برابر 60% باشد ضريب اعتبار كل آزمون چنين به دست خواهد آمد:
فرمول تايپ شود.
هرگز نبايد نيمة اول يك آزمون را با نيمة دوم آن مقايسه كنيم، مخصوصاً اگر زمان اجراي آزمون محدود باشد. دو نيمة اول و دوم يك آزمون در موقعيت كاملاً متفاوت اجرا مي شود، زيرا، از يك طرف، همة سؤالات نيمة دوم توسط همة آزمودنيها پاسخ داده نمي شود، از طرف ديگر، نيمة دوم از اثرات تمرين بهره مند مي گردد. براي اين كه بتوان تستي را، با استفاده از روش فرد ـ زوج، دو قسمت كرد، تعداد سؤالات آن نبايد زياد محدود باشد.
د) ضريب انسجام: در اين روش، مثل روش فرد ـ زوج، ازمون فقط يك بار اجرا مي شود و ميزان همبستگي دروني يا تجانس سؤالات مورد بررسي قرار مي گيرد. در اين جا ضريب به دست آمده بين 0 و 1 متغير خواهد بود و هر اندازه به 1 نزديكتر باشد به همان اندازه تعادل سؤالات آزمون بيشتر خواهد بود. براي محاسبة تجانس دروني آزمون، از فرمول 21 كودروريچاردسون (K1R21)36 استفاده مي كنند. فرمول مذكور به صورت فرمول/// نوشته مي شود كه در آن n = تعداد سؤالات، X = ميانگين نمرات و2 S = واريانس نمرات. مثال: اگر ميانگين نمرات يك آزمون 40 سؤالي برابر 25 و واريانس آنها 16 باشد ضريب انسجام آزمون به صورت زير محاسبه خواهد شد:
فرمول تايپ شود.
6ـ استاندارد بودن :
به دنبال انجام يك آزمون، براي اين كه مقايسة افراد با يكديگر مشروع باشد، بايد در اجرا و نمره گذاري سؤالات روش يكساني به كار رود. نمي توان نتايجي را كه در موقعيتهاي مختلف به وجود آمده است با يكديگر مقايسه كرد. اين امر يكي از قواعد اصلي روشهاي تجربي است. در مورد آزمونها، غير از تنوع استعداد مورد نظر، همة موقعيتها بايد مساوي باشد. با وجود اين، يادآور مي شويم كه در زمينة روان شناسي، ايجاد موقعيتي كه بطور مطلق يكنواخت باشد غيرممكن است. عوامل بسيار متعدد و غيرقابل كنترلي بر آزمودني تأثير مي گذارد.
به منظور تضمين يكنواختي شرايط اجرا، آزمونها هميشه دستورالعملهايي به همراه دارد. اين دستورالعملها بايد دقيقاً رعايت شود، زيرا در تنظيم نورمها مورد استفاده قرار گرفته است. كوچكترين تغييري كه آگاهانه يا ناآگاهانه در دستورالعمل آزمونها داده شود الزاماً بر رفتار آزمودني اثر خواهد گذاشت و اين اثر گاهي قابل اغماض و در بسياري از موارد آشكارا محسوس و مخلّ خواهد بود.
عناصر مورد نظر در استاندارد بودن يك آزمون:
1ـ زمان اجراي تست كه مي تواند محدود يا نامحدود باشد. در روشي كه محدوديت زماني دارد، مدت انجام آزمايش قبلاً تعيين مي شود (مثلاً يك فرد چند علامت را مي تواند در دو دقيقه خط بزند يا چند مسأله را مي تواند در يك ربع ساعت حل كند) ؛ در روشي كه محدوديت كاري دارد، آزمودني بايد كار محول شده را به اتمام برساند و به محض اتمام آن آزماينده زمان صرف شده را يادداشت مي كند.
2ـ نظم ارائه سؤالات نيز هميشه بي اثر نيست و در مورد بعضي آزمونها اين نظم از قبل تعيين شده است.
3ـ شكل سؤالات .
4ـ نگرش آزماينده .
5ـ محل اجرا و مواد مورد استفاده نيز جزء عناصر اصلي به حساب مي آيد. مسلماً عناصر ديگري نيز وجود دارد كه در دستورالعمل صراحتاً به آنها اشاره مي شود. نبايد چيزي از دستورالعمل را تغيير دهيم، حتي اگر علت بعضي قواعد خاص را ندانيم و بعضي سؤالات به نظرمان مبهم يا غلط برسد؛ در غير اين صورت ممكن است بعضي كارها را خيلي آسان يا خيلي دشوار سازيم. گاهي اتفاق مي افتد كه اجراكنندگان آزمونها، دشواريهايي را در رعايت مواد دستورالعمل احساس مي كنند. در واقع بسياري از انتقادهاي ناروا عليه آزمونها در اثر نتايج گمراه كننده يا نامناسبي است كه به علت عدم توجه به استاندارد بودن آزمونها يا اجراي آنهايي كه متناسب با موارد اجرا نبوده به وجود آمده است. كوششهايي كه براي يكنواختي روش اجراي آزمونها به عمل آمده، بعضي مؤلفان را وادار كرده است تا از ضبط صوت استفاده كنند.
قطعاً آزمونها ماشينهاي معجزه گر نيست و اين چيزي است كه بايد با صراحت خاطر نشان شود. هميشه تغييراتي از يك آزمايش به آزمايش ديگر وجود خواهد داشت. قبول اين كه در دو نوبت متوالي بتوان موقعيت كاملاً يكساني ايجاد كرد، خيالي بيش نيست و به همين دليل است كه حتي بهترين آزمونها هرگز اعتبار مطلق ندارد.
نمره گذاري پاسخها نيز بايد با قواعد يكنواختي انجام گيرد. براي تفسير و طبقه بندي پاسخهاي آزمودني فقط يك راه وجود دارد، راهي كه توسط سازندگان آزمون پيش بيني و تثبيت شده است. نمره گذاري آزمونها گاهي به كمك ماشين انجام مي گيرد و اين امر موجب صرفه جويي در وقت مي شود. با وجود اين، استفاده از ماشين براي نمره گذاري همة انواع آزمونها امكان پذير نيست.
قاعده اي كه براي اجراي همة آزمونها لازم است خَلقِ جَوّ مناسب، بطوري كه آزمودني با خيال راحت كار محوله را انجام دهد. ايجاد حالت اعتماد از ضروريات است و هر نوع مزاحمت يا عامل بازدارنده را از بين مي برد. خطر عدم اعتماد مخصوصاً زماني بيشتر خواهد بود كه آزمودنيها كودك يا افراد هيجاني باشند. شخصيت آزمايشگر مهمترين عاملي است كه مي تواند حصول يك فضاي اطمينان بخش را تضمين كند. تخصص داشتن و آزمون را طبق دستورالعمل اجرا كردن به تنهايي كافي نيست، بلكه بايد طرز برخورد با آزمودني را ياد گرفت، نگرشها و سخنان لازم براي خلق يك جو مناسب، جهت انجام كار مورد نظر، را پيدا كرد.
تذكر: افزايش تعداد ويژگيهاي يك آزمون خوب تا اندازه اي بيهوده است، زيرا موجب سردرگمي خواهد شد. بعضي ويژگيها استقلال واقعي ندارد و اين مامر در مورد چهار خصيصه اي هم كه شرح داديم صادق است. مثلاً اصطلاح انگليسي استاندارد،يك معناي پيچيده و كلي دارد. اين اصطلاح حتي جوهر آزمون را تبيين مي كند، آزموني كه خود از ويژگيهايي كه بطور علمي تهيه شده است، ناشي مي شود.
7ـ ويژگيهاي فرعي يك آزمون :
ويژگيهايي وجود دارد كه به ماهيت آزمون، به عنوان يك وسيلة اندازه گيري، مربوط نمي شود، اما هر وقت احساس شود كه به وجود آنها نيازي هست رعايت خواهد شد. در سطور زير به تعدادي از اين ويژگيها اشاره مي كنيم:
الف) اقتصاد: آزمونهاي مداد ـ كاغذي در موقعيتهاي عادي يا لااقل در زمينه هاي تحصيلي بيشترين امتياز را دارد. در راهنمايي شغلي، مسألة اقتصاد به صورت ديگري تجلي مي كند. استعمال روزافزون آزمونها در زمينه هاي تحصيلي آزمايشگران را وادار كرده است تا از روشهاي كم خرج بهره بگيرند: استفاده از تخته سياه، استفاده از پاسخنامه براي نوشتن پاسخ سؤالات، خلق تدابير ماهرانه، كه اجازه مي دهد تا يك آزمون گروهي چند بار به كار رود.
ب) سرعت اجرا: امروز بيش از هميشه وقت طلاست. در بسياري از موارد بايد بتوان تستي را، بدون آن كه صحت و دقت آن لطمه خورده باشد، بطور سريع اجرا كرد. بعضي آزمونها براساس اين الزام تهيه شده است. تعداد زيادي از آزمونها نيز با دو فرم ارائه مي شود: كامل و كوتاه، كه برحسب فرصتي كه آزماينده دارد، يكي از اين دو انتخاب مي شود. آزمونهاي گروهي، از نظر صرفه جويي در زمان، بهترين نمونه است.
ج) سادگي اجرا: بعضي آزمونها واقعاً خوب تهيه شده است. اما اجراي آنها اطلاعات روان شناختي و فني خاصي را ايجاب مي كند. در عوض آزمونهاي ديگري وجود دارد كه براي اجراي آنها تخصص لازم نيست. در واقع نوع اخير آزمونها موارد استعمال زيادي در زمينة تحصيلي دارد.
د) رغبت: تست بايد رغبت لازم را در آزمودني ايجاد كند و در حقيقت، رغبت جزء ويژگيهاي ذاتي آزمونهاست. زيرا هر آزموني مقداري از رغبت آزمودني را بسيج مي كند.
تجربه نشان داده است، آزمونهايي كه براي اندازه گيري هوش كودكان تهيه شده است، براي بزرگسالان مناسب نيست. ماهيت مسائلي كه بايد حل شود و اعمالي كه بايد انجام گيرد فاقد رغبت واقعي بوده، در نتيجه توانائيهاي حقيقي آزمودني به دست نخواهد آمد.
براي اجراي هر آزموني لازم است كه در آزمودني يك رغبت فعال به وجود آيد. بهترين نمونة آنها مقياس /// است. محتواي اين تست يا ذهنيت انسان بالغ سازگاري دارد. هوش بزرگسالان را با آزمونهايي كه براي كودكان اختصاص دارد، اندازه نمي گيرد.
تهية آزمونها :
شرايط تهية آزمونها، برحسب ماهيت آنها، تغيير مي كند. ارائه قواعد دقيق بسيار دشوار و احتمالاً غيرممكن خواهد بود. بنابراين، به بيان چند قاعدة كلي اكتفا مي كنيم.
الف) انتخاب سؤالات: اين قسمت مهمترين و دشوارترين بخش تهية آزمونهاست. بنابراين، لازم است كه سازندة آزمونها اطلاعات دقيقي از يافته هاي تحليل عاملي و از اصول كلي آزمون سازي داشته باشد. در اين قسمت بهتر خواهد بود كه با ساير روان شناسان دربارة تك تك مواد بحث شود.
بعضي سؤالات يا بعضي آزمايشها روايي ندارند. لذا تست سازان عادت كرده اند كه از همان ابتدا تعداد سؤالات را بيشتر از تعداد مورد لزوم پيش بيني كنند و در پايان آنهايي را نگهدارند كه روايي بيشتري دارند. اما اين روش معايبي دارد زيرا احتمال نامتجانس بودن سوالات را افزايش مي دهد و كنترل اين امر بسيار دشوار است. از طرف ديگر، نتايج اجراي مقدماتي سؤالات، تحت تأثير زيادي تعداد آنها قرار مي گيرد و به شرايطي بستگي پيدا مي كند كه در اجراي قطعي و نهايي آزمون وجود نخواهند داشت.
روش ديگري كه براي تهية تعداد سؤالات مورد لزوم وجود دارد اين است كه آنها را به تعداد محدود و در سريهاي مختلف تهيه كنند. توصيه شده است كه براي هر سري لااقل 20 سؤال مقدماتي تهيه شود. اجراي سؤالات در گروههاي 20 تايي اجازه مي دهد تا تعداد زيادي از عواملي كه نتايج را به طور تصادفي تحت تأثير قرار مي دهند كاسته شود. همچنين محدود بودن تعداد سؤالات به تهيه كنندگان آنها امكان مي دهد تا در جهت متجانس بودن سؤالات، مخصوصاً گروه 20 تايي اول، تلاش بيشتري به كار ببرند. مقايسة گروههاي 20 تايي بعدي با گروه 20 تايي اول تجانس آنها را نشان خواهد داد. لازم به يادآوري است كه اين روش به تعدادي سؤال تكميلي نيز نياز دارد، مثلاً به 20% تعداد كل سؤالات، زيرا تعيين روايي سؤالات از طريق محاسبات آماري، هميشه تعدادي از آنها را كنار خواهد گذاشت.
ب) بررسيهاي آماري مقدماتي: پس از آن كه سؤالات انتخاب شد بايد آنها را روي يك گروه حتي الامكان معرف اجرا كرد و نتايج به دست آمده را به كمك محاسبات آماري مورد بررسي قرار داد.
قبل از هر چيز بايد موارد زير را دربارة تك تك سؤالات مشخص كرد:
1ـ سطح دشواري ، 2ـ قدرت تشخيص ، و در صورت استفاده از روش چند انتخابي، ارزش هر يك از پاسخهاي پيشنهادي غلط.
1ـ سطح دشواري: اصولاً هدف از اجراي آزمونها اين است كه تفاوتهاي فردي آزمودنيها مشخص شود. بنابراين هر يك از سؤالات آزمون بايد قدرت تشخيص داشته باشد. از ميان عواملي كه قدرت تشخيص سؤال را تحت تأثير قرار مي دهند مي توان سطح دشواري سؤال را نام برد. سؤال بسيار آساني كه همة آزمايش شوندگان به آن پاسخ مي دهند يا سؤال بسيار دشواري كه هيچ آزمايش شونده اي نمي تواند پاسخ آن را پيدا كند، فاقد قدرت تشخيص است. سطح دشواري يك سؤال، كه گاهي تحت عناوين درجة دشواري يا شاخص دشواري نيز از آن نام برده مي شود، عبارت است از درصد كساني كه توانسته اند پاسخ صحيح آن را پيدا كنند. هر اندازه اين درصد بالاتر باشد سؤال به همان اندازه آسانتر خواهد بود و برعكس.
ساده ترين و رضايت بخش ترين روش آماري براي تعيين سطح دشواري، قدرت تشخيص و حتي قضاوت دربارة ارزش هر يك از پاسخهاي پيشنهادي به شرح زير است. اوراق آزمودنيها را، براساس نمرة كامل هر ورقه، از بالا به پايين مي چينند. 27% آنها را از بالا به عنوان گروه قوي و 27% آنها را از پايين به عنوان گروه ضعيف برمي دارند (البته اين درصدها ممكن است، به تناسب تعداد آزمودنيها، متغير باشد). براي هر سؤال جدولي نظير جدول زير تنظيم مي كنند:
سؤال 1
جدول تحليل سؤال
پاسخهاي پيشنهادي | الف | ب | ج | د | |
گروه قوي (27% از بالا) | 71 | 9 | 20 | 0 | 100 |
گروه ضعيف (27% از پايين) | 15 | 50 | 35 | 0 | 100 |
در سؤال فرضي فوق، اگر پاسخ پيشنهادي «الف» صحيح باشد، سطح دشواري به ترتيب زير محاسبه خواهد شد:
100 × (پاسخهاي صحيح گروه ضعيف + پاسخهاي صحيح گروه قوي)
= = سطح دشواري
جمع كل افراد دو گروه
100 × 86 100 × (15 + 71)
43 = =
200 200
هر اندازه سطح دشواري از 50% بيشتر باشد سؤال به همان اندازه آسانتر خواهد بود و هر اندازه از 50% كمتر باشد سؤال به همان اندازه مشكلتر خواهد بود. بنابراين سؤال فرضي فوق در رديف سؤالات مشكل طبقه بندي مي شود.
2ـ قدرت تشخيص: منظور از قدرت تشخيص يا قوة تميز عبارت است از توانايي سؤال در تقسيم بندي آزمودنيها به دو گروه قوي و ضعيف نسبت به متغير مورد اندازه گيري. در عمل مي توان قدرت تشخيص يك سؤال را براساس يك معيار خارجي، مثلاً موفقيت شغلي يا تحصيلي، يا از طريق مقايسة آن با نتيجة كل آزمون، كه در اينجا به كار مي بريم، پيدا كرد. اولين كاري كه بايد براي تعيين قدرت تشخيص سؤال فرضي انجام داد اين است كه تفاوت گروه قوي و ضعيف را در پاسخگويي به سؤال پيدا كرد. جدول نشان مي دهد كه 71 نفر از گروه قوي و 15 نفر از گروه ضعيف توانسته اند پاسخ صحيح سؤال را پيدا كنند. بنابراين تفاوت آنها 56 خواهد بود. چون در هر گروه 100 آزمودني وجود دارد، تفاوت ماگزيمم 100 خواهد بود.
حال تفاوت مورد مشاهده را به تفاوت ماگزيمم تقسيم مي كنيم تا قدرت تشخيص سؤال به دست آيد:
15 ـ 71 پاسخهاي صحيح گروه ضعيف ـ پاسخهاي صحيح گروه قوي
= = قدرت تشخيص
- تفاوت ماگزيمم (تعداد افراد يك گروه)
|
56/0 = =
قدرت تشخيص يك سؤال را معمولاً به صورت اعشار و سطح دشواري آن را به صورت درصد نشان مي دهند. هر اندازه قدرت تشخيص يك سؤال به عدد 1 نزديكتر باشد به همان اندازه قدرت تشخيص بيشتري خواهد داشت و برعكس. عدد 1 زماني به دست مي آيد كه سطح دشواري سؤال 50% باشد. يعني صددرصد افراد گروه قوي و صفر درصد افراد گروه ضعيف به آن پاسخ صحيح بدهند. بنا به اين دليل، تهيه كنندگان آزمونها تمايل دارند سؤالاتي را انتخاب كنند كه سطح دشواري آنها 50% است. چون اين حالت بندرت اتفاق مي افتد، لذا تست سازان در عمل سؤالاتي را ترجيح مي دهند كه سطح دشواري آنها بين 40% و 60% باشد. البته اين امر زماني صادق است كه از آزمون به عنوان يك وسيله جهت اندازه گيري دقيق تفاوتهاي فردي استفاده شود، اما اگر بخواهند از آزمون براي جدا كردن 20% بالاي آزمودنيها از بقية آنها استفاده كنند و تعيين تفاوتهاي فردي چندان مطرح نباشد (مثلاً در انتخاب دانشجو براي دانشگاهها) سطح دشواري سؤالات آن بايد نزديك به 20% باشد. سؤالي كه قدرت تشخيص آن از 25% كمتر باشد كنار گذاشته مي شود.
3ـ ارزش پاسخهاي پيشنهادي غلط: پاسخهاي پيشنهادي غلط، كه اصطلاحاً به پاسخهاي انحرافي معروفند، طوري بايد باشند كه تا اندازه اي توجه آزمودنيها را به خود جلب كنند. پاسخ انحرافي خوب پاسخي است كه گروه ضعيف را بيشتر از گروه قوي به اشتباه بيندازد. اگر پاسخ انحرافي، گروه قوي را بيشتر از گروه ضعيف به خطا وادار كند گول زننده خواهد بود.
ارزش هر يك از پاسخهاي پيشنهادي غلط از طريق مقايسة تعداد آزمودنيهايي كه از دو گروه قوي و ضعيف آن را انتخاب كرده اند معلوم مي شود. در مثال فرضي هيچ يك از آزمودنيها گزينة «دال» را انتخاب نكرده است. بنابراين، مناسبترين جايي كه بايد تجديدنظر در سؤال را شروع كرد همين پاسخ پيشنهادي «دال» است. دو پاسخ پيشنهادي «ب» و «ج» مي توانند به عنوان گزينه هاي غلط مورد استفاده قرار گيرند. بطور كلي، در يك سؤال چند گزينه اي، اگر يك يا دو پاسخ پيشنهادي مثل پاسخ «دال» باشند مي توان در سؤال تجديدنظر كرد، اما اگر بيش از دو پاسخ داراي جنين معايبي باشند خود سؤال را بايد كنار گذاشت.
ج) درجه بندي (نورم يابي) : پس از حذف سؤالات نامناسب و تنظيم بقيه برحسب سطح دشواري، مي توان پس از انتخاب دقيق گروههاي آزمودنيها اقدام به درجه بندي آزمون كرد. بديهي است كه بايد دستورالعمل واحدي را به كار برد و براي آشنايي آزمودنيها با شيوة پاسخگويي چند سؤال نمونه هم داد.
اگر اجراي آزمون محدوديت زماني داشته باشد حتماً بايد رعايت شود. اجراي مقدماتي يك آزمون نشان مي دهد كه چقدر بايد وقت داده شود. ساده ترين راه براي تعيين وقت به اين صورت است كه به آزمودنيها اعلام مي كنند كه اجراي آزمون محدوديت زماني دارد و گاه بيگاه نيز محدوديت زماني را يادآوري مي كنند. زماني را در نظر مي گيرند كه تقريباً 75 درصد آزمودنيها توانسته اند به همة سؤالات برسند. البته در آزمونهاي سرعت، زمان را طوري انتخاب مي كنند كه هيچ يك از آزمودنيها نتواند در پايان آن به همة سؤالات برسد. در غير اين صورت تفاوتهاي آزمودنيها مشخص نخواهد شد.
عوامل مؤثر بر عملكرد در جريان آزمون :
در جريان اجراي آزمون بايد هم به شرايط فيزيكي و هم به چگونگي ارتباط گيري با آزمون شونده توجه داشت. اجرا و نمره گذاري آزمون تا جايي كه ممكن است بايد بي طرفانه انجام شود. توجه دقيق به دستورالعمل آزمون در تهية گزارش مناسب از عملكرد فرد، تأثير عوامل مخرب در اجراي آزمون را كاهش مي دهد. جريان هر آزمون حالت پويا دارد و ممكن است عوامل گوناگوني كه خارج از كنترل آزمون كننده است بر آن تأثير بگذارد.
ويژگيهاي آزمون شونده:
تأثير ويژگيهاي آزمون شونده بر آزمون، يك عامل آشكار است. مثلاً كودكان خردسال نمي توانند به برخي از آزمونها پاسخ بدهند؛ افرادي كه خواندن نمي دانند قادر نيستند به آزمونهايي پاسخ دهند كه مستلزم اين مهارت اساسي است. جريان آزمون بايد با توجه به محدوديتها صورت گيرد. به همين دليل آزمونهاي ويژه اي براي كودكان خردسال تهيه شده است.
در بسياري از موارد آزمون شوندگان نمرات آزمون را داراي نقش مهمي در آيندة خود مي بينند. صرف نظر از اينكه جنين دريافتي حقيقت داشته باشد يا نه، در رفتار آزمون شونده بسيار مؤثر است. پروفسور آناستازي در مورد داوطلبان دانشكده هاي طبّ كه «آزمون پذيرش كالجهاي پزشكي» (MCAT) را امتحان مي دهند و شركتهاي تجاري نيز فوت و فن پاسخگويي به اين آزمون را به آنان ياد مي دهند، چنين توضيح مي دهد: درسهاي خصوصي كنكور، اگر باعث بالا رفتن نمرة داوطلبان باشد بي آنكه باعث بهبودي واقعي در رفتارهايي شود كه آزمون براي پيش بيني آنها تهيه شده است، نتيجه اي جز از بين بردن روايي آزمون به بار نخواهد آورد.
اجراي مكرر آزمون در مورد يك فرد نيز معمولاً به عنوان يك عامل مؤثر بر عملكرد به حساب مي آيد. در اين گونه موارد بهتر آن است كه با توجه به ميزان بهبود عملكرد در فاصلة اجراي دوبارة آزمون، تعبير و تفسير ما از نتايج حاصل از اجراي دوم يا سوم يا بيشتر با توجه به تفاوتهاي ناشي از يادگيريي فوت و فن تست زني باشد و اين تفاوتها را از تفاوتهاي ناشي از يادگيري واقعي محتواي آزمون متمايز سازد. يك عامل مخرب ديگر در عملكرد آزمون شونده «اضطراب امتحان» است.
اصطلاح اضطراب امتحان اولين بار دردهة 1950 توسط ماندلر و ساراسون (ماندلر و ساراسون، 1952 و 1953) مطرح شد و بعدها نيز موضوع تحقيقات زيادي شد. يك مقياس سنجش اضطراب امتحان نيز كه داراي 37 سؤال بود توسط ساراسون (1972) تهيه شد كه در مورد دانشجويان دانشگاه به كار مي رفت.
ساراسون (1975) مي گويد دانشجوياني كه اضطراب امتحان دارند دچار نوعي ترس رواني مي شوند و اين ترس آنان را چنان گرفتار مي كند كه عملكرد آنها را در آزمون ضعيف مي كند. اضطراب امتحان باعث دو نوع واكنش مي شود، يكي واكنش عاطفي (مثلاً عرق ريختن) و ديگري واكنش شناختي (مثلاً نگراني از ناتواني در پاسخگويي به سؤالات).
طبيعي است كه كوشش در جهت كاهش يا حذف اضطراب امتحان در ميان دانش آموزان و دانشجويان باعث لذت بخش شدن و كارآيي جريان آموزش مي شود. روشهاي بهبودبخشي رفتاري، نظير حساسيت زدايي به منظور اصلاح يا از بين بردن واكنش عاطفي، نتايج مطلوبي به بار آورده است. گزارش اشپيلبرگر (1976) براي كاهش اضطراب امتحان، نشان مي دهد كه روشهاي رفتارگرايانة حساسيت زدايي نتوانسته است به بهبود پيشرفت آكادميك و اصلاح عملكردهاي شناختي بيانجامد بلكه حساسيت زدايي همراه با استفاده از روشهاي مشاوره اي براي بهبود مهارتهاي مطالعه، نتايج مثبتي را به دنبال داشته است.
يكي ديگر از عواملي كه بر نتايج آزمون اثر مي گذارد عامل حدس و گمان در سؤالات چند گزينه اي است. مثلاً در سؤالات چهار گزينه اي اگر فردي كه هيچ دانشي راجع به اين سؤالات ندارد هر گاه براساس حدس و گمان يا تصادف به سؤالات پاسخ دهد احتمالاً به يك سؤال از هر چهار سؤال آزمون پاسخ صحيح خواهد داد.
براي حلي اين مشكل، پيشنهاد شده است كه، چون احتمال پاسخ صحيح دادن به يك سؤال K گزينه اي براساس حدس و گمان معادل k/1 مي باشد و احتمال پاسخ غلط دادن به آن مساوي /// مي شود، برآورد ما از پاسخهاي صحيح واقعي در يك آزمون چند گزينه اي با فرمول زير قابل محاسبه است.
///فرمول
كه در اين فرمول، R تعداد پاسخهاي صحيح، W تعداد پاسخهاي غلط، و K تعداد گزينه هاي هر سؤال است. استفاده از اين فرمول توسط برخي از محققان، از جمله پروفسور راولي و پروفسور تراوب از دانشگاه تورنتو، مورد انتقاد قرار گرفته است. اينان معتقدند وقتي كه زمان كافي براي پاسخگويي به همة سؤالات به دانشجويان مي دهيم اهميت استفاده از حدس و گمان، به عنوان يك عامل مخرب در نتايج آزمون، بسيار كمتر مي شود.
تأثيرات آزمون كننده :
در بسياري از موارد تأثير آزمون كننده بر تهيه يا اجراي آزمون و بر نمره گذاري و تفسير و تعبير نتايج امري بديهي است. اين تأثير در مورد آزمونهاي فردي بيشتر از آزمونهاي گروهي است. همچنين كودكان بيش از بزرگسالان تحت تأثير آزمون كنندگان قرار مي گيرند. هم آزمونهاي عملكرد حداكثر (نظير آزمونهاي هوش) و هم آزمونهاي عملكرد نمونه وار (مثل آزمونهاي شخصيت) از خصوصيات آزمون كننده تأثير مي پذيرند. گراهام وليلي عوامل نژادي، جنسيت، و انتظارات آزمون كنندگان را بر جريان و نتايج آزمونها مؤثر مي دانند.
يِنسن نتايج سي مورد تحقيق را كه در فاصلة سالهاي 1936 تا 1977 منتشر شده مورد بررسي قرار داده و نتيجه گرفته است كه در مواردي كه آزمون كنندگان با آزمون شوندگان از يك نژاد بوده اند، افراد مورد آزمون نتايج بهتري در عملكرد خود بروز داده اند. اگرچه نمي توان نژاد آزمون كننده را متغير مهمي در تعيين عملكرد افراد در مورد آزمونهاي توانايي ذهني به حساب آورد. ساير محققان نيز كه به بررسي نتايج كلية پژوهشهاي مربوط به اين موضوع پرداخته اند (مثلاً گرازيانو و همكاران، 1982؛ ساتل و گوين، 1982) به نتايج مشابهي دست يافته اند.
آزمون شوندگاني كه توسط آزمون كنندگان همجنس خود مورد آزمون قرار مي گيرند عملكرد بهتري از آزمون شوندگاني داشته كه توسط افراد غيرهمجنس خود آزمون شده اند. البته در اين مورد نيز تحقيقات موجود شواهد محكمي در تأييد اين فرضيه ارائه نكرده اند. در برخي از پژوهشهايي كه به دقت طراحي شده (مثلاً تحقيقات ساموئلز، 1977)، عامل جنسيت به عنوان يك تأثير گذارندة جزئي در آزمونها شناخته شده است. بررسيهاي رومِنيك و همكاران از تحقيقات روان شناسي در اين موضوع حاكي از آن است كه تأثير جنسيت آزمون كنندگان بر عملكرد آزمون شوندگان، بخصوص در مورد سؤالاتي كه ماهيت جنسيتي دارند، مؤثر است اما شواهد روشني مبني بر تأثير جنسيت آزمون كننده بر نتايج حاصل از آزمونهاي هوشي به دست نيامده است.
مهارت آزمون كنندگان، صرف نظر از اين كه چه نژاد يا جنسيتي داشته باشند، با يكديگر متفاوت است و به همين دليل تحقيقاتي هم كه در مورد تأثير عامل نژادي و جنسيتي آزمون كننده بر نتايج آزمونها به انجام رسيده به يافته هاي متفاوتي رسيده است.
فرضية ديگر در مورد عوامل مربوط به تأثير آزمون كننده بر جريان و نتايج آزمون، اطلاعات و طرز فكر و قضاوت قبلي آزمون كننده در مورد آزمون شونده است. يعني به جاي عملكرد واقعي آزمون شونده، انتظارات آزمون كننده است كه بر آزمون تأثير مي گذارد. از جمله محققاني كه بر اهميت اين عامل تأكيد كرده اند رُزنتال و ياكوبسون (1968) هستند كه مي گويند انتظارات مي تواند بر نتايج تجربي در تحقيقات مختلف روان شناسي تأثير بگذارد. آنان اظهار مي دارند كه انتظارات بر نمره هاي هوشبهر دانش آموزان دبستاني تأثير دارد. در تحقيق آنان، اسامي تعدادي دانش آموز به معلم كلاس داده و گفته شد كه از اين دانش آموزان آزمون به عمل آمده و انتظار مي رود كه پيشرفت مهمي در تواناييهاي شناختي خود در طول سال نشان دهند.
انتظار معلم آن بود كه اينان دانش آموزاني با توانايي شناختي بالا هستند كه بايد پيشرفت قابل توجهي داشته باشند و چنين هم شد. نتايج اين آزمون در بسياري از منابع علمي نقل شد و اشاعه يافت اما در معرض انتقادات جدي واقع شد. از نظر روش شناختي نيز انتقادات مهمي بر اين تحقيق وارد شد و از جمله كرانباخ (1975) نشان داد كه نمي توان اين مطالعه را يك تحقيق علمي ناميد بخصوص كه انتظار معلمان موجبي براي افزايش نمرة هوشبهر دانش آموزان نشده بود. مطالعات يِنسن (1980) نيز نشان داد كه انتظارات نمي تواند تأثيري بر نمرات هوشبهر داشته باشد. در عين حال، نمي توان ادعا كرد كه انتظارات بر پيشرفت فرد اثر نمي گذارد.
علاوه بر عواملي كه گفته شد، متغيرهاي ديگري در خصوصيات آزمون كننده (نظير تجربه، شخصيت، خصوصيات، سبك برخورد، و آشنايي قبلي با آزمون شونده) نيز هست كه بر جريان و نتايج آزمون اثر مي گذارد. شواهد گوناگون نشان مي دهد كه اين متغيرها حائز اهميت هستند ولي فوق العاده دشوار است كه بگوييم مشخصاً چه وقت بر نتايج آزمون تأثير دارند. در عين حال، با توجه كافي به جزئيات اجراي آزمون و پس از آموزشهايي كه آزمون كننده براي اجراي آزمون خواهد ديد، اين تأثيرات به حداقل خود خواهد رسيد.
زمينه هاي كاربرد آزمونها :
ما در عصر تكنيك علمي به سر مي بريم. مخصوصاً آنچه انسان امروزي مي خواهد عبارت است از دانايي براي توانايي بيشتر. در روان شناسي نيز وضع به همين منوال است: قواني روان شناسي را اساساً براي نيل به هدفهاي مفيد به كار مي برند.
آنچه روان سنجها يا پسيكوتكنيسين ها ادعا مي كنند، اين است كه انسان را در شناختن تواناييهاي خود و سازگاري هر چه بهتر با محيط زندگي ياري رسانند. كاربردهاي روان شناسي معمولاً به دو صورت انجام مي گيرد: كاربردهاي مستقيم و غيرمستقيم. كاربردهاي مستقيم يعني ايجاد مساعدترين موقعيت كار، انطباق ابزار با كارگر، … كاربردهاي غيرمستقيم يعني استفاده از مفاهيم روان شناسي تفاوتهاي فردي در سازماندهي اجتماعي (راهنمايي، انتخاب، روابط انساني).
اهداف عملي آزمونها بسيار زياد است. هر وقت لازم باشد كه يك تشخيص سريع و عيني از تواناييهاي فرد، به منظور راهنمايي او، به عمل آيد اجراي آزمونها ضرورت مي يابد. اگر امروزه مي بينيم كه انواع مختلف آزمونها بي وقفه و بطور گسترده افزايش مي يابد به علت كثرت تعداد كساني است كه از آنها استفاده مي كنند: مربيان، روان شناسان، روان پزشكان، راهنمايان شغلي، صنعتي، نظامي، …
1ـ زمينة تحصيلي :
مي توان گفت كه اجراي اولية آزمونها و كاربرد مفيد آنها در زمينة آموزش و پرورش بوده است. مقياس بينه ـ سيمون به تقاضاي وزير آموزش و پرورش فرانسه، به منظور مجهز كردن مربيان و پزشكان با يك وسيلة عملي و مطمئن، جهت شناسايي عقب مانده هاي تحصيلي و جايگزيني آنها در كلاسهاي اختصاصي، به وجود آمد. يكي از اولين كتابهايي كه به زبان فرانسه و دربارة روش آزمونها نگارش يافته، كتابي است كه كلاپارد، تحت عنوان علمي «چگونه بايد استعدادهاي دانش آموزان را تشخيص داد» به رشتة تحرير در آورده است. آخرين اثر بينه «نظرات جديد دربارة كودكان» ، نيز كاملاً در جهت تعليم و تربيت بوده است. در حال حاضر انواع مختلف آزمونها را مي توان در مدارس به كار برد. هدف از اجراي آزمونها در مدارس اين است كه مي خواهد دانش آموزان با استعداد را انتخاب نمايند. از آزمونها براي انفرادي كردن آموزش، راهنمايي دانشجويان، تشخيص علل عقب ماندگيهاي عمومي يا اختصاصي نيز بهره مي گيرند. امروزه آزمونها به همراه امتحانات سنتي، به عنوان يك روش عيني براي بررسي پيشرفت تحصيلي دانش آموزان به كار مي رود. به كمك آزمونها مي توان آموزشي را كه واقعاً با قابليت عقب افتاده ها سازگار باشد به وجود آورد. در زمينة تحقيقات آموزش و پرورش تجربي نيز از آزمونها به عنوان يك وسيلة غيرقابل جانشين استفاده مي شود. آزمونهايي كه به بلوغ آموزشي معروف است، اطلاعاتي دربارة ظهور مكانيسمهاي رواني لازم جهت شروع بعضي يادگيريها، مخصوصاً خواندن، نوشتن و حساب كردن را فراهم مي آورد.
در پرتو استعمال روزافزون آزمونها، سازماندهي تحصيلي بسيار علمي تري امكان پذير شده است. تعداد موقعيتهايي كه استعمال آزمونها را در مدارس /// مي سازد بقدري افزايش يافته كه در اكثر كشورها موجب پيدايش متخصص ديگري به نام روان شناس تحصيلي شده است. اين فرد در واقع نقش مربي و نقش روان شناس را با هم انجام مي دهد.
خدمات روان شناسي تحصيلي، به رغم سازماندهيهاي مختلفي كه برحسب كشورها به وجود آمده، هدفهاي يكساني را دنبال مي كند. اين هدفها عبارت است از: پيدا كردن راه حل دشواريهاي عمومي و اختصاصي دانش آموزان در جريان تحصيل آنها، راهنمايي تحصيلي، مطالعة عيني و تحليلي، روان شناسي تربيتي مواد برنامه، تلاش براي پيدا كردن روشها و شيوه هاي انفرادي كردن آموزش، …
خدمات روان شناسي تحصيلي در جريان سي ساله گذشته بطور قابل ملاحظه اي گسترش يافته و انواع مختلف مقاطع تحصيلي، از ابتدايي تا دانشگاه، را در بر گرفته است. هر چند روش آزمونها تنها وسيلة مشاهده در اين مؤسسات به حساب نمي آيد، مقام بسيار مهمي را اشغال مي كند.
2ـ زمينة شغلي :
كاربردهاي روان شناسي در زمينة سازماندهي كار بقدري متعدد و متنوع شده كه امروزه استعمال عبارت پسيكوتكنيك تقريباً به زمينة شغلي اختصاص يافته است. اين حركت توسط يك مهندس آمريكايي به نام تيلور شروع شده كاربرد روان شناسي تجربي براي مطالعة عامل انساني در كارخانه ها، تجزية فعاليتهاي شغلي، تحليل و اندازه گيري زمان حركات، حذف اعمال بي فايده، كه همه براي ازدياد توليد است، از ويژگيهاي تيلوريسم به شمار مي آيد. البته در اين مورد نمي توان از آزمونهاي شغلي صحبت كرد بلكه بايد از كنترل بازده حرف زد. توجه اصلي بر روي كارگر، به عنوان يك انسان، نيست بلكه بيشتر توليد صنعتي مورد نظر است. تيلوريسم به مرور زمان تغيير شكل يافته و انساني شده است؛ توجه به نيازها و آرزوهاي شخصي كارگر به تمايل تجربي اضافه گرديده است.
مسائلي كه در حال حاضر براي پسيكوتكنيك مطرح مي باشد بسيار زياد است. اما تنها چيزي كه اهميت دارد و در آن آزمايش مستقيم فرد با روش آزمونها وارد عمل مي شود عبارت است از: راهنمايي، انتخاب، انطباق و تربيت شغلي. سازماندهي عقلايي كار قبل از هر چيز بر تنوع تفاوتهاي فردي استوار است. آنچه امروز به اثبات رسيده اين است كه هر فرد نمي تواند در هر زمان و در همه جا آن طور كه مي خواهد باشد و آنچه مي خواهد انجام دهد.
هر شغلي به تعدادي از استعدادهاي عمومي و اختصاصي نياز دارد و هر اندازه اين شغل تخصصي تر باشد به همان اندازه تعداد استعدادهاي اختصاصي لازم افزايش مي يابد يا لااقل اين استعدادها محدودتر مي گردد. بنابراين، شناختِ صحيح نيازهاي هر فرد، مخصوصاً نيازهاي روان شناختي او، شناسايي مشاغل، تهية فهرست ويژگيها و ظرفيتهاي كارگان آينده به منظور تطبيق آن با شغل نما، كمك به افراد در انتخاب شغلي كه با استعدادهاي او سازگاري بيشتري دارد، طرح هر نوع راهنمايي شغلي را تشكيل مي دهد.
تعداد آزمونهايي كه تشخيص و پيش بيني را توأم انجام مي دهد و امروزه در مراكز راهنمايي شغلي مورد استفاده قرار مي گيرد بسيار زياد است. اما انتخاب شغلي فقط براساس نتايج حاصله از آزمونها انجام نمي گيرد. عناصر ديگري نيز بايد در اين فهرست گنجانده شود: وضع بازاركار، موقعيت خانواده، موقعيت اقتصادي، مقتضيات جغرافيايي.
در واقع، انتخاب هميشه بايد تا اندازه اي گسترده انجام گيرد. چيزي كه بايد از آن اجتناب كرد اين است كه جوانان، بدون انديشه و تفكر، شغلي را انتخاب كنند كه استعداد لازم را براي آن ندارند. اين افراد در اين مشاغل، جزء ناسازگاران دايمي به حساب خواهند آمد و براي خود و ديگران ماية دردسر و بدبختي خواهند بود. گسترش مراكز راهنمايي، افزايش دايمي والديني كه فرزندان خود را به اين مراكز مي فرستند، فوايدي كه صاحبان كارخانه ها شخصاً براي آنها قايلند، همه سودمندي غيرقابل انكار روان شناسي كاربردي (كاربرد آزمونها را به اثبات مي رساند.
راهنمايي شغلي معمولاً در دوران نوجواني، قبل از ممارست واقعي با شغل، انجام مي گيرد، بنابراين مسألة انتخاب، افرادي را در بر مي گيرد كه قبلاً در مسير شغل معيني قرار گرفته اند. در اين جا مخصوصاً سود كارخانه در نظر گرفته مي شود و دخالت يك پسيكوتكنيسين را توجيه مي كند. هدف اين است كه، با حذف كارگراني كه نتوانسته اند بطور كامل با حرفة خود سازگار شوند و اميد سازگاري هم وجود ندارد، بازده را بالا ببرند. در اكثر موارد، انتخاب افراد در واقع به صورت راهنمايي مجدد در مي آيد و اين كار نيز، با توجه به سن افراد، با دشواريهايي روبرو مي شود. گاهي اتفاق مي افتد كه مسألة انتخاب در داخل يك كارخانة بزرگ به توزيع مجدد كاركنان در ميان خدمات متعددي كه وجود دارد محدود مي شود. بنابراين، سازماندهي و جايگزيني در بين خواهد بود كه در اصطلاح فني چنين گفته مي شود: در چهارچوب يك كارخانه هر كس بايد در جايي قرار گيرد كه شايستة آن است. ارتقاء اجتماعي و طبقه بندي مجدد كارگران، مسائل تازه اي است كه مي تواند از آزمونها كمك بگيرد.
3ـ زمينة نظامي :
سازماندهي علمي ارتشهاي مدرن نيز بايستي از كشفيات روان شناسي و روش آزمونها بهره بگيرد. از آن جا كه در زمينة نظامي نيز، مثل ساير زمينه هاي فعاليت اجتماعي، عامل انساني مورد نظر است، ما به همان مسائل بنيادي، منتها با نيازهاي نظامي، برخورد خواهيم كرد: انتخاب، راهنمايي، تربيت شغلي، موارد باليني، تبليغ، بازپروري، فرماندهي و …
اولين اجراي منظم آزمونها در زمينة نظامي عبارت بود از آزمايش رواين سربازان ارتش آمريكا در جريان جنگ بين الملل اول. براساس نتايج آزمونها، سربازان به پنج طبقة هوشي تقسيم شده بودند و اين امر اجازه مي داد تا راهنمايي و آموزش آنها برحسب تواناييهاي فردي امكان پذير گردد. امروزه، به علت دگرگونيهاي عميقي كه در يازماندهي ارتشهاي مدرن و در هنر جنگ به وجود آمده، روان شناسي نظامي توانسته است از پيشرفتهاي بزرگي برخوردار شود. از سال 1927 به بعد، آزمونها رسماً وارد ارتش آلمان شده بود. هر واحد نظامي داراي يك آزمايشگاه روان شناسي بود كه مستقيماً زير نظر آزمايشگاه مركزي وزارت جنگ اداره مي شد.
بخشهاي اصلي مورد مطالعه عبارت بود از: تحليل كار و انطباق ماشينها و تجهيزات با تواناييهاي افراد، مطالعة ويژگيهاي افراد و انتخاب كاركنان، تبليغ و روان شناسي ملتهاي بيگانه، هدايت جنگ.
در سال 1937، شغل روان شناس نظامي توسط قانون به رسميت شناخته شد و كساني توانستند به آن اشتغال ورزند كه مدرك دانشگاهي داشته باشند. انتخاب افسران، انتخاب افراد براي خدمات اختصاصي، از قبيل خلباني، حمل و نقل، هدايت تانكها، مخابرات، ارتباطات راديويي، …
براساس اصول خاصي صورت مي گرفت كه آزمونها سهم مهمي در آن داشت. ساير كشورها، مخصوصاً آمريكا و انگلستان، از كشور آلمان عقب نمانده اند. در واقع اولين وظيفة يك فرمانده عبارت است از شناختن ويژگيهاي افرادي كه در اختيار دارد: تواناييهاي جسمي، استعدادهاي ذهني و خصوصيات اخلاقي. سابق بر اين حوزه هاي سربازگيري فقط به انجام يك آزمايش جسمي و يك آزمايش پزشكي قناعت مي كرد. امروزه، آزمايش فردي سربازان بسيار كاملتر و دقيقتر شده است.
استعدادهاي اختصاصي و ويژگيهاي اخلاقي هر يك از افراد را نيز ارزشيابي مي كنند. تشكيل واحدها و كادرهاي نظامي نمي تواند به روشهاي غيرتجربي متوسل شود بلكه بايد از آزمايشهايي كه بطور علمي ساخته شده است بهره بگيرد. امروزه تقريباً در همة كشورها مراكز روان شناسي نظامي، شبيه مراكز راهنمايي شغلي به وجود آمده كه وظيفة آنها انجام كارهايي است كه در بالا ذكر كرديم. تعداد زيادي از آزمونهايي كه طي سالهاي اخير تهيه شده انحصاراً در اختيار ارتش قرار گرفته است. اين آزمونها در سازماندهي نظامي سودمندي غيرقابل انكاري را نشان داده است: آزمونهايي كه براي انتخاب خلبانان در آلمان فدرال به كار رفته، آزمونهاي ارتش آمريكا و مراكز پسيكوتكنيك نظامي كشورهاي مختلف، هر يك سهم بسيار مهمي را به عهده دارد.
4ـ كودكان نابهنجار و بزهكار :
روش آزمونها بطور گسترده براي تشخيص و درمان كودكاني كه از نظر هوش و رفتار بي نظميهايي نشان مي دهند به كار رفته است. اين نوع كاربردها را منحصراً مي توان در اختيار تعليم و تربيت و روان پزشكي قرار داد. علت اين كه آنها را بطور جداگانه و خارج از حوزة تحصيل و روان پزشكي مورد بحث قرار مي دهند اين است كه امروزه، خدماتي كه كودكان نابهنجار و جوانان بزهكار را در بر مي گيرد بقدري زياد است كه بخش مستقلي را در مددكاري اجتماعي به وجود آورده است. در شهرهاي بزرگ، اكثر كشورها، كلينيكهاي اختصاصي به منظور كمك به كودكان و جواناني كه دشواريهايي دارند، تأسيس شده است. در اين مؤسسات، پزشكان متخصص، روان پزشكان و روان شناسان، افرادي را كه توسط والدين، مددكاران اجتماعي يا دادگاهها ارجاع داده مي شوند بطور دقيق و عميق مورد آزمايش قرار مي دهند. اجراي آزمونها، به همراه تحليل باليني، مقام بسيار مهمي را در ميان ساير فنون تشخيص احراز مي كند.
5ـ آزمونها و كلينيك پزشكي :
از مدتها پيش انواع متعدد شيوه هاي تشخيص، شيوه هايي كه مي توان تحت عنوان آزمونهاي كنشي و حسي از آنها نام برد، در اختيار هنر پزشكي بود. علت گسترش قابل ملاحظة آزمونهاي شخصيت در اين سي سال اخير، به سبب استعمال آنها توسط روان پزشكان بوده است. در حال حاضر كاربردي كه اين گروه آزمونها در مطالعة علايم امراض رواني دارد حقيقتاً خارج از توصيف است. براي اثبات اين ادعا، كافي است كمي به آزمون لكه هاي جوهر رورشاخ فكر كنيم. اين آزمون به تنهايي موجب شده تا هزاران نشريه در سراسر جهان انتشار يابد، مؤسساتي كه منحصراً به كاربرد آن اختصاص دارد به وجود آيد و كنفرانسهاي بين المللي، كه موضوع آنها همين آزمون است، تشكيل شود. يكي از مقياسهايي كه امروزه كاربرد زيادي در اكثر كشورها دارد مقياس وكسلر است كه توسط يك روان پزشك تهيه شده است. هدف اولية اين روان پزشك حل مسائل باليني بوده است.
بنابراين، مطالعة سازمان شخصيت، اختلالات آن و آثار اين اختلالات بر ساير جنبه هاي زندگي ، چيزي را در اختيار دارد كه اصطلاحاً «كلينيك مسلّح» ناميده مي شود. اين كلينيك اجازه مي دهد تا با سرعت بيشتر و بطور مؤثرتر كار شود.
6ـ ساير زمينه هاي كاربردي :
اگرچه مسائل تحصيلي، سازماندهي علمي كار، فعاليت نظامي، پزشكي، حمايت دوران كودكي و كلينيك روان پزشكي بخشهايي را تشكيل مي دهد كه روش آزمونها كاربردهاي متعدد و مشروعي را پيدا كرده است، زمينه هاي متعدد ديگري نيز وجود دارد كه استفاده از آزمونها ضرورت پيدا مي كند. مثلاً بررسيهاي جنايي و اعمال قضايي مواردي است كه از آزمونها بهره مي گيرد. آزمايشهاي كشف دروغ، آزمونهاي زمان واكنش، آزمونهاي حافظه، اندازه گيري تلقين پذيري، روشهاي سنجش شخصيت، … وسايلي است كه مي تواند بعضي دشواريهاي پليس قضايي و دادگاه را روشن سازد. بدون ترديد نبايد تصور كرد كه اين روشها راه حلهاي قاطعي براي تمام مسائل پيدا خواهد كرد. اين روشها، به همراه روشهاي سنتي، مسلماً امكان اخذ نتايج رضايت بخش تر و مطمئن تري را خواهد داشت.
ورزش و مسابقات ورزشي زمينة ديگري است كه آزمونهاي رواني كاربرد پيدا مي كند. لزوم انتخاب و كنترل افراد در اين جا نيز موجب مي شود كه انواع آزمونهاي جسمي، رواني و شخصيت به كار رود تا سازماندهي عقلايي تر و مؤثرتر از اين فعاليتها به عمل آيد.
ارزشيابي نتايج يك مبارزة تبليغاتي، بررسي عقايد، برآورد تمايلات اجتماعي فعلي، زمينه هاي ديگري است كه اندازه گيري عيني مي تواند به كمك آزمونها يا فنون ديگري از همان نوع انجام گيرد و اين اندازه گيري با قضاوتهاي مبهم و ذهني، كه فراوان ديده مي شود، جايگزين گردد.
مي توان نتيجه گرفت كه هميشه انديشة تفاوتهاي فردي، انفرادي كردن كارها و نتايج عملي حاصله از آنها پاية استعمال آزمونها بوده است. هر وقت صحبت از بازده بيشتر، سلامتي بيشتر، اقتصاد بيشتر و عدالت بيشتر باشد سعي مي كنند فرد يا بهتر بگوييم، شخص را به عنوان مرجع اصلي در نظر بگيرند و از اين طريق به هدفهاي فوق برسند.
بنابراين، اين فكر بقدر كافي قابل تحسين و انساني است. براي تحقق بخشيدن آن لازم است كه روشها طوري طرح ريزي و تهيه شود كه شايستة آن باشد. پيشرفتهاي آينده، به تكامل تكنيك و هداف پسيكوتكنيسين ها بستگي دارد.
انتقادهاي عادي :
در اصل مي توان پذيرفت كه تهية روشهاي عيني براي تشخيص تفاوتهاي فردي امكان پذير است. با وجود اين، انتقادهاي متعددي بطور دايم عليه آزمونها ابراز مي شود. نقد آزمونها يعني شناخت صحيح نارساييهاي آنها و ضمناً تأييد امتيازات واقعي آنها.
در ميان انتقادهايي كه عليه روان سنجي ابراز مي شود، مي توان انتقادهاي كساني را نام برد كه با روان سنجي آشنايي بسيار سطحي دارند. هر كسي اين اجازه را دارد كه نظرات خود را دربارة يك موضوع معين ابراز كند و تعداد كساني كه نظر بسيار قطعي در مورد آزمونها دارند زياد است. اينها در واقع مخالفان هستند كه هيچ نظر صحيحي دربارة ماهيت و هدف آزمونها ندارند.
يكي از فيلسوفان فرانسه، به نام لوسن، كه در سال 1951 وفات يافته، انتقادهاي زير راب ه آزمونها نسبت داده است. بنا به گفتة او آزمون عبارت است از يك موقعيت ساختگي كه آزمودني در برابر آن حالت دفاعي به خود مي گيرد.
فعاليتهايي كه در پاسخگويي به آزمونها به كار مي رود، نمي تواند با حالت عادي و دايمي فرد انطباق داشته باشد و نتيجة عددي نمي تواند روشنگر خود اعمال ذهني باشد.
چگونه بايد به اين انتقادها پاسخ داد؟ شيوة برآورد عيني استعدادهاي يك فرد هرچه باشد، مسائل مورد حل هميشه نوعي حالت ساختگي و تصنعي به وجود خواهد آورد. همة آزمايشها از اين ضعف رنج مي برد. رنج پرسشنامه هاي منش شناسي كمتر از ساير آزمونها نيست. فعاليتهاي زندگي نيز از اين تصنع معاف نيست و تازه آنها گاهي وقتها از خارج تحميل مي شود، مثل فعاليتهاي تحصيلي. با وجود اين، آزمونهايي كه خوب تهيه شده است، سعي مي كند تا حالت ساختگي بودن آزمايش را حتل الامكان كاهش دهد. اگر آزمودني هدف آزمايش را از قبل بطور دقيق بداند، خطر تصنعي بودن عكس العملهاي او بيشتر خواهد بود، مخصوصاً اگر آزمون از نوع آزمونهاي شخصيت باشد.
بنابراين، خصوصيت غيرعادي و ساختگي بودن موقعيت يك آزمايش نه تنها عيبي به حساب نمي آيد بلكه در بعضي موارد امتياز شمرده مي شود. وانگهي تنوع آزمونهايي كه در حال حاضر وجود دارد و دقتي كه در تهية آنها به كار رفته است، بهتر از دلايل تئوري مي تواند پاسخگوي انتقادهاي نوع بالا باشد.
اما انتقاد ديگر، يعني اين كه نتيجة آزمون فقط يك عدد است، به نظر نمي رسد كه درست باشد. اگر تنها شناسايي سطح كارآيي مطرح باشد، ارائه يك عدد كافي خواهد بود، زيرا آناً درك خواهد شد و از آن جا كه نمرة خام به تنهايي هيچ معنايي ندارد، پس از مقايسه با نورمها مفهوم آن روشن خواهد گشت. آزمونهايي نيز وجود دارد كه قبل از هر چيز شيوة حل يك مسأله توسط يك فرد را آشكار مي سازد. در اين آزمونها بازده آزمودني در نفس خود اهميت ندارد بلكه بيشتر مكانيسمهاي دست اندركار اهميت دارد (آزمونهاي تحليلي، كيفي) .
انتقادهاي لوسن اين است كه آنها در واقع تمام ايراداتي را كه از ابتداي پسيكوتكنيك بطور دايمعليه روش آزمونها ابراز شده است خلاصه مي كند. غالباً آزمونها را به خاطر بيگانگي آنها مورد انتقاد قرار داده اند كه به معنايي موجب نتايج ناشناخته مي شود. آزمايشگر با تجربه هميشه در تماس نزديك با آزمودني است كه نتيجة آن برآورد دقيق از شخصيت او و تفسير انساني از ارزش او خواهد بود. مخصوصاً اين كه آزمونهاي فعلي اجازة چنين تماسي را فراهم مي آورد و حتي بعضي از آنها طوري طرح ريزي شده كه به خلق يك تماس شخصي كمك مي كند. با وجود اين، حتي اگر بپذيريم كه اين قريحة استثنايي (تماس شخصي با آزمودني) براي كسي كه جهت قضاوت دربارة هم نوعان خود دعوت شده است وجود دارد، بايد با پيرون هم عقيده شويم كه تعداد اين نوع آزمايشگران بسيار كم است و در هر حال، «تعداد افرادي كه اين تواناييهاي استثنايي را دارند، نمي تواند جوابگوي نيازهاي امتحانات و كنكورها كه هر روز در حال گسترش است، باشد».
بنابراين، بايد به تربيت آزمايشگران ماهر، آزمايشگراني كه مي توانند تماس روحي و عاطفي با آزمودني برقرار كنند، همت گماشت.
انتقادهاي سياسي :
انتقادهاي پيش بيني نشده اي عليه آزمونها عنوان شده است. مثلاً در اتحاد جماهير شوروي آزمونها را وسيله اي مي شناسند كه داراي حاكميت سرمايه داري است. در واقع از سال 1936 به بعد، كاربرد آزمونها در اين كشور، هم در زمينة تعليم و تربيت و هم در زمينة راهنمايي شغلي ممنوع شده است. به نظر سردمداران شوروي، آزمونهاي رواني نمي تواند به عنوان يك روش علمي مورد استفاده قرار گيرد، زيرا نتايجي كه فراهم مي آورد تواناييهاي واقعي فرد را اندازه نمي گيرد بلكه بيشتر منعكس كنندة“ يك موقعيت ساختگي است. اين نتايج نمونه هايي است كه از نظر آزمايش شونده فاقد ارزش است. به علاوه، آزمونهاي رواني ويژگي ضد اجتماعي دارد، زيرا روشنفكران را برتر نشان مي دهد و در نتيجه آنها را از كارگران متمايز مي سازد، بنابراين جزء آلات شكنجه به حساب مي آيد. محكوميت آزمونها از طرف مقامات شوروي، در مجموع به اين صورت توجيه مي شد كه آنها در انتخاب افراد بر وجود تواناييهايي تكيه مي كنند كه اصولاً در خانواده هاي بورژوا يافت مي شود؛ در صورتي كه بنا به عقيدة كمونيستهاي شوروي، استعدادها در اثر محيط تغيير مي يابد، حتي بعضي از آنها مي تواند به وجود آيد يا بطور كلي از بين برود. از طرف ديگر جنبه هاي شخصيت، كه توسط آزمونها آشكار مي شود، تا اندازه اي محدود بوده، فقط به بعضي طبقات اجتماعي تعلق دارد. تعليم و تربيت سرمايه داري، كه در سال 1931 كميتة كنفرانس بين المللي پسيكوتكنيك تأييد مي كرد، هدفي جز تقويت طبقات حاكمه، حفظ برتري آنها، كمك به استثمار مردم و … نداشت. اگر بعضي آزمونها واقعاً كودكان طبقات مرفه را برتر نشان مي دهد ـ مثلاً مقياس بينه ـ به اين خاطر است كه محتواي آنها براي همة محيطها روايي ندارد. بنابراين، لازم است كه با آزمونهاي ديگري كه ماهيت جداگانه اي دارد تكميل شود. اما آزمونهاي ديگري نيز وجود دارد كه كودكان محيطهاي فقير را بهتر نشان مي دهد، اين آزمونها آنهايي است كه شناسايي ملموس محيط و سازگاريهاي عملي را ايجاب مي كند. در حال حاضر، تعداد و تنوع آزمونها بقدري زياد است كه مي توان براي نيل به انواع هدفها از آنها بهره گرفت.
لازم به يادآوري است كه تعداد زيادي از انتقادها خود آزمونها را در برنمي گيرد بلكه بعضي آزمونهاي خاص يا كاربرد ناشيانة آنها را در برمي گيرد. در واقع بعضي از نمايندگان روان سنجي به جاي اين كه پيشرفت آزمونها را فراهم آورند موجب ركود آنها شده اند. موارد متعددي را مي توان نام برد كه از اين وسيله استفاده هاي كاملاً نابجايي به عمل آمده، مخصوصاً مبنع درآمد بعضي سودجويان شده است. اين امر موجب شده تا روان سنجي در نظر كساني كه از اين جنبه ها به آزمونها نگاه مي كنند، اعتبار خود را از دست بدهد.
افشاي آزمونها :
بهترين آزمون اگر يكبار روي تعداد زيادي از افراد اجرا شود، ديگر نمي تواند نتايج اطمينان بخشي فراهم آورد. مثلاً در بعضي از مناطق فرانسه ديده شده است كه سؤالات مقياس بينه بر روي كارتهاي تحصيلي دانش آموزان چاپ شده است! بديهي است كه اين دانش آموزان امكان آمادگي براي آزمايشهاي رواني را خواهند داشت و والدين آنها نيز خواهند توانست به كودكان خود كمك كنند. مراكزي وجود دارد كه با دادن تمرينهاي منظم، داوطلبان را براي ورود به دانشگاهها يا ساير مؤسسات آماده مي كند. اين مراكز براي نيل به هدف خود، انواع متعدد آزمونها را جمع آوري و تكثير مي كند. بديهي است كه اين قبيل اعمال ارزش آزمون را به عنوان يك وسيلة تشخيصي، بي اعتبار مي سازد و در واقع نوعي تقلب و قاچاق محسوب مي شود.
براي جلوگيري از اين خطر لازم است كه اجراي آزمونها جنبة قانوني پيدا كند. همان طور كه اشتغال به كار طبابت را قانون اجازه مي دهد، كاربرد آزمونهاي رواني نيز بايد بدون داشتن مدرك لازم، منبع شود. يعني كساني كه مدرك دانشگاهي ندارند و با مسائل نظري و عملي آزمونها نيز آشنايي سطحي دارند نبايد اجازة استفاده از روش آزمونها را داشته باشند. البته در اين خصوص پيشرفتهايي حاصل شده است. بطور كلي ناشران آزمونها آنها را فقط در اختيار روان شناساني قرار مي دهند كه صلاحيت شغلي دارند و اين امر موجب مي شود تا در حفظ و كاربرد اصولي آزمونها دقت بيشتري به عمل آيد.
1- پيسكوتكنيك، شاخه اي از روان شناسي است كه كاربرد اطلاعات حاصله از روان شناسي فيزيولوژي و روان شناسي تجربي در حل مسائل انساني را مورد مطالعه قرار مي دهد، اما امروزه فقط كاربرد آزمونهها در انتخاب مشاغل را شامل مي شود.
1- روان توصيفي : اصطلاحي است كه براي اولين بار توسط كلاپارد به كار برده شد. روان توصيفي يعني به كار بردن روشهايي كه جنبة كيفي فرآيندهاي رواني را تعيين مي كنند. روان توصيفي در مقابل روان سنجي قرار مي گيرد.