Головна // Психологія // Акмеологія
Попередня Наступна
Конюхов Н.І., Шаккум М.Л .. Акмеологія і тестология, 1994 - перейти до змісту підручника

СТАТИСТИЧНІ ОСНОВИ шкалювання У тестології

Створення працюючих, ефективних тестів - це складна і тривала робота, що вимагає як тонкого розуміння власне психологічних проблем діагностики, так і знання основ математичної статистики.

Мабуть найпростішим, але одним з ключових елементів математичної статистики в тестології є пошук середнього арифметичного (математичного очікування) з питань і шкалами тесту, а також похідних математичних величин від математичного очікування (стандартне відхилення, дисперсія та ін.).

Математичне сподівання є не що інше як середнє арифметичне. Знання математичного очікування важливо для оцінки результатів тестування, але часом ця величина недостатньо інформативна для оцінки результатів тестування в цілому.

Наведемо приклад. У двох групах (для прикладу нехай вони будуть складатися з 10 осіб) проведено тестування. Використаний тест "Логічні закономірності". Отримані наступні результати:

-

Середнє арифметичне (математичне очікування - Х) дорівнює 6

Дані по другій групі:



Середнє арифметичне (математичне очікування - Х) дорівнює 6,4

Як бачимо, в першій групі всі обстежувані розділилися на дві підгрупи (блискуче вирішили завдання і вирішили їх погано).

У другій групі, навпаки, велика частина обстежуваних показала середні результати. При цьому середнє арифметичне в першій і другій групах приблизно однаково. Але в першій групі середніх результатів немає взагалі, у другій же - ні низьких результатів.

Тобто в цих групах різна ступінь "розкиданості" результатів тестування. Цей ступінь в математиці виражається дисперсією, стандартним відхиленням.

Дисперсія (від лат. Dispersio - розсіювання) - найбільш вживана міра розсіювання, тобто відхилення від середнього.



Де: Х - середнє арифметичне даної вибірки

Хi - значення даного елемента вибірки

N - кількість елементів вибірки

Стандартне відхилення - не що інше як корінь квадратний з дисперсії. Зустрічається два позначення стандартного відхилення (і дисперсії): G (G x G) і S (S x S).

Де: G - генеральне стандартне відхилення

S - вибіркове стандартне відхилення

Знайдемо дані величини для приводяться прикладів.

2

S = 12,666 S = 3,559

1 лютому

2

S = 4,268 S = 2,066

2 лютого

Стандартне відхилення відіграє виняткову роль у

тестології. Всі розробляються в психології тестові шкали

пов'язані зі значеннями стандартного відхилення сирих показників за даною шкалою. Однак перш ніж перейти до даної проблеми зупинимося на аналізі понять "крива розподілу",

"Нормальний закон розподілу", так часто зустрічаються в тестології.

Побудуємо для прикладу гістограми розподілу кількості правильно вирішених завдань з тесту "Логічні закономірності" для 1 і 2 груп обстежуваних.

 Гістограма правильно вирішених завдань для 1 групи обстежуваних





 Гістограма правильно вирішених завдань для 2 групи обстежуваних





І в першому і в другому випадках ми бачимо нерівномірний розподіл результатів тестування.
Однак робити висновок про низьку якість тесту з цими результатами передчасно: занадто мало кількість обстежених (ще не набрав чинності закон великих чисел, який починає проявлятися десь з 30-60 випробувань).

Тому об'єднаємо результати тестових випробувань в 1 і 2 групах.

 Гістограма правильно вирішених завдань для двох груп обстежуваних





Ця гістограма побудована за двома параметрами - кількість правильно вирішених завдань і кількість осіб. Однак якщо ми побудуємо такі гістограми для груп з нерівним числом членів, то зіставити отримані результати буде складно. Це значно легше робити, якщо будуть побудовані процентні (ймовірні) гістограми. У нашому прикладі кожен обстежуваний "важить" 5% (1 з 20). Тому імовірнісна гістограма буде мати наступний вигляд:

 Гістограма правильно вирішених завдань для двох груп обстежуваних





Де Р - ймовірність успішного вирішення тієї чи іншої кількості пунктів тесту.

N - кількість правильно вирішених пунктів тесту

Спираючись на ці дані, можна перейти на мову теорії ймовірностей, використовуючи при створенні, відпрацювання тестів найсучасніші досягнення в цій галузі.

Однак імовірнісні залежності стійкі при досить великій кількості випробувань - від 100 і вище, мінімально 30-40. Тому для отримання достатньо надійних, репрезентативних результатів слід обстежувати до 100-1000 піддослідних.

Наведемо реальні результати, отримані по даному тесту.

Гістограма правильно вирішених завдань для 100 обстежуваних, учнів випускних класів фізико-математичної школи за 10 хвилин





Однак це особи з цілеспрямованою математичною підготовкою. А ось результати обстеження 1000 випускників середніх шкіл даними тестом.

 Гістограма правильно вирішених завдань для 1000 обстежуваних, випускників середніх шкіл





У даному розподілі результати як би симетрично розподілені навколо середнього значення (математичного очікування). Це ознака наближення даного розподілу до так званого нормальному закону розподілу. Нормальний розподіл - одне з найважливіших розподілів в теорії ймовірностей, для якого характерна симетрична крива розподілу. Ступінь пологами цієї кривої залежить від співвідношення

середнього арифметичного і стандартного відхилення.

При відпрацюванні шкал тесту принципово важливо сирі показники (правильно вирішені завдання, бали) наблизити до нормального закону розподілу. Після досягнення нормального розподілу результатів тестування можна переходити до формування тієї чи іншої шкали.

Зокрема в тесті Кеттелла для досягнення нормального розподілу треба було підбирати питання так, щоб тестовані - дорослі люди (чоловіки та жінки) за шкалою А (товариськість) набирали від 0 до 20 балів, але в середньому десь близько

10. Саме так і відпрацьовувався тест - виснажливим підбором питань, які б дійсно ділили людей за характером відповідей на них, і щоб вийшло зрештою нормальний розподіл відповідей.
При цьому для подальшого шкалювання важливо знати середнє арифметичне (математичне очікування) і величину стандартного відхилення. Зв'язок між величиною стандартного відхилення і значенням основних шкал, застосовуваних у психології, акмеології, представлена в наступній таблиці.

(Див .: Гласс Д., Стенлі Д. Статистичні методи в педагогіці і психології. - М .: Прогрес, 1976, с.97; Анастази А. Психологічне тестування. - М., Педагогіка, 1982, кн.1, с. 83; Бурлачук Л.Ф., Морозов С.М. Словник-довідник по психологічній діагностиці. - Київ, 1989, с.101.)

 СПІВВІДНОШЕННЯ

значень різних тестових шкал





Відсоток випадків під кожним стандартним відхиленням описується кривої відповідно з нормальним законом розподілу:



Дані шкали найбільш поширені в психологічних дослідженнях. І майже всі відпрацьовані тести побудовані на застосуванні стандартних шкал. Проте в різних тестах застосовуються дещо різні шкали. Це пояснюється різними причинами. Так, безглуздо застосовувати шкалу Т-балів там, де вона

включає невелику кількість сирих балів. Семантично некоректно IQ-шкалу застосовувати при діагностиці особистісних якостей, хоча соизмерить як відхиляються від середнього рівня інтелектуальні та особистісні якості різних умовних груп

обстежуваних плідно з наукової точки зору. Тому подібна "зв'язок" шкал між собою (через величину стандартного відхилення) дозволяє порівнянно переходити від однієї шкали до

інший, обгрунтовано зіставляти результати тестування різними тестами. Існують спеціальні таблиці переходу, припустимо, від шкали процентилей до Z-оцінками, Т-балам (див .: Кулагін Б.В. Основи професійної псіходіагностікі.- Л., Медицина, 1984, с.189-195) та ін. Однак для практичних цілей

досить точності, яку можна досягти графічно за допомогою наведених залежностей.

Коли відбувається переклад однієї шкали в іншу, важливо щоб результати тестування були сумірні за своєю статистичної структурі, тобто щоб мали нормальний закон розподілу, приблизно однакові стандартні відхилення і т.д.

Інакше можна "втратити", не помітити, "згладити" результати тестування до неприйнятного рівня. Це принципово важливо, коли мова йде про створення експертних систем в психології (не плутати з експертною оцінкою, методом дельфийских Аракуль: в даному випадку під експертними системами розуміється прообраз штучного інтелекту в психології). Ці психодиагностические системи побудовані на основі великої кількості статистичного, логічного матеріалу. Тут повинні бути порівнянні результати тестування різними тестами до найтонших

залежностей, інакше підсумковий прогноз, діагноз буде неточний.

Прикладом такої гібридної експертної системи служить система PSY.
Попередня
Наступна
Перейти до змісту підручника

Інформація, релевантна "СТАТИСТИЧНІ ОСНОВИ шкалювання У тестології"

  1. Режим праці та відпочинку.
    Режим праці та відпочинку - істинний стрижень і основа режиму дня здорового життя людини. Існує неправильна думка про шкідливу дію праці яскравому нібито "знос" організму, надмірна витрата сил і ресурсів, передчасне старіння. Праця як фізичний, так і розумовий не тільки не шкідливий, але, навпаки, систематичний, посильний, і добре організований трудовий процес надзвичайно
  2. Стомлення, його біологічне значення. Вікові показники розумової працездатності. Періодичність працездатності
    Втома - це зниження працездатності, що настало в результаті попереднього праці. Стомлення виникає в результаті гальмування в руховому центрі кори головного мозку. Також певну роль відіграє накопичення кислих продуктів обміну в м'язах, порушення обміну речовин в серці і мозку, гіпоглікемія, під впливом яких порушується нормальний перебіг нервових процесів. Стомлення
  3. ЛЕКЦІЯ №3
    ЛЕКЦИЯ
  4. Характеристика найбільш значущих чинників ризику
    Характеристика найбільш значущих чинників
  5. DANAMI-2 (DANish trial in Acute Myocardial Infarction 2, n = 1572)
    Мета: порівняти результати негайної тромболітичної терапії та перкутанних коронарних втручань, проведення яких вимагало тривалого транспортування хворих з гострим ІМ (елевація ST). Дослідження: багатоцентрове рандомізоване (24 клініки загального профілю; 5 центрів, в яких проводять перкутанні коронарні втручання). Популяція хворих: пацієнти з гострим ІМ у перші 12 год від
енциклопедія  баранина  рагу  молочний  запіканка