Тестването като метод. Подходи към изследването на емоциите

Подобно на процеса на разработка, последващият процес на софтуерно тестване също следва специфична методология. Под методология в този случай имаме предвид различните комбинации от принципи, идеи, методи и концепции, към които прибягвате, докато работите по даден проект.

Днес има доста различни подходи за тестване, всеки със собствени начални точки, времена за изпълнение и методи, използвани на всеки етап. И изборът на един или друг от тях може да бъде доста трудна задача. В тази статия ще разгледаме различни подходи за тестване на софтуер и ще говорим за основните им характеристики, за да ви помогнем да се ориентирате в съществуващото разнообразие.

Каскаден модел (Линеен последователен модел на жизнения цикъл на софтуера)

Моделът Waterfall е един от най-старите модели, който може да се използва не само за разработка или тестване на софтуер, но и за почти всеки друг проект. Основният му принцип е последователният ред на изпълнение на задачите. Това означава, че можем да преминем към следващата стъпка на разработка или тестване само след успешното завършване на предишната. Този модел е подходящ за малки проекти и е приложим само ако всички изисквания са ясно дефинирани. Основните предимства на тази методика са икономическа ефективност, лекота на използване и управление на документацията.

Процесът на тестване на софтуера започва след приключване на процеса на разработка. На този етап всички необходими тестове се прехвърлят от единици към системно тестване, за да се наблюдава работата на компонентите както поотделно, така и като цяло.

В допълнение към предимствата, посочени по-горе, този подход на тестване има и своите недостатъци. Винаги има възможност по време на тестването да бъдат открити критични грешки. Това може да доведе до необходимостта от пълна промяна на един от системните компоненти или дори цялата логика на дизайна. Но такава задача е невъзможна в случая на модела на водопада, тъй като връщането към предишната стъпка е забранено в тази методология.

Научете повече за модела водопад от предишната статия.

V-модел (модел за проверка и валидиране)

Подобно на модела на водопада, техниката на V-модела се основава на директна последователност от стъпки. Основната разлика между тези две методологии е, че тестването в този случай се планира паралелно със съответния етап на разработка. Съгласно тази методология за тестване на софтуера, процесът започва веднага щом се дефинират изискванията и стане възможно да се започне статично тестване, т.е. проверка и преглед, което ви позволява да избегнете възможни софтуерни дефекти на по-късни етапи. За всяко ниво на разработка на софтуер се създава подходящ тестов план, който дефинира очакваните резултати, както и входните и изходните критерии за даден продукт.

Диаграмата на този модел показва принципа на разделяне на задачите на две части. Тези, свързани с дизайна и разработката, са разположени вляво. Задачите, свързани с тестване на софтуер, са разположени вдясно:

Основните стъпки на тази методология може да варират, но обикновено включват следното:

сцена определяне на изискванията. Тестването за приемане се отнася за този етап. Основната му задача е да оцени готовността на системата за крайно използване
Етапът, на който възниква дизайн на високо ниво или дизайн на високо ниво (HDL). Този етап е свързан с тестване на системата и включва оценка на съответствието с изискванията за интегрирани системи
Фаза на детайлен проект(Детайлен дизайн) е паралелен с фазата на интеграционното тестване, по време на която се проверяват взаимодействията между различни системни компоненти
След етап на кодиранеЗапочва още една важна стъпка – тестване на единици. Много е важно да се гарантира, че поведението на отделните части и компоненти на софтуера е правилно и отговаря на изискванията

Единственият недостатък на разглежданата методология за тестване е липсата на готови решения, които биха могли да се приложат за премахване на софтуерни дефекти, открити по време на етапа на тестване.

Инкрементален модел

Тази методология може да се опише като многоетапен модел за тестване на софтуер. Работният процес е разделен на няколко цикъла, всеки от които също е разделен на модули. Всяка итерация добавя определена функционалност към софтуера. Увеличението се състои от три цикъла:

проектиране и разработка
тестване
изпълнение.

При този модел е възможно едновременното разработване на различни версии на продукт. Например, първата версия може да е в процес на тестване, докато втората е в процес на разработка. Третата версия може да преминава през фазата на проектиране по същото време. Този процес може да продължи до края на проекта.

Очевидно тази методология изисква откриване на възможно най-много грешки в тествания софтуер възможно най-бързо. Такава е и фазата на внедряване, която изисква потвърждение, че продуктът е готов за доставка до крайния потребител. Всички тези фактори значително увеличават тежестта на изискванията за тестване.

В сравнение с предишните методологии, инкременталният модел има няколко важни предимства. Той е по-гъвкав, променящите се изисквания водят до по-ниски разходи, а процесът на тестване на софтуера е по-ефективен, тъй като е много по-лесен за тестване и отстраняване на грешки чрез използването на малки итерации. Заслужава обаче да се отбележи, че общата цена все още е по-висока, отколкото в случая на каскадния модел.

Спирален модел

Спираловият модел е методология за тестване на софтуер, която се основава на поетапен подход и създаване на прототипи. Състои се от четири етапа:

Планиране
Анализ на риска
развитие
Степен

Веднага след приключване на първия цикъл започва вторият. Тестването на софтуера започва на етапа на планиране и продължава до етапа на оценка. Основното предимство на спиралния модел е, че първите резултати от теста се появяват веднага след появата на резултатите от теста в третия етап на всеки цикъл, което помага да се осигури правилна оценка на качеството. Важно е обаче да запомните, че този модел може да бъде доста скъп и не е подходящ за малки проекти.

Въпреки че този модел е доста стар, той остава полезен както за тестване, така и за разработка. Освен това, основната целмного методологии за тестване на софтуер, включително спиралния модел, са променени напоследък. Използваме ги не само за откриване на дефекти в приложенията, но и за да разберем какво ги е причинило. Този подход помага на разработчиците да работят по-ефективно и бързо да коригират грешки.

Прочетете повече за спиралния модел в предишната публикация в блога.

Пъргав

Методологията на гъвкавото (Agile) разработване и тестване на софтуер може да се опише като набор от подходи, фокусирани върху използването на интерактивна разработка, динамично формиране на изисквания и осигуряване на тяхното изпълнение в резултат на постоянно взаимодействие в рамките на самоорганизиращ се работна група. Повечето гъвкави методологии за разработка на софтуер се фокусират върху минимизиране на риска чрез разработване на кратки итерации. Един от основните принципи на тази гъвкава стратегия е възможността за бърза реакция на възможни промени, вместо да се разчита на дългосрочно планиране.

Научете повече за Agile(забележка - статия на английски).

Екстремно програмиране (XP, екстремно програмиране)

Екстремното програмиране е един пример за гъвкава разработка на софтуер. Отличителна чертаТази методология е „програмиране по двойки“, ситуация, при която един разработчик работи върху код, докато негов колега непрекъснато преглежда написания код. Процесът на тестване на софтуера е доста важен, защото започва още преди да е написан първият ред код. Всеки приложен модул трябва да има единичен тест, така че повечето грешки да могат да бъдат коригирани на етапа на кодиране. На другите отличителна чертае, че тестът определя кода, а не обратното. Това означава, че определена част от кода може да се счита за завършена само ако всички тестове преминат успешно. В противен случай кодът се отхвърля.

Основните предимства на тази методология са постоянното тестване и кратките версии, което помага да се гарантира високо качествокод.

Scrum

Scrum е част от методологията Agile, итеративна инкрементална рамка, създадена за управление на процеса на разработка на софтуер. Съгласно принципите на Scrum, екипът за тестване трябва да участва в следните етапи:

Участие в планирането на Scrum
Поддръжка на модулно тестване
Тестване на потребителски истории
Сътрудничете с клиента и собственика на продукта, за да определите критериите за приемане
Осигуряване на автоматизирано тестване

Освен това членовете на QA отдела трябва да присъстват на всички ежедневни срещи, както и други членове на екипа, за да обсъдят какво е тествано и направено вчера, какво ще бъде тествано днес и цялостния напредък на тестването.

В същото време принципите на Agile методологията в Scrum водят до появата на специфични характеристики:

Оценката на усилията, необходими за всяка потребителска история, е задължителна
Тестерът трябва да внимава за изискванията, тъй като те могат постоянно да се променят
Рискът от регресия се увеличава с чести промени в кода
Едновременно планиране и изпълнение на тестове
Неразбирателство между членовете на екипа, когато изискванията на клиента не са напълно ясни

Научете повече за методологията Scrum от предишната статия.

Заключение

В заключение е важно да се отбележи, че днес практиката за използване на една или друга методология за тестване на софтуер предполага многоуниверсален подход. С други думи, не трябва да очаквате, че една методология ще бъде подходяща за всички видове проекти. Изборът на един от тях зависи от голямо числоаспекти като вида на проекта, изискванията на клиента, срокове и много други. От гледна точка на софтуерното тестване, някои методологии са склонни да започнат тестване в началото на разработката, докато други са склонни да изчакат, докато системата е напълно готова.

Ако имате нужда от помощ при разработката или тестването на софтуер, специален екип от разработчици и QA инженери е готов да тръгне.

В превод от английски „тест“ означава тест, изпитание, проверка. В психологията, социологията, педагогиката и други хуманитарни науки тази дума се използва като термин, обозначаващ система от задачи, подбрани по такъв начин, че да е възможно точно и разумно да се характеризират специфичните характеристики на индивидите, които са изпълнили тези задачи. Те се конструират, проверяват, използват и тълкуват по строги правила, независими от спецификата на дадена наука, предназначени да гарантират качеството на заключенията.

Нека разгледаме метод на изследване, който включва анализ на дейността на субекти с такива задачи. В психодиагностиката тестването се разбира като стандартизиран тест, предназначен да установи количествени (и качествени) индивидуални психологически различия. Подчертавайки точността на изчисляване на резултатите и максималното им изолиране от влиянието на хората, организиращи тази процедура, тестването често се говори като „измерване“ на психичните характеристики.

трябва да бъде отбелязано че ключова концепцияв горната дефиниция - стандартизация. Какво е?

Първо, това означава еднакви изисквания за всички условия на изпитване и инструкции за провеждането му и обработката на резултатите. Обвързан различни лицатестът се прилага еднакво, съгласно един и същ стандарт. Това дава известна гаранция за изравняване на ситуационни фактори, които могат да поставят някои субекти в по-изгодна позиция в сравнение с други. Без стандартизация сравнението на индивидуалните резултати става невъзможно.

Например инструкциите обикновено се представят в писмен вид или (по-рядко) се четат, но не се формулират по никакъв начин по памет, с вашите собствени думи. След това на никого не се дават лични обяснения, индивидуални коментари и т.н.

На второ място, стандартизацията се отнася до превода на първичните („сурови“) тестови резултати, отразяващи броя на изпълнените задачи, в по-обобщена скала, която характеризира степента на индивидуално изразяване на дадено умствено свойство или функция.

Да кажем, че при извършване на тест за интелигентност субектът е решил успешно определен брой задачи. Знаейки само това, все още не можем да кажем нищо за нивото му на интелигентност. Всъщност много или малко са направили? Добър или лош беше тестът за него? Колко често се среща този индикатор при другите? Колко задачи трябва да бъдат изпълнени, за да се демонстрира високо ниво на интелигентност?

Невъзможно е да се отговори на всички тези въпроси без да има обща референтна рамка, определен стандарт. Последното обикновено е резултат от тестване на голяма и представителна извадка. Чрез сравняване на един субект с други, които преди това са направили същия тест, ние стандартизираме според статистическата норма. Напоследък все по-често се използва малко по-различен тип стандартизация, когато резултатите на тествания субект се сравняват не с други резултати, а с описание на изискванията на обществото за развитието на дадена функция или свойство, тоест със социално-психологичен стандартен. Както и да е, стандартизацията дава възможност за преминаване от информация за изпълнението на конкретен тест от едно или друго лице към психологически характеристики, което е в основата на еднаквостта на интерпретацията.

Нека се обърнем към историята на началния етап на развитие на метода за изпитване.

Известно е, че още в древността е имало повече или по-малко стандартни процедури за идентифициране на индивидуалните различия между хората. Така в Китай преди повече от четири хиляди години висшите служители трябваше да преминат строг изпит в присъствието на императора за познаване на ритуали и церемонии, стрелба с лък, конна езда, умение да пишат, смятат и свирят. В древен Вавилон и Египет кандидатът за длъжността писар трябваше да докаже, че притежава съответните умения, разбира финанси, закони, селско стопанство. Библията описва уникални начини за подбор на воини за особено трудни и опасни задачи, в зависимост от действията им на почивка. В древна Гърция и Рим са разработени много подробни класификации на характерите и моделите на тяхното определяне въз основа на поведенчески характеристики...

Въпреки че всичко това и много повече исторически предшестват тестовете, появата на научни тестове трябва да се датира едва в края на деветнадесети век. Самият термин е въведен от създателя на първите антропометрични тестове Франсис Галтън (1822 -1911), който се занимава с изследване на остротата на зрението и слуха, мускулната сила и др. Но най-голяма популярност този термин придобива след публикуването на статията „Психически тестове и измервания“ през 1890 г., написана от американския психолог, основател на съвременното тестване, Джеймс Кател (1860-1944). В тази статия Кател пише, че прилагането на поредица от статистически обработени задачи към голям брой индивиди допринася повече от всичко друго за превръщането на психологията в точна наука. Той беше първият, който изрази идеята за необходимостта от стандартизиране на изпитната ситуация.

Кател разработи няколко десетки теста, насочени към оценка на елементарни сензомоторни процеси (чувствителност, време за реакция, брой звуци, възпроизведени след едно слушане и др.).

Доста бързо възниква необходимостта тестовете да се съсредоточат върху висшите умствени функции. Качественият пробив в тази насока се свързва с името на Алфред Бине (1857-1911), който съставя поредица от тестове за интелигентност по поръчка на френското Министерство на образованието през 1905 г.

Тестването по скалата на Binet започна с представянето на задачи, съответстващи на хронологичната възраст на детето (тоест тези, които бяха успешно решени от огромното мнозинство от неговите връстници). Ако се справи успешно с работата, му беше предложен материал, предназначен за по-големи деца. Ако детето реши само част от новите задачи, тестът се спира. В същото време няколко месеца умствена възраст бяха добавени към броя на годините на основната умствена възраст (тази, в която всички задачи са решени) (пропорционално на броя на решените задачи за по-възрастните). Ако детето не можеше да се справи с всички задачи от своята възрастова група, му се даваше материал за по-малките, докато достигне възраст, за която всички задачи бяха успешно решени.

Според А. Бине характеристиката на интелигентността е разликата между умствената и хронологичната възраст. Въпреки това, както е лесно да се види, една и съща разлика за едно или друго възрастово ниво придобива различни значения. Това обстоятелство е много неудобно. За да го елиминира, немският психолог Уилям Стърн (1875-1938) предлага през 1912 г. да се определи не разликата, а съотношението (коефициентът) на умствената и хронологичната възраст, т.е. като се разделят показателите един на друг. Той нарече полученото число, умножено по 100, коефициент на интелигентност (IQ).

Имайте предвид, че повечето съвременни тестове за интелигентност приемат различна процедура за определяне на коефициента, предложена от американския психолог и психиатър Дейвид Уекслър (1896-1981). Базира се на използването на единица стандартни отклонения, която показва как резултатите на тествания субект се сравняват с интелигентността на групата му връстници.

Създадените в началото на века тестове бяха индивидуални. Само висококвалифицирани психолози могат да ги използват. По време на Първата световна война в Америка възниква необходимостта от масови прегледи на наборниците за тяхното оптимално разпределение, като се вземат предвид индивидуалните особености. От името на Министерството на войната Артър Отис (1888-1963) разработва първите групови тестове - "алфа" и "бета". Една от формите беше предназначена да определи интелигентността на хората, които познават добре английски език, а другата беше насочена към полуграмотници и чужденци. Тези тестове са значително опростени по отношение на процедурата за кандидатстване и оценка на резултатите.

От 20-те години започна широко тестване по целия свят. В същото време, наред с тестовете за обща интелигентност, започнаха активно да се развиват по-специфични тестове за специални способности и професионални постижения, по-близки до нуждите на ежедневната диагностична практика. През 30-те – 40-те години. Провежда се формиране на психодиагностика на личността, осъществявана с помощта на тестове, въпросници и проективни техники.

Тогава всички психодиагностични изследвания в СССР бяха прекратени за няколко десетилетия. Това е следствие от резолюцията на Централния комитет на Всесъюзната комунистическа партия на болшевиките, която осъжда (1934 г.) съществуващата тогава педология - наука за цялостното изследване на детето с помощта на набор от методи на психология, анатомия, физиология, медицина и педагогика.

В момента, както у нас, така и по света, тестването е един от основните методи на психологическо изследване. Инструментите му се развиват динамично, а методите за обработка и интерпретация на информация непрекъснато се подобряват.

Един от най-важните въпроси при разработването на тестове е необходимостта от внимателно идентифициране на качеството на измерването. Така наречените „популярни тестове“ понякога се отпечатват на задните страници на списанията. В домашните училища все повече се използват „тестове за учители“. В тесния смисъл на думата и двата не могат да бъдат класифицирани като тестове, тъй като не са установени показатели за тяхната надеждност и валидност.

Надеждността е устойчивостта на теста към шум, независимостта на неговите резултати от действието на случайни фактори.

Възможно ли е да се използва тестът в бъдеще, ако на етапа на проверка на качеството му участниците всеки път получават оценки, които значително се различават от предишните им резултати? В края на краищата, ако изследваната черта е стабилна по природа, тогава резултатите от многократно тестване на едни и същи индивиди трябва да бъдат подобни, почти не се различават от получените преди това. Надеждността е характеристика на точността на измерването. Тя ви позволява да прецените до каква степен можете да се доверите на данните от тестовете.

Причините за липсата на надеждност на теста са:

- разнообразие от ситуационни условия на изпитване, променящи се от един случай на друг (разлики в поведението на изпитващия, наличие на външни смущения, нежелано присъствие на други хора, променливост на осветеността на помещението и температурата на въздуха и др.);
- несъвършенство на разработения тест (неясни инструкции, фундаментална разнородност на задачите, допускане на елементи на субективност при интерпретиране на изпълнението и др.);
- промени във вътрешните състояния на субектите (умора, раздразнение, апатия, нервност и др.), както и отношението им към тестването.

Максималното елиминиране на горните причини допринася за постигане на приемлива надеждност на теста.

Количественият израз на тази характеристика са коефициентите на надеждност. Всеки от тях осветява някакъв аспект, определен аспект на точността на измерване. Преди да преминем към разглеждане на видовете надеждност, отбелязваме, че процедурата за изчисляване на стойностите на коефициента обикновено включва установяване на корелация на ранговете на всички членове на извадката, по отношение на които тестът се проверява от компилаторите преди въвеждането в психодиагностичната практика. Поради факта, че корелационният анализ се изучава допълнително като самостоятелен метод, ще посочим само едно нещо: колкото по-голяма е стойността на коефициента на надеждност, толкова по-постоянно е мястото (рангът) на субектите спрямо всички останали рангове в проба. С други думи, позицията на резултатите от всеки предмет в общата поредица от показатели за изпълнение на теста трябва да се поддържа всеки път.

На практика най-често се използват следните типове на тази тестова характеристика:

1. Надеждност на тест-повторен тест, определена чрез многократно тестване на едни и същи индивиди.

Тук има един проблем: ако интервалът от време между тестовете е кратък, тогава влиянието на тренировъчния ефект е забележимо, но ако интервалът от време е значителен, тогава изследваната черта може да се промени през този период. Въпреки това, надеждността на теста-ретест е важна характеристика; тя ни позволява да установим степента на независимост на резултатите от теста от влиянията на хората, които го провеждат, както и от възможни промени в изпитните ситуации.

Счита се за необходимо коефициентът на такава надеждност да бъде не по-нисък от 0,80. В противен случай точността на измерване е недостатъчна и процедурата за тестване изисква допълнителна стандартизация.

2. Надеждност на тестовите части, която характеризира степента на хомогенност (или, както се казва, хомогенност) на всички негови задачи. Това е доказателство, че разработеният тест отразява текущото състояние само на един психичен феномен и всички негови задачи са взаимно последователни, последователни и неразличаващи се.

Най-често, за да използвате този метод, задачите се разделят на четни и нечетни. Резултатите от хората, изпълняващи и двете, се обработват отделно и след това се сравняват.

Тестът се счита за надежден, ако коефициентът, получен от сравнението, надвишава 0,75. В случай, че този индикатор не достигне определената стойност (и това не е необичайно при разработването на тест), компилаторът трябва да определи кои задачи трябва да бъдат повторени или премахнати от употреба.

3. Надеждността на паралелните форми се установява, ако съставителят е разработил няколко взаимозаменяеми комплекта задачи, т.е. такива, които са много сходни по съдържание, но не са идентични, наподобяващи варианти на задачи от училищен тест.

Приетата процедура за определяне на такава надеждност предвижда, че пробата се разделя на две равни части, след което на една от тях се предлага първата форма на теста, а на другата се предлага втората. След известно време тестването се повтаря, но в обратен ред. Коефициентът на надеждност се установява чрез метода на корелационния анализ на резултатите от двата теста. Стойността му не трябва да бъде по-малка от 0,75. В противен случай се налага да се провери степента на стандартизация на теста и да се промени съдържанието на тези задачи, които се оказаха несъвместими с техните аналози от паралелната форма.

И така, надеждността на теста характеризира степента на точност на измерването, без да се отчита какво точно се измерва. Предпоставка е за наличието на др важно качество- валидност.

Валидността (от английски „валиден“, „подходящ“, „валиден“) е сложна характеристика на теста, показваща валидността и ефективността на неговото използване.

В класическата тестология има много видове валидност. Нека анализираме най-често срещаните от тях.

Такава валидност е от особено значение при тестовете, свързани с критерии (CRT) и тестовете за постижения, които са обсъдени по-долу.

2. Конструктната валидност отразява степента на корелация на резултатите от теста с теоретичните концепции (конструкти), които са основни за него. Определя се, когато предметът на измерване съществува в имплицитна, сложна форма и изисква специален анализ.

Например, ако се разработва тест за определяне на степента на разбиране на речта, тогава е необходимо най-малкото да се разбере кои компоненти съставляват тази конструкция. Изберете от предоставения тук списък само онези елементи, които се отнасят до „разбиране на речта“:

- детето може да отговаря на въпроси;
- той е много внимателен, когато слуша;
- умее да преразказва чутото със свои думи;
- може да запомни текста дума по дума от първия път;
- умее да съставя план на текста;
- той задава много въпроси на експериментатора за това, което е чул...

Очевидно само някои от тях имат отношение към разглежданата конструкция. След като анализираме проблема, можем впоследствие да създадем задачи, които отразяват различни аспектиразбиране на речта.

След това се формулират серия от хипотези за това как данните от разработвания тест ще корелират с широк набор от други тестове, насочени както към близки, така и към далечни конструкти. Хипотезите се проверяват с помощта на методите на корелационен и факторен анализ. Потвърждението или опровержението на набора от теоретично очаквани връзки става характеристика на конструктивната валидност на теста.

3. Валидността на критерия показва как резултатите от изпитването корелират с онези оценки на измереното качество или свойство, които са получени чрез други (нетестови) методи, а именно: със становищата на специалисти, наблюдения и експериментални данни, анализ на продуктите на дейности на субекти и др. Може да бъде два вида:
- - текуща валидност, когато резултатите от теста се сравняват с данни от други източници, събрани едновременно с тестването;
- - прогностична (предсказуема) валидност, когато резултатите от теста се сравняват с по-късното поведение на субекта в дадена област. Например, резултатите от тестването на академичните постижения в випуска могат да бъдат потвърдени или опровергани от факти за приемането на членове на извадката във висшите учебни заведения.

Понякога по отношение на някои от описаните видове валидност се използва обозначението „емпирична валидност”. Така се наричат онези от тях, при определяне на степента на изразеност на които са използвали статистически методианализ на данни, т.е. коефициентите са изчислени чрез корелации.

Как характеристиките на емпиричната валидност и надеждността са свързани една с друга?

Докато високата надеждност на теста показва, че той измерва точно нещо, високата валидност показва, че тестът измерва точно това, за което е предназначен да измерва. Следователно коефициентите на валидност не могат да надвишават стойностите на коефициентите на надеждност.

И двете разглеждани характеристики със сигурност се определят от съставителите по време на подготовката на теста. Психолог, който използва тест в работата си, получава представа за качеството на измерването. Трябва също така да се каже, че тестовете, които са заети и преведени на друг език, обикновено се тестват отново за надеждност и валидност. Без това е невъзможно да се прецени качеството на тяхната социокултурна адаптация към новите условия на употреба.

Случва се тестът да има достатъчна валидност и надеждност, но въпреки това почти не намира приложение в изследователската практика. Това може да се дължи на прекомерната сложност на процедурата за интерпретация, прекалено високите изисквания към квалификацията на тестера, значителната интензивност на труда и продължителността на прилагане и т.н. Необходимо е да се разгледа друга характеристика на психологическото измерване като значима - неговата рентабилност .

Икономичността се разбира като осъществимостта на използването на тест, определена от наличието на приемливо съотношение на разходите за тестване (време, труд, финанси) и ползите от него.

Горното, разбира се, не означава, че тестването трябва непременно да бъде лесно, кратко и „евтино“, дори в ущърб на други качества на измерване. Това е заа именно приемливия баланс между надеждност, валидност и икономичност.

Нека да преминем към изучаването на основните видове тестове. За целта ще използваме една от най-разпространените класификации. В зависимост от тълкуването на изпълнението, тестовете се разделят на два вида:

- ориентиран към статистическата норма;
- критериално ориентиран (KORT).

Първият от тях включва използването на традиционен метод на математическата статистика - "нормализиране" на резултатите. Какво е?

Процедурата за разработване на такъв тест задължително включва установяване на стандарти за неговото изпълнение чрез предварително тестване на представителна извадка от хора, за които е предназначен. В този случай се разкрива диапазон от тестови резултати, който е характерен за ниско ниво на развитие на дадено умствено свойство или функция, средно ниво и високо ниво. Впоследствие резултатите на тествания субект се сравняват с данните, получени по време на тестването на извадката, като по този начин се определя неговото относително място в общата серия.

Трябва да се отбележи, че задачите на теста, ориентирани към статистическата норма, са подбрани така, че резултатите от изпълнението им от извадката да се доближават до кривата на нормалното разпределение на Гаус.

Описание на такова разпределение на резултатите може да се направи с помощта на два показателя: средно аритметично (x) и стандартно отклонение (y). И двете се получават чрез прости изчисления:

формула за средно аритметично и стандартно отклонение

Където n е броят на членовете на извадката, ?N е сумата от получените от тях резултати, ?d е сумата от стойностите на всички индивидуални отклонения от средната аритметична стойност.

За нормално разпределение на резултатите се счита това, при което 68% от субектите са в рамките на едно стандартно отклонение (x ± y) (т.е. 34% са под средното, 34% са над средното). Тогава 94,45% от субектите ще останат в рамките на две стандартни отклонения, а почти всички от тях (99,73%) ще останат в рамките на три стандартни отклонения. Защо е необходимо всичко това?

По този начин се постига способността да се класифицират субектите спрямо цялото население, тоест да се прецени, че те са включени в група хора с показатели над или под нормата.

За по-лесна работа, „суровите“ резултати се преобразуват в стандартни единици (стандартизация). При запазване на относителните позиции на субектите, средната аритметична стойност и стандартното отклонение се променят чрез добавяне на определена константа към всяка отделна стойност. Няколко такива стандартни нормални скали се използват широко в психологията. Например, скалата на Т-резултат има средно аритметично 50 и стандартно отклонение 10, а да речем, скалата на IQ има средно 100, с стандартно отклонение 15 и т.н.

Тези показатели се тълкуват по следния начин: всички резултати, които не надхвърлят границите (x ± y), са в нормални граници. Тези хора, които са получили стойност на IQ под 85 на тест за интелигентност, са под нормата, а тези, чиито резултати са над 115, са над нормата, освен това резултатите от 115 до 130 се тълкуват като „малко над нормата“, и от 130 до 145 - „значително над нормата“. Резултатите, които са под нормата, се класифицират съответно.

Тестовете, базирани на критерии, не предполагат такова сравнение на данните на субектите с резултатите от предварителното тестване на извадката. Те вземат за отправна точка не нормалното разпределение, а определен обем от изисквания на обществото за умственото и личностно развитие на неговите членове. Това явление, което е много общо по природа, се изразява в набор от специфични критерии, разработени от съставителите.

Формулировката на всеки такъв критерий има две части:

- съдържателно-оперативни, ясно характеризиращи характеристиките на действията на тестовите субекти при изпълнение на тестови задачи (като „обяснява“, „изчислява“, „разделя“, „избира“ и др.);
- свързани с темата, описващи подробно този или онзи фрагмент от съдържанието на областта на знанието въз основа на материала, от който са съставени тестовите задачи. Обикновено тази част се уточнява в хода на анализа от съставителите на учебни програми, образователни стандарти, съществуващи учебни помагала и насоки.

С други думи, една част от критерия определя как трябва да се извърши работата (как), а другата - какво трябва да се направи от това, което се цели да се научи (какъв материал).

Разбира се, не всяка област на знанието се поддава на последователна формализация и изразяване под формата на набор от критерии. CORTS, като правило, се разработват за диагностициране на формирането на умствени действия, както и за наблюдение на състоянието на знанията, уменията и способностите на учениците. В тези случаи използването им позволява, според А. Анастази, интерпретация с акцент върху „какво може и какво прави индивидът, а не върху това как изглежда в сравнение с другите“.

В наши дни тестовете, чиято интерпретация на представянето е фокусирана върху статистическата норма, са значително по-разпространени.

В зависимост от обекта на измерване се разграничават тестове:

- интелигентност, осигуряваща изследване на нивото на развитие на мисленето и когнитивните процеси като цяло;
- способности, оценяващи способността за учене, възможността и лекотата на овладяване на определени знания, умения и способности. Те включват тестове за общи и специални способности;
- постижения, които определят обучението, тоест нивото на овладяване на знания, умения и способности във всяка област (академична, професионална, спортна);
- индивиди, насочени към изучаване на различни аспекти на личностното развитие, като интереси, мотиви, емоции, взаимоотношения и др.;
- междуличностни, включващи оценка на човешките взаимоотношения в група, идентифициране на спецификата на комуникационните процеси.

Според естеството на тестовите задачи се разграничават следните видове тестове:

- словесно, чийто материал е представен в словесна форма;
- фигуративен, където субектите работят с рисунки, диаграми въз основа на възникнали визуални идеи;
- практически, изпълнявани при манипулиране на реални обекти или техни заместители;
- комбинирани, съчетаващи както вербален, така и невербален материал за задачи.

Въз основа на формата на представяне на задачите тестовете се разделят на празни („хартия и молив“), инструментални, чертежни и устни.

В зависимост от броя на предметите тестовете се делят на индивидуални и групови.

Има два вида тестове въз основа на времето за изпълнение:

- бързина, при която основният показател за работата на изпитваните е скоростта на решаване на задачите. Оценява се или общият брой правилно изпълнени задачи за определеното време, или времето, изразходвано за попълване на теста;
- ефективност, при която показателят за скоростта на работа на изпитваните няма корелация с резултатите от теста и не им влияе. Времето (ако има такова) не е строго, то служи единствено за осигуряване на стандартизация на измервателната процедура.

Трябва да се отбележи, че в психодиагностичната практика наред с тестовете намират активно използване личностни въпросници. Това са техники, чиито задачи са представени под формата на въпроси или твърдения. Задачата на субекта е да дава писмени или устни отговори, да предоставя информация за себе си, да изразява отношение и да формулира мнение.

В основата си въпросниците включват субективен самоотчет от субекта. Въпросниците за личността се различават от въпросниците, които ще разгледаме подробно по следното:

1) фокус върху изучаването на психологически характеристики;
2) стандартизиране на процедурите за кандидатстване и тълкуване;
3) разчитане на съдържанието на определена научна концепция, теория;
4) наличието на стандарти за изпълнение или съответни критерии за развитие, по отношение на които се извършва стандартизацията на индивидуалните резултати.
5) проверка на степента на валидност и надеждност.

Всичко това, както и често по-умелото формулиране на въпросите, прикривайки тяхната диагностична специфика, и внимателното развитие на контрола върху надеждността и искреността на отговорите („скали на лъжата“), ни позволяват да ги считаме за „тестове с въпросник“, а не за методи на самонаблюдение или традиционно разпитване.

Примери за такива въпросници са Минесотският многомерен личностен опис (MMPI), разработен от S. Hathway и J. McKinley през 1940 г. и все още широко използван в клиничната психодиагностика, и Pathocharacterological Diagnostic Questionnaire (PDI), предложен от A. E. Lichko (1970) . ) за определяне на психопатичното развитие на личността и акцентуациите на характера, методът на многофакторното изследване на личността на R. Cattell (16-факторен въпросник) и др.

В заключение трябва да се отбележи, че използването на тестови методи за изследване изисква както общи психологически познания, така и компетентност в теорията и практиката на измерване. Факт е, че изучаването на сложни психични явления не се свежда до чисто „технически“ дейности за представяне на задачи и записване на решения. Липсата на квалификация често води до загуба индивидуален подход, груби дефекти в интерпретацията на резултатите, увеличаване на броя на грешките при организирането на процедурата за изпитване.

Тестване

Тестването (на английски test - тест, проверка) е експериментален метод на психодиагностика, използван в емпиричните социологически изследвания, както и метод за измерване и оценка на различни психологически качества и състояния на индивида.

Появата на тестологичните процедури се дължи на необходимостта от сравнение (сравняване, разграничаване и класиране) на индивидите според нивото на развитие или степента на изразяване на различни психологически качества.

Основателите на тестването са Ф. Галтън, С. Спирман, Дж. Кател, А. Бине, Т. Саймън. Самият термин „ментален тест“ е измислен от Кател през 1890 г. Началото на развитието на съвременната тестология за масово използване на тестове в практиката се свързва с името на френския доктор Бине, който в сътрудничество със Симон разработи метрична скала за умствено развитие, известна като "тест на Бине-Симон".

Широкото разпространение, развитие и подобряване на тестовете е улеснено от редица предимства, които този метод предоставя. Тестовете ви позволяват да оцените дадено лице в съответствие с заявената цел на изследването; осигуряват възможност за получаване на количествена оценка въз основа на количественото определяне на качествените параметри на личността и удобството на математическата обработка; са сравнително бърз начин за оценка на голям брой непознати лица; допринасят за обективността на оценките, които не зависят от субективните нагласи на лицето, което провежда изследването; гарантират сравнимостта на информацията, получена от различни изследователи по различни теми.

Тестовете изискват:

Строго формализиране на всички етапи на тестване,

Стандартизиране на задачите и условията за изпълнението им,

Количествено определяне на получените резултати и тяхното структуриране по зададена програма,

Интерпретация на резултатите въз основа на предварително получено разпределение за изследваната характеристика.

Всеки тест, който отговаря на критериите за надеждност, в допълнение към набор от задачи включва следните компоненти:

1) стандартни инструкции за предмета относно целта и правилата за изпълнение на задачите,

2) ключ за мащабиране - корелация на задачите със скали на измерените качества, показващи коя задача принадлежи към коя скала,

4) ключът за интерпретиране на резултантния индекс, който представлява данните за нормата, с които се корелира полученият резултат.

Традиционно нормата при тестването е средната статистическа информация, получена в резултат на предварително тестване на определена група хора. Тук е необходимо да се има предвид, че интерпретацията на получените резултати може да се пренесе само върху онези групи субекти, които по своите основни социокултурни и демографски характеристики са сходни с основната.

За да се преодолее основният недостатък на повечето тестове, се използват различни техники:

1) увеличаване на базовата извадка с цел повишаване на нейната представителност в Повече ▼параметри,

2) въвеждане на корекционни коефициенти, като се вземат предвид характеристиките на извадката,

3) въвеждане в практиката на тестване на невербален метод за представяне на материал.

Тестът се състои от две части:

а) стимулиращ материал (задача, инструкция или въпрос)

б) инструкции относно регистриране или интегриране на получените отговори.

Типичната за тестовете стандартизация на ситуацията им осигурява, за разлика от „свободното“ наблюдение на поведението, по-голяма обективност на резултатите.

Тестовете се класифицират по различни критерии.

Въз основа на типа личностни черти те се разделят на тестове за постижения и личностни тестове. Първите включват тестове за интелигентност, тестове за училищни постижения, тестове за креативност, тестове за способности, сензорни и двигателни тестове. Втората включва тестове за нагласи, интереси, темперамент, характерологични тестове, мотивационни тестове. Въпреки това, не всички тестове (например тестове за разработка, графични тестове) могат да бъдат сортирани според този критерий. В зависимост от вида на инструкциите и начина на приложение се различават индивидуални и групови тестове. При груповото тестване група предмети се изследват едновременно. Въпреки че няма времеви ограничения при тестовете за ниво, те са задължителни при тестовете за скорост. В зависимост от степента, в която субективността на изследователя се проявява в резултат на тестването, се разграничават обективни и субективни тестове.

Повечето тестове за постижения и психофизиологични тестове са обективни, докато проективните тестове са субективни. Това деление до известна степен съвпада с разделението на директни и косвени тестове, които се различават в зависимост от това дали изследваните знаят или не знаят смисъла и целта на теста.

За проективните тестове типична ситуация е, когато субектът не е информиран за действителната цел на изследването. При изпълнение на проективни тестови задачи няма „правилни“ отговори. В зависимост от представянето на речевия компонент в теста се разграничават вербални и невербални тестове. Вербалният, например, е тест за лексикон, невербален - тест, който изисква определени действия като отговор.

Според формалната си структура тестовете се различават от простите, т.е. елементарни, чийто резултат може да бъде единичен отговор, и комплексни тестове, състоящи се от отделни подтестове, за всеки от които трябва да се постави оценка. В този случай могат да се изчислят и общи оценки. Набор от няколко единични теста се нарича тестова батерия, графичното представяне на резултатите за всеки подтест се нарича тестов профил. Доста често тестовете включват въпросници, които отговарят на редица изисквания, които обикновено се прилагат този методсъбиране на психологическа или социологическа информация.

Напоследък тестовете, базирани на критерии, стават все по-широко разпространени, позволявайки на тествания субект да бъде оценен не в сравнение със средните данни за населението, а по отношение на предварително определена норма. Критерият за оценка при такива тестове е степента, в която резултатът от теста на индивида се доближава до така наречената „идеална норма“.

Разработването на теста се състои от четири етапа.

На първия етап се разработва първоначалната концепция с формулирането на основните тестови точки или основни въпроси от предварителен характер;

На втория етап се избират предварителни тестови елементи с последващ подбор и редуциране до окончателния вид, като в същото време се извършва оценка по качествени критерии за надеждност и валидност;

В третия етап тестът се тества повторно върху същата популация;

На четвъртия етап се калибрира по отношение на възрастта, нивото на образование и други характеристики на населението.

На всички етапи от разработването на теста е необходимо да се вземе предвид:

а) диагностично свойство на личността (размер, позиция, показател) или само неговите наблюдаеми прояви (например способности, ниво на знания, темперамент, интереси, нагласи);

б) свързано валидиране на метода, т.е. определяне колко добре измерва необходимото свойство;

в) размера на извадката от популацията, върху която трябва да се оцени методът;

г) стимулиращ материал (таблети, изображения, играчки, филми);

д) влиянието на изследователя в процеса на инструктиране, поставяне на задачи, обяснение, отговаряне на въпроси;

е) условията на ситуацията;

ж) такива форми на поведение на субекта, които показват измерваното свойство;

з) мащабиране на съответните форми на поведение;

i) консолидиране на резултатите за отделни измерени елементи в общи ценности(например сумиране на отговори като „Да“);

й) формулиране на резултатите в стандартизирана рейтингова скала.

Един от вариантите на теста може да бъде въпросник, но при условие, че отговаря на изискванията за тестове. Въпросникът е набор от въпроси, които са подбрани и подредени един спрямо друг в съответствие с необходимото съдържание. Въпросниците се използват например за психодиагностични цели, когато от субекта се изисква да оцени своето поведение, навици, мнения и др. В този случай субектът, отговаряйки на въпроси, изразява своите положителни и отрицателни предпочитания. С помощта на въпросници можете да измервате оценките на субектите за други хора. Задачата обикновено действа като директен отговор на въпроси, на които трябва да се отговори чрез съжаление или опровержение. Възможностите за отговор в повечето случаи са дадени и изискват само знак под формата на кръст, кръг и др. Недостатъкът на въпросника е, че субектът може да симулира или прикрие определени личностни черти. преодолявам заявен недостатък(макар и не напълно) изследователят може чрез контролни въпроси, контролни скали, скали за „лъжа“. Въпросниците се използват предимно за диагностициране на характера, диагностициране на личността (например екстровертност - интроверсия, интереси, нагласи, мотиви).

Диагностиката на личността е набор от методи, които позволяват да се разпознаят нейните неинтелектуални свойства, които са от естеството на относително стабилни предразположения. За такива личностни черти като екстраверсия - интроверсия, доминиращ мотив, инхибиране, възбудимост, ригидност са разработени редица диагностични методи (въпросници и проективни тестове), с които можете да определите тежестта на тези свойства. При конструирането на такива методи, като правило, те използват факторен анализ(G. Eysenck, J. Cattell, J. Guilford) и конструктивно валидиране.

На модерен етапв приложната социология, тестови методи, заимствани от социална психологияотносно изучаването на чертите на личността. Появяват се тестове, специално разработени от социолозите. Тези тестове често се използват в социологически въпросници.

Препратки:

1. Социален справочник, Киев, 1990 г.

2. Социален речник, Минск, 1991 г.

3.Фонд на времето и събитията в социалната сфера, М: Наука, 1989г.

Тестване е изследователски метод, който ви позволява да идентифицирате нивото на знания, умения, способности и други личностни черти, както и тяхното съответствие с определени стандарти, като анализирате начините, по които субектът изпълнява редица специални задачи. Такива задачи обикновено се наричат тестове. Тестът е стандартизирана задача или задачи, свързани по специален начин, които позволяват на изследователя да диагностицира степента на изразеност на изследваното свойство в субекта, неговия психологически характеристики, както и отношение към определени обекти. В резултат на тестването обикновено се получава определена количествена характеристика, показваща степента на изразеност на изследваната черта в индивида. Тя трябва да бъде в съответствие със стандартите, установени за тази категория предмети.

Това означава, че с помощта на тестване е възможно да се определи текущото ниво на развитие на определено свойство в обекта на изследване и да се сравни със стандарта или с развитието на това качество в субекта в по-ранен период.

Има определени правила за провеждане на тестове и тълкуване на получените резултати. Тези правила са доста ясно разработени, а основните имат следното значение:

1) информиране на субекта за целите на тестването;

2) запознаване на субекта с инструкциите за изпълнение на тестови задачи и постигане на увереност на изследователя, че инструкциите са разбрани правилно;

3) осигуряване на ситуация, при която субектите могат да изпълняват задачи спокойно и независимо; поддържане на неутрално отношение към участниците в теста, избягване на намеци и помощ;

4) спазването от изследователя на методическите указания за обработка на получените данни и интерпретиране на резултатите, които придружават всеки тест или съответна задача;

5) предотвратяване на разпространението на психодиагностична информация, получена в резултат на тестване, като се гарантира нейната поверителност;

6) запознаване на субекта с резултатите от теста, предоставяне на него или на отговорното лице на съответната информация, като се вземе предвид принципът „Не вреди!“; в този случай е необходимо да се решат редица етични и морални проблеми;

7) натрупване от изследователя на информация, получена чрез други изследователски методи и техники, тяхното съпоставяне помежду си и определяне на последователността между тях; обогатяване на вашия опит с теста и знания за особеностите на приложението му.

Има и няколко вида тестове, всеки от които е придружен от съответните процедури за тестване.

Тестове за правоспособностправят възможно идентифицирането и измерването на нивото на развитие на определени психични функции и когнитивни процеси. Такива тестове най-често се свързват с диагностиката на когнитивната сфера на индивида, характеристиките на мисленето и обикновено се наричат интелектуални.

Сред тях са например тестът на Равен, тестът на Амтхауер, съответните подтестове на теста на Векслер и др., както и тестове със задачи за обобщение, класификация и много други тестове с изследователски характер.

Тестове за постиженияса насочени към идентифициране на степента на развитие на конкретни знания, умения и способности както като мярка за успех в изпълнението, така и като мярка за готовност за извършване на определена дейност. Като пример могат да служат всички случаи на тестови изпити. На практика обикновено се използват „батерии“ от тестове за постижения.

Личностни тестовеса предназначени да идентифицират личностните черти на субектите. Те са многобройни и разнообразни: има въпросници за състояния и емоционален състав на индивида (например тестове за тревожност), въпросници за мотивация за дейност и предпочитания, определяне на личностни черти и взаимоотношения.

Има група тестове, наречени проективни, които ни позволяват да идентифицираме нагласи, несъзнателни нужди и импулси, тревоги и състояние на страх.

Използването на тестове винаги е свързано с измерване на проявата на едно или друго психологическо свойство и оценка на нивото на неговото развитие или формиране. Следователно качеството на теста е важно. Качеството на теста се характеризира с критериите за неговата точност, т.е. надеждност и валидност.

Надеждността на теста се определя от това колко стабилни са получените резултати и колко независими са от случайни фактори. Разбира се, говорим за сравняване на показанията на едни и същи субекти. Това означава, че надеждният тест трябва да има последователни тестови резултати в множество тестове и може да бъде уверен, че тестът открива едно и също нещо.

Имот. Използват се различни методи за проверка на надеждността на тестовете.

Един от начините е току-що споменатото повторно тестване: ако резултатите от първото и повторното повторно тестване след определено време показват наличието на достатъчно ниво на корелация, тогава това ще покаже надеждността на теста. Вторият метод включва използването на друга еквивалентна форма на теста и наличието на висока корелация между тях. Възможно е също така да се използва трети метод за оценка на надеждността, когато тестът позволява да бъде разделен на две части и една

и една и съща група субекти се изследва с помощта на двете части на теста. Надеждността на теста показва колко точно се измерват психологическите параметри и колко високо може да бъде доверието на изследователя в получените резултати.

Валидността на теста отговаря на въпроса какво точно разкрива тестът и колко е подходящ за идентифициране на това, което е предназначен да направи. Например, тестовете за способности често разкриват нещо различно: обучение, наличие на подходящ опит или, обратно, липса на такъв. В този случай тестът не отговаря на изискванията за валидност.

В психодиагностиката има различни видове валидност. В най-простия случай валидността на теста обикновено се определя чрез сравняване на показателите, получени в резултат на тестване, с експертни оценки за наличието на това свойство в субектите (текуща валидност или „едновременна“ валидност), както и чрез анализ на данни, получени в резултат на наблюдение на субектите в различни ситуации.живот и работа, както и техните постижения в съответната област.

Въпросът за валидността на даден тест може да бъде решен и чрез сравняване на неговите данни с показатели, получени с помощта на техника, свързана с дадена техника, чиято валидност се счита за установена.

Проучване на продуктите на дейността е изследователски метод, който ви позволява индиректно да изучавате формирането на знания и умения, интереси и способности на човек въз основа на анализа на продуктите от неговата дейност. Особеността на този метод е, че изследователят не влиза в контакт със самия човек, а се занимава с продуктите на неговите предишни дейности или мисли за това, което

промени, настъпили в самия субект в процеса и в резултат на включването му в определена система от взаимодействия и отношения.