Главная      Учебники - Разные     Лекции (разные) - часть 12

 

Поиск            

 

Бодалев А. А. Столин В. В. Аванесов В. С. Общая психодиагностика

 

             

Бодалев А. А. Столин В. В. Аванесов В. С. Общая психодиагностика

Бодалев А.А. Столин В.В. Аванесов В.С.

ОБЩАЯ ПСИХОДИАГНОСТИКА

СПб.: Изд-во «Речь», 2000. -440 стр. ISBN 5-9268-0026-1

ISBN 5-9268-0015-3 СПб.: Изд-во «Речь», 2006

Общая психодиагностика.

Бодалев А.А. Столин В.В. Аванесов В.С.

В учебнике известных отечественных психологов представлены различные школы и направления мировой психодиагностики. Книга изобилует научными фактами, опи­саниями экспериментов и лабораторных работ, богата иллюстрирована практичес­кими и методическими материалами.

Авторы: А. А. Бодалев - предисловие, введение, заключение. В. В. Столин - пре­дисловие, введение, глава 1, глава 9 (§§ 9.1, 9.2,9.3, 9.4, 9.5), заключение. В. С. Аванесов - глава2 (§2.1). В. С. Бабина – глава 6(§ 6.4). Е. М. Борисова -глава5. В. Б. Быстрицкас - глава 7 (§ 7.1). А. В. Визгина - глава 9 (§ 9.4). А. И. Зеличенко - гла­ва 3 (§ 3.5). М. Ш. Магомед-Эминов - глава 6 (§§ 6.1, 6.2). Ю. М. Орлов - глава 6 (§ 6.3). С. Р. Пантилеев - глава 9 (§ 9.5). В. И. Похилько - глава 4, глава 8. В. Е. Семенов - глава 2 (§ 2.3). Е. Т. Соколова - глава 2 (§ 2.2), глава 7 (§ 7.2), гла­ва 9 (§ 9.6), Е. О. Федотова - глава 9 (§ 9.6). Г. Т. Хоментаускас - глава 7 (§§ 7.1, 7.3). А. Г. Шмелев - глава 1, глава 3 (§§ 3.1, 3,2, 3.3, 3.4, 3,5, 3.6), глава 4, глава 6 (§ 6.4). А. М, Эткинд - глава 7 (§ 7.4).

© Бодалев А.А., Столин В. А., 2000.

© Издательство «Речь», 2000. © Борозенец П. В. (оформление), 2000

СОДЕРЖАНИЕ

Предисловие

Введение

Глава 1. Психодиагностика как наука и как практическая деятельность

1.1. Научная психодиагностика и психодиагностическая практика

1.2. Классификации психодиагностических методик

1.3. Психодиагностические задачи

1.4. Дифференциальная психометрика

1.5. Нормативные предписания разработчикам и пользо­вателям психодиагностических методик

1.5.1. Требования к методикам

1.5.2. Требования к пользователям

1.5.3. Использование методик специалистами-смежниками

Глава 2. Из истории психодиагностики

2.1. Из истории психологических тестов

2.2. Из истории проективного метода

2.3. Из истории контент-анализа как психодиагности­ческой процедуры

Глава 3. Психометрические основы психодиагностики

3.1. Репрезентативность тестовых норм

3.2. Надежность теста

3.3. Валидность тестов

3.4. Технология создания и адаптации методик

3.5. Прогнозирование и распознавание образов

3.6. Требования к психометрической подготовке психолога.

Глава 4 Психодиагностика черт личности

Глава 5. Психодиагностика способностей

5.1. Объект и методы

5.2. Тест Амтхауэра

5.3. Тест «Штур»

5.4. Области применения тестов способностей

Глава 6. Психодиагностика мотивации

6.1. Объект и методы

6.2. Измерение мотивации достижения

6.3. Опросник для измерения потребности в дости­жении

6.4. Тест юмористических фраз

Глава 7. Психодиагностика межличностных отношений

7.1. Объект и методы

7.2. «Совметный тест Роршаха» для диагностики нарушений семейного общения

7.3. Методика «Рисунок семьи»

7.3.1. Диагностическая процедура

7.3.2. Интерпретация методики «Рисунок семьи»

7.4. Цветовой тест отношений

Глава 8. Психодиагностика индивидуального сознания

Глава 9. Психодиагностика самосознания

9.1. Самосознание как объект психодиагностики

9.2. Методики психодиагностики самосознания

9.3. Опросник самоотношения

9.4. Методика управляемой проекции

9.5. Методы измерения локуса контроля

9.6. Методика косвенного измерения системы самооценок (КИСС)

Заключение

Список литературы

ПРЕДИСЛОВИЕ

Психология наших дней - не только теоретическая дисциплина, изучающая человека, но и система прикладного знания, позволяю­щая и психологу-практику, и специалисту-смежнику (педагогу, руко­водителю, тренеру, врачу) совершенствовать свою работу с людьми.

Предлагаемая читателю книга посвящена психодиагностике - раз­делу психологического знания, формирующемуся на стыке фундамен­тальных отраслей психологии с практическими запросами жизни.

Современная психодиагностика все шире используется в таких областях социальной практики, как: 1) расстановка кадров, профподбор и профориентация; 2) прогнозирование социального поведения, например стабильности брака, законопослушности; 3) оптимизация обучения и воспитания; 4) консультативная и психотерапевтическая помощь; 5) судебная психолого-психиатрическая экспертиза; 6) про­гнозирование психологических последствий изменения среды. Поми­мо этого, психодиагностические методики – один из инструментов научных исследований в психологии личности и межличностных от­ношений.

Конкретная практическая польза от применения психодиагнос­тики зависит от уровня социально-экономического развития обще­ства и связанной с ним степени влиятельности субъективного, чело­веческого фактора в сфере производства и экономики в целом. В со­временном мире психодиагностика служит интересам общества в це­лом и интересам конкретных его членов (учащихся, пациентов здравоохранительных органов, клиентов психологических консуль­таций и т. д.). Еще одно важнейшее условие полезности использова­ния психодиагностики – это ее научность, основанная на знании прин­ципов формирования и природы диагностируемых качеств, на зна­нии закономерностей процесса психодиагностики и характеристик ее инструментов.

Психодиагностика, как уже отмечалось, используется в конкрет­ных областях жизнедеятельности людей: в здравоохранении, в спорте, в школьном и вузовском обучении, на производстве, в семейных кон­сультациях и т. д. В каждой из этих областей существуют специфи­ческие условия использования психодиагностических средств, спе­цифические психодиагностические задачи и методы, составляющие предмет частных или специальных психодиагностик (профессиональ­ной, спортивной, клинической и т. д.). Помимо этих частных вопро­сов в психодиагностике существуют и более общие, универсальные вопросы, решение которых составляют предмет общей психодиагно­стики, К ним относятся: 1) методологические, теоретические и конк­ретно-методические принципы построения психодиагностических инструментов и формулирования психодиагностических заключений; 2) методики психодиагностики наиболее универсальных объектов пси­ходиагностических обследований, таких как черты личности, способ­ности, мотивы, сознание и самосознание, межличностные отноше­ния; 3) дифференциальная психометрика как математизированная ме­тодология обнаружения межиндивидуальных различий; 4) норматив­ные требования к методикам, их разработчикам и пользователям.

Этим вопросам и посвящена предлагаемая вниманию читателя книга. По своему жанру она обладает одновременно характеристика­ми монографического исследования и руководства для специалистов и студентов-психологов. С монографией ее сближает достаточно под­робное освещение истории психодиагностики, включение дискусси­онных вопросов о природе и строении того или иного диагностируе­мого качества или психической характеристики, описание как уже имеющихся популярных психодиагностических методик, так и ори­гинальных, разработанных авторами книги, большое количество ссы­лок на работы других авторов. Возможность использовать книгу в качестве руководства обусловлена попыткой не просто сориентиро­вать читателя в данной области знания, но и представить необходи­мые данные для проверки и отладки психометрических характерис­тик вновь создаваемых или адаптируемых методик, а также для пер­воначального овладения некоторыми из имеющихся методик. При этом, однако, мы исходили из недопустимости публикации большим тиражом текстов методик, ключей и нормативных данных. Это реше­ние связано как с тем обстоятельством, что знание методики обследуемым снижает ее диагностическую ценность, так и с необходимос­тью воспрепятствовать бесконтрольному использованию методик не­специалистами. Кажущаяся простота методик приводит к попыткам их использования лицами, не получившими специальной подготов­ки, не понимающими ни «устройства» методики, ни природы обсле­дуемых качеств, ни специфики психодиагностической ситуации. Та­кое непрофессиональное использование инструментов, созданных для специалистов, может привести не только к дискредитации психоди­агностики, но и к нанесению прямого или косвенного вреда обследу­емым. Поэтому необходимые психодиагностические материалы (тек­сты опросников, нормы, ключи) предполагается выпустить отдель­ной брошюрой, предназначенной для специалистов...

В заключение хочется выразить надежду, что книга окажется по­лезной всем, кто готовится к работе или работает в области психоди­агностики, а также заранее поблагодарить всех читателей, которые пришлют свои отзывы о книге.

А, А. Бодалев, В. В. Столин

ВВЕДЕНИЕ

Современная психология оказывает воздействие на практическую деятельность людей различными путями. Один из таких путей - это непосредственная психологическая помощь различным категориям населения. Психолог; получивший специальную подготовку, спосо­бен оказать консультативную психологическую помощь родителям в воспитании детей, супругам в ситуации семейного кризиса, детям, у которых нарушен ход нормального развития личности, юношам и девушкам в выборе профессии, руководителям в формировании сти­ля и приемов общения и многим другим.

Психологическое консультирование основано на знании психо­логом не только предмета анализа и обсуждения (семейные и произ­водственные, внутри- и межличностные конфликты), но и закономер­ностей самого процесса консультирования, его стратегии и тактики.

Люди нуждаются в психологической помощи в ситуации как объективно существующего, так и субъективно переживаемого небла­гополучия. Это переживание может быть острым и выражаться в глу­боком недовольстве собой, окружающими, жизнью в целом, а иногда и в страдании. В таких случаях требуется оказание не просто кон­сультативной, но и психотерапевтической помощи. Если страдания человека складываются в клиническую картину заболевания и чело­век обращается к врачу, то психотерапевтическая помощь носит ме­дицинский характер и оказывается врачом-психотерапевтом или пси­хологом под руководством врача. Во многих случаях, однако, требу­ется психотерапевтическая помощь несколько иного характера. По своей форме и цели это психотерапевтическое вмешательство совпа­дает с тем, которое используется при лечении больных. Оно соверша­ется в форме беседы, дискуссии, игры (т. е. в форме общения) и на­правлено на избавление человека от страданий и ликвидацию при­чин, его вызвавших. Это вмешательство, однако, отличается от меди­цинского по двум существенным аспектам: 1) природа неблагополучия кроется не в болезненных процессах, происходящих в организме че­ловека, а в особенностях его личности, специфике жизненной ситуа­ции и характере взаимоотношений с окружающими; 2) обращающийся за помощью и объективно не является, и субъективно не признаёт себя больным.

В какой бы форме ни осуществлялась психологическая помощь: в форме психологического консультирования или в форме немеди­цинской психотерапии, она обладает общей характеристикой - индивидуализированностью своей направленности. Эта индивидуализация базируется на глубоком проникновении в личность обратившегося за помощью, в его чувства, переживания, установки, картину мира, струк­туру взаимоотношений с окружающими. Для такого проникновения часто недостаточно одного лишь психологического чутья и интуиции, требуются специальные - психодиагностические - методы.

Внутренняя необходимая связь психологического консультиро­вания, немедицинской психотерапии и психодиагностики и обусло­вила название серии, в которой выходит данная коллективная моно­графия.

В самом общем виде психодиагностика – эта наука и практика постановки психологического диагноза. Термин «психодиагностика», распространившийся в психиатрии после появления книги Г. Роршаха «Психодиагностика» (Rorschach Н., 1921), довольно быстро вышел за пределы медицины. Термин «диагноз» начал пониматься как рас­познавание любого отклонения от нормального функционирования или развития и даже как определение состояния конкретного объекта (индивида, семьи, малой группы, той или иной психической функции или процесса у конкретного лица). Понятие «психодиагностика» рас­пространилось и на профилактическое обследование индивидов и групп.

Диагностическое исследование (точнее - обследование) облада­ет важной характеристикой, отличающей его от научного исследова­ния. Психолог-исследователь (в том числе и исследователь в области психодиагностики) ориентирован на поиск неизвестных закономер­ностей, связывающих абстрактные переменные, использует «извест­ных» (т. е. определенных по какому-либо признаку) испытуемых и пренебрегает их индивидуальными отличиями и эмпирической цело­стностью. Для пеиходиагностат-практика именно эти индивидуальные отличия и эмпирическая целостность являются объектом изучения; он ориентирован на поиск известных закономерностей в «неизвест­ных» обследуемых.

Психодиагностические задачи могут решаться различными спо­собами. Один из таких способов - это длительное наблюдение за обследуемым, совершаемое в ходе оказания ему помощи (в ходе кон­сультирования, психотерапии). Другой способ - это наблюдение за обследуемым в реальных условиях его жизни, например, наблюде­ние за поведением ребенка в детском саду. Эти способы дают очень ценные сведения о человеке, однако они крайне трудоемки, не все­гда доступны и дают информацию не до начала работы психолога, а уже в ходе такой работы (которая может оказаться и излишней). По­этому в психодиагностике получили распространение специальные методики, используемые не только в сфере консультирования и пси­хотерапии, но и во всех тех случаях, когда необходимо получить оценку той или иной психической характеристики конкретного ин­дивида. Эти методики обладают следующими особенностями: 1) они позволяют собрать диагностическую информацию в относительно короткие сроки; 2) они представляют информацию не вообще о че­ловеке, а о тех или иных его конкретных особенностях {интеллекте, тревожности, самооценки, чувстве юмора, наиболее характерных личностных чертах и т. п.); 3) информация поступает в виде, позво­ляющем дать качественное и количественное сравнение обследуе­мого индивида с другими людьми; 4) информация, получаемая с помощью психодиагностических методик, полезна с точки зрения выбора средств вмешательства, прогноза их эффективности, а так­же прогноза развития, общения, эффективности той или иной дея­тельности индивида.

Принципы разработки психодиагностических средств и их конк­ретное воплощение в диагностических методиках, включая их мето­дологическое и теоретическое обоснование, проверку валидности и надежности, входят в предмет общей психодиагностики.

Развитие этой области знания в нашей стране шло неравномерно. Интенсивное развитие психодиагностики в 20-х и начале 30-х годов оказалось затем приостановленным благодаря неконтролируемому, непрофессиональному и расширительному использованию тестов. В результате в развитии отечественной психодиагностики наметилось отставание, которое стало интенсивно преодолеваться с начала 70-х годов. Большую работу в этом направлении проводит научный кол­лектив Санкт-Петербургского психоневрологического института име­ни В. М. Бехтерева[1] . Издаются монографии, посвященные частным, или специальным, психодиагностикам[2] . Русскоязычному читателю ста­новятся доступными зарубежные издания[3] . Вновь разрабатываются фундаментальные вопросы общей психодиагностики[4] .

Предлагаемая вниманию читателя книга содержит систематичес­кое изложение ряда разделов общей психодиагностики. В ней осве­щаются вопросы теории и истории психодиагностики, подробно опи­сываются приемы, используемые при психометрической отладке, про­верке и разработке психодиагностических инструментов. Ряд глав посвящен психодиагностике отдельных психических характеристик, которые наиболее часто становятся предметом изучения психодиаг­носта или психолога-исследователя. К ним относятся черты личнос­ти, мотивация, межличностные взаимоотношения, способности, со­знание и самосознание. В то же время, некоторые традиционные раз­делы общей психодиагностики, уже получившие освещение в лите­ратуре (например, психодиагностика интеллекта), не представлены в книге. В каждой главе, посвященной конкретной предметной области психодиагностики, приводится обзор существующих методик и, как правило, более подробно излагаются те из них, которые авторами рекомендуются к использованию. Изложение этих последних мето­дик отражает тот этап, на котором находятся их теоретическая разра­ботка и психометрическая отладка. Превращение психодиагностичес­ких методик в надежный инструмент науки и практики зависит от ин­тенсивности усилий многих исследователей, проверки и перепровер­ки получаемых данных.

ГЛАВА 1 ПСИХОДИАГНОСТИКА КАК НАУКА И КАК ПРАКТИЧЕСКАЯ ДЕЯТЕЛЬНОСТЬ

1.1. НАУЧНАЯ ПСИХОДИАГНОСТИКА И ПСИХОДИАГНОСТИЧЕСКАЯ ПРАКТИКА

Психодиагностика - и теоретическая дисциплина, и сфера прак­тической деятельности психолога.

Как теоретическая дисциплина общая психодиагностика рассмат­ривает закономерности вынесения валидных и надежных диагнос­тических суждений, правила «диагностических умозаключений», с помощью которых осуществляется переход от признаков или инди­каторов определенного психического состояния, структуры, процесса к констатации наличия и выраженности этих психологических «переменных». Иногда такие правила сравнительно просты, иногда довольно сложны, в одних случаях «встроены» в сам диагностические инструмент, в других - требуют особой работы с диагностическими показателями: стандартного сравнения профилей, расчета ин­тегральных показателей, сопоставления с альтернативными диагно­стическими пробами, экспертной интерпретации, выдвижения и отбрасывания гипотез.

Психодиагностика как теоретическая дисциплина тесно свя­зана с соответствующими предметными областями психологической науки.

Выделяемая для психодиагностики переменная должна иметь теоретический смысл в соответствующей области науки и практи­ческую значимость для решения той или иной научной или при­кладной задачи. Теоретическая обоснованность выделения, напри­мер, тех или иных личностных черт, тех или иных мотивов, - не­пременное условие успешности разработки диагностической про­цедуры, недооценка которого приводит к построению «фантомной» психодиагностики: ищутся способы выявления того, чего на са­мом деле не существует.

Связь психодиагностики, с одной стороны, и теоретико-экспери­ментальной психологии - с другой, имеет двусторонний характер. Психодиагностика в целом - не только воплощение понятий соответ­ствующих дисциплин в конкретных методиках, но и способ проверки истинности теоретико-психологических построений. Если, например, предполагается, что деятельность людей существенно отличается по мотивам, то должны быть найдены методы, выявляющие различные мотивы у разных людей. Если предполагается, что не существует пси­хически здорового человека, который не имел бы какой-либо мотива­ции, то не может существовать валидных методов, которые бы диаг­ностировали отсутствие всякой мотивации у конкретного лица, не являющегося психически больным. Если бы относительно некоторых теоретически выделенных мотивов оказалось невозможным обнару­жить дифференциально-психологические различия или была бы об­наружена группа психически здоровых людей, у которых отсутство­вала всякая мотивация, то это означало бы существенную недоработ­ку самого понятия мотива.

Общая психодиагностика преимущественно связана с общей, со­циальной и дифференциальной психологиями, частная психодиагно­стика - с такими областями психологии, как медицинская, возраст­ная, консультативная, юридическая, военная психология, психология труда, спорта и т. д.

Психология соответствующей предметной области составляет одну из составных частей психодиагностики. Другая базовая дис­циплина, являющаяся фундаментом общей психодиагностики и тем самым составной ее частью, - это дифференциальная психометри­ка, наука, обосновывающая и разрабатывающая измерительные ди­агностические методы; этому разделу общей психодиагностики по­священы специальный раздел в данной главе и отдельная глава в книге.

Третье основание психодиагностики — практические сферы при­менения психологического знания, которые выдвигают психодиагно­стические задачи и обосновывают выделение комплексных, интеграль­ных переменных, выступающих как объекты психодиагностики. Так, например, существуют профессии, в которых чрезвычайно важна стрессоустойчивость – способность сохранять контроль и работо­способность в угрожающих ситуациях. Значимость этой переменной выделена практикой - если бы не существовало профессий, которые связаны со стрессом, не было бы необходимости ее диагностировать. Однако практика не только показывает важность того или иного каче­ства, но и позволяет выделить само диагностируемое качество. Науч­ная психология пытается выразить эти качества через систему понятий; в результате такие комплексные понятия, как стрессоустойчи­вость, профессиональная эффективность, способность и т. д., выра­жаются через систему базисных психологических понятий, таких, как потребности, мотивы, умения, установки. Конечно, такой переход от эмпирически выделенных переменных к их выражению в теорети­ческих понятиях происходит не сразу и не автоматически. Зачастую происходит параллельная диагностическая разработка практически важных комплексных (не только психологических по природе) пере­менных, более теоретически проработанных, но все же описатель­ных психологических переменных (например, черты, способности) и, наконец, наиболее теоретичных психологических конструктов (на­пример, познавательные функции, мотивы, когнитивная организация, самоотношение и т. д.).

Таким образом, теоретическая психодиагностика обусловлена тремя областями психологического знания: предметной областью пси­хологии, изучающей данные явления, психометрикой – наукой об из­мерении индивидуальных различий в диагностируемых переменных и практикой использования психологического знания.

Практическая психодиагностика относится к теоретической так же, как инженерная эксплуатация технических устройств к их разра­ботке и конструированию. Как и всякая эксплуатация достаточно слож­ных устройств в реальных, «полевых» условиях, практическая психо­диагностика предполагает полезные навыки, интуицию, богатый кли­нический, да и житейский, опыт. Помимо этого практическая психо­диагностика предполагает свод правил применения психодиагности­ческих инструментов, основанных на знании свойств измеряемых переменных и измеряющих инструментов, на знании этических и про­фессиональных норм психодиагностической работы. Так, практик-психодиагност должен понимать и уметь квалифицировать условия проведения обследования и учитывать их при сопоставлении инди­видуальных данных с нормативами. Например, если при проведении обследования какие-то элементы обстановки насторожили обследуемого и ситуация обследования превратилась для него в ситуацию экспертизы, то это обстоятельство может сделать невозможным сопос­тавление индивидуального результата с нормами, если последние были получены в ситуации доверительного контакта. И наоборот, если нор­мы получены в ситуации экспертизы, а конкретное обследование имеет доверительный характер, то соотнесение с нормами также становит­ся некорректным. Все это психодиагност должен не только знать - он должен выяснить, как воспринимает ситуацию обследуемый. Прак­тическая психодиагностика предполагает также учет мотивации кли­ента на обследование и знание способов ее поддержания, умение оце­нить состояние обследуемого в целом, знание и навыки сообщения информации обследуемому о нем самом, чуткость к действиям, кото­рые непроизвольно могли бы нанести вред обследуемому, способность интерпретировать полученную информацию и многое другое.

1.2. КЛАССИФИКАЦИИ ПСИХОДИАГНОСТИЧЕСКИХ МЕТОДИК

В настоящее время существует несколько достаточно обоснован­ных классификаций психодиагностических методик.

Во-первых, можно различать диагностические методы, основанные на заданиях, которые предполагают правильный ответ, либо на заданиях, относительно которых правильных ответов не существует К первой группе относятся многие тесты интеллекта, тесты специ­альных способностей, некоторых личностных черт (например, тест Равена, диагностическая процедура определения полезависимости-поленезависимости Уиткина, тест ригидности Лучинса и др.). Диаг­ностические методики второй группы состоят из заданий, которые характеризуются лишь частотой (и направленностью) того или иного ответа, но не его правильностью. Таковы большинство личностных опросников (например, тест 16PF Р Кеттелла):

Во-вторых, можно различать вербальные и невербальные психо­диагностические методики.

Первые так или иначе опосредованы речевой активностью об­следуемых; составляющие эти методики задания апеллируют к па­мяти, воображению, системе убеждений в их опосредованной языком форме. Вторые включают речевую способность испытуемых только в плане понимания инструкций, само же выполнение зада­ния опирается на невербальные способности - перцептивные, мо­торные.

Третье основание, используемое для классификации психодиаг­ностических методик, - это характеристика того основного методи­ческого принципа, который положен в основу данной методики. По этому основанию обычно различают: 1) объективные тесты; 2) стан­дартизованные самоотчеты, которые в свою очередь включают: а) те­сты-опросники; б) открытые опросники, предполагающие последующий контент-анализ; в) шкальные техники, построенные по типу семантического дифференциала Ч. Осгуда; и методики классифика­ции; г) индивидуально ориентированные техники типа ролевых ре­пертуарных решеток; 3) проективные техники; 4) диалогические

(интерактивные) техники (беседы, интервью, диагностические игры)[5] .

Объективные тесты - это те методики, в которых возможен пра­вильный ответ, т. е. правильное выполнение задания.

Общим для всей группы методик стандартизованного самоотче­та является использование вербальных способностей испытуемого, а также обращение к его мышлению, воображению, памяти.

Тесты-опросники предполагают набор пунктов (вопросов, утвер­ждений), относительно которых испытуемый выносит суждения (как правило, используется двух- или трехальтернативный выбор ответов).

Одна и та же психологическая переменная представляется груп­пой пунктов (не менее 6). Пункты теста-опросника могут быть пря­мыми, апеллирующими непосредственно либо к опыту субъекта (на­пример: Боитесь ли Вы темноты?), либо к мнениям, суждениям ис­пытуемого, в которых косвенно проявляются его личный опыт или переживания (например: Большинство людей честны?) Опросники строятся как одномерные или многомерные, включающие в себя це­лый ряд психологических переменных.

Открытые опросники не предусматривают стандартизованного ответа испытуемого; стандартизация обработки достигается путем отнесения произвольных»ответов к стандартным категориям.

Шкальные техники предполагают оценку тех или иных объектов (словесных утверждений, изобразительного материала, конкретных лиц и т. п.) по выраженности в них качества, заданного шкалой (например: «теплый - холодный», «сильный - слабый»). Обычно используются трех-, пяти- и семиточечные шкалы. Особый вариант шкалирования – это субъективная классификация, предполагающая выявление субъек­тивного структурирования объектов на уровне шкалы наименований.

Индивидуально-ориентированные (идеографические) техники типа репертуарных решеток могут по форме совпадать со шкальны­ми, опросными методами, напоминать беседу или интервью. Их ос­новное отличие от тестов-опросников состоит в том, что параметры, которые оцениваются (оси, измерения, конструкты), не задаются из­вне, а выделяются на основе индивидуальных ответов данного конк­ретного испытуемого. Отличие этих методов от метода интервью со­стоит в том, что репертуарные решетки позволяют осуществлять при­менение современного статистического аппарата и делают надежны­ми диагностические выводы относительно индивидуальных особенностей субъекта.

Проективные техники основаны на том, что недостаточно струк­турированный материал, выступающий в качестве «стимула», при со­ответствующей организации всего эксперимента в целом порождает процессы фантазии, воображения, в которых раскрываются те или -иные характеристики субъекта. В клиническом употреблении проек­тивные техники часто строятся на интуиции и теоретической подго­товке психодиагноста, которые оказываются необходимыми на этапе интерпретации данных. Исследовательское употребление проектив­ных техник предполагает, как правило, применение контент-аналити­ческих процедур, стандартизирующих обработку данных.

Диалогические техники учитывают, что психодиагност вступает в контакт с обследуемым и достигает наилучших диагностических результатов за счет специфических особенностей этого контакта, ре­левантных диагностической задаче. Так, доверительный контакт не­обходим при диагностике семейных затруднений, характера личност­ного развития ребенка и во многих других случаях, в которых диаг­ност одновременно выступает в роли и консультанта, и психотера­певта. Ситуация диагностического патопсихологического обследова­ния диктует построение общения по принципу экспертизы.

Диалогические техники могут быть вербальными (интервью, бе­седы) и невербальными (например, игра с ребенком может выступать как невербальная диагностическая процедура).

Различные методические приемы, на основе которых строятся те или иные методики, можно расположить на одной шкале, если за еди­ное основание классификации принять меру вовлеченности в диагно­стическую процедуру самого психодиагноста и степень его влияния на результат обследования.

Аппаратурные методики и объективные психологические тесты обладают наименьшей вовлеченностью психодиагноста в процедуру психодиагностики, минимальным влиянием личности психодиагнос­та и его опытности как психолога на результаты обследования. Почти столь же малой степенью вовлеченности психодиагноста обладают и некоторые формы стандартизованных самоотчетов - многие опрос­ники и шкальные техники. Можно сказать, что в этих методиках лич­ные качества психолога воплотились на этапе разработки методики; сама же процедура обследования, как и фиксация ее результата, ока­зывается рутинной операцией, которая в принципе может выполнять­ся с помощью лаборанта-непсихолога или по компьютерной програм­ме. Диагностические техники, напротив, характеризуются максималь­ной степенью вовлеченности психодиагноста в процесс психодиаг­ностики, максимальным влиянием его опытности, профессиональных навыков, способностей в сфере общения на результаты обследова­ния. Этими качествами обладают различные виды бесед, интервью, диагностических игр. Например, патопсихологический эксперимент как особый психодиагностический метод характеризуется высокой сте­пенью вовлеченности психодиагноста: должен быть создан «мотив» экспертизы (обследуемый должен понимать, что на основе его отве­тов будет сделано важное для него диагностическое заключение), ре­зультаты отдельных проб интерпретируются в зависимости от того, насколько выражен этот мотив (по мнению психодиагноста). Не ме­нее явным оказывается влияние психодиагноста на результаты диаг­ностического заключения, выносимого на основе беседы с клиентом психологической консультации. Своими реакциями, ответными реп­ликами, манерой держаться психодиагност может как создать опти­мальные условия для получения диагностически важной информа­ции, так и полностью исказить эту информацию, ее смысл.

Все остальные психодиагностические методики занимают про­межуточное положение между двумя полюсами, образованными объективными тестами и диалогическими техниками.

Уже многомерные тесты-опросники, предполагающие анализ профиля и интерпретацию отдельных шкал в зависимости от значе­ний других и характера профиля в целом, требуют клинической опытности психодиагноста и, следовательно, на этапе психодиагностичен, кого заключения не свободны от влияния личности диагноста. Не менее значимым является это влияние и при необходимости кодиро­вания результатов обследования, полученные с помощью открытых опросников либо проективных техник В последнем случае существен­ное значение имеет создание психодиагностом атмосферы, раскры­вающей способности испытуемого к воображению, творчеству.

Если ввести одновременно два основания - меру вовлеченности психодиагноста, его влияние на результаты обследования, с одной стороны, и предметную направленность инструмента - с другой, то известные на сегодня психодиагностические методики можно распо­ложить в двухмерной классификационной таблице.

Соответствующие методики окажутся расположенными в клет­ках таблицы, при этом столбцы будут заполнены неравномерно по строкам таблицы. Так, способности и психические функции диагнос­тируются в основном методами, влияние психодиагноста в которых выражено минимально, - в основном объективными тестами и теста­ми-опросниками. Личностные черты преимущественно диагностиру­ются тестами-опросниками; когнитивная организация, другие инди­видуальные свойства выявляются преимущественно методиками сред­него уровня (по степени влияния психодиагноста на процесс диагно­стики) - репертуарными решетками, проективными техниками.

Мотивация, отношение диагностируются преимущественно про­ективными техниками. Роль диалогических методик, обладающих максимальной степенью включенности психодиагноста, особенно важна в области диагностики взаимоотношений, общения (таких свойств, актуализация которых требует воссоздания реальных ситу­аций общения).

Приведенная в данном разделе классификация отражает доста­точно грубо лишь общие черты психологических диагностических ме­тодик - более конкретно вопрос о классификациях обсуждается в соответствующих главах книги. Однако и в таком виде предлагаемая классификация обладает эвристической ценностью. Если заполнить все клетки табл. 1, станет видно, где существует нехватка методов оп­ределенного типа. Так, например, явно не хватает методик диалоги­ческого типа для определения способностей (см. главу 5), поскольку' эффективная демонстрация способностей у некоторых субъектов су­щественно зависит от условий психодиагностики и характера кон­такта с психодиагностом. Пользователь психодиагностических мето­дик, так же как их разработчик, может расчертить и заполнить подоб­ную таблицу для себя и вписать в клетки известные ему методики. Это позволит ему лучше представить себе, какими методами необхо­димо овладеть и где возникаетнеобходимость в поиске и научной раз­работке методов.

Таблица 1 Основания классификации психодиагностических методик

Влияние психо­диагноста на результат обследования

Предмет психодиагностики

Способности психичес­кие функции

Личност­ные черты

Когнитивная организация и другие индивидуальные ха­рактеристики субъ­ективного опыта

Мотивация, отношение

Характерис­тики обще­ния, взаимо­действия

Минимальное

Среднее

Максимальное

1.3. ПСИХОДИАГНОСТИЧЕСКИЕ ЗАДАЧИ

Общая психодиагностика в известной степени отвлекается от спе­цифических диагностических задач, возникающих в различных част­ных областях психодиагностики. Однако психодиагност должен пред­ставлять себе эти задачи, поскольку они существенно определяют ограничения в использовании методов.

Одно из важных различий относится не только к задачам, но ив целом к ситуациям психодиагностики. Это различение ситуации кли­ента и ситуации экспертизы.

В первой ситуации человек обращается за помощью к психологу, он охотно идет на сотрудничество, старается выполнить инструкции как можно более точно, не имеет сознательных намерений приукрасить себя или фальсифицировать результаты. Во второй ситуации че­ловек знает, что подвергается экспертизе, старается выдержать «экза­мен», а для этого вполне осознанно контролирует свое поведение и свои ответы так, чтобы предстать в максимально выигрышном свете (или добиться своей цели даже ценой симуляции отклонений и расстройств).

В ситуации клиента к диагностическому инструменту можно предъявлять гораздо менее жесткие требования относительно его за­щищенности от фальсификации вследствие сознательной стратегии, чем в ситуации экспертизы.

Психодиагностические задачи (и ситуации психодиагностики в целом) можно различать также с точки зрения того, кто и как будет использовать диагностические данные и какова ответственность пси­ходиагноста за выбор способов вмешательства в ситуацию обследуе­мого. Кратко опишем эти ситуации.

1. Данные используются специалистом-смежником для постанов­ки непсихологического диагноза или формулирования администра­тивного решения. Эта ситуация типична для использования психодиа­гностических данных в медицине. Психолог выносит суждение о спе­цифических особенностях мышления, памяти, личности больного, а врач ставит медицинский диагноз. Психолог не несет ответственнос­ти ни за диагноз, ни за то, какое именно лечение будет проведено боль­ному врачом. По той же схеме происходит использование психодиаг­ностических данных при психодиагностике по запросу суда, комп­лексной психолого-психиатрической экспертизе, психодиагностике профессиональной компетентности работника или профпригодности по запросу администрации.

2. Данные используются самим психодиагностом для постанов­ки психологического диагноза, хотя вмешательство в ситуацию об­следуемого осуществляется специалистом другого профиля. Такова, например, ситуация психодиагностики применительно к поиску при­чин школьной неуспеваемости: диагноз имеет психологический (или

психолого-педагогический) характер, а работу по его реализации в жизнь проводят учителя, родители, другие воспитатели[6] .

3. Данные используются самим психодиагностом для постановки психологического диагноза, а последний служит ему основанием (или основанием для действий его коллеги-психолога) для разработки пу­тей психологического воздействия. Такова ситуация психодиагностики в условиях психологической консультации.

4. Диагностические данные используются самим обследуемым в целях саморазвития, коррекции поведения и т. п. В этой ситуации пси­холог несет ответственность за корректность данных, за этические, деонтологические аспекты «диагноза» и лишь частично - за то, как этот диагноз будет использован клиентом.

Хотя и не существует жесткого соответствия между характером за­дачи и психодиагностическим методом, все же можно отметить некото­рую предпочитаемость тех или иных методов в конкретных случаях.

Так, в ситуациях 1 и 2 методы должны давать «стратегическую» информацию о клиенте, т. е. обеспечивать более или менее долгосроч­ный прогноз, они также должны позволять соотнесение обследуемо­го с другими людьми, т. е. предполагать стандартизацию. Поэтому в данных ситуациях наиболее часто употребляются объективные тесты и тесты-опросники, причем последние иногда основаны не на психо­логических категориях, а на категориях (системе понятий) заказчика. Таковы, например, известный Миннесотский многофакторный лич­ностный опросник и его модификации.

В ситуации 3 информация зачастую рассчитана на регулирование тактики практической работы самого психолога, соотнесение с «нор­мой» имеет меньшее значение, поэтому чаще используются идеогра­фические техники, проективные и диалогические методы.

В ситуации 4 главное требование к методам - легкость перевода получаемых с их помощью данных на язык самого обследуемого.

Этому условию удовлетворяет, например, тест 16PF Р. Кеттелла, но плохо соответствует MMPI, диагностические описания которого рассчитаны на психиатра.

1.4. ДИФФЕРЕНЦИАЛЬНАЯ ПСИХОМЕТРИКА

Термин «дифференциальная психометрика» в данной книге обо­значает науку о дифференциально-психологических измерениях. Диф­ференциальную психометрику целесообразно отличать от «общей психометрики» (Михалевская М. Б., Измайлов Ч. А., 1983). Общая психометрика имеет дело с задачами измерения психологических ха­рактеристик стимула, в частности, моделирует общепсихологические (справедливые для всех людей) функциональные зависимости между свойствами стимулов и свойствами субъективных реакций. В психо­физике речь идет об установлении соответствий между физическими характеристиками стимулов и субъективными характеристиками ощу­щений (сенсорная психофизика в социально-психологических из­мерениях устанавливается соответствие между рядами социальных объектов (например, разные виды рекламируемых товаров) и опреде­ленными психическими реакциями (например, на континууме от «очень нравится» до «очень не нравится»). В дифференциальной пси­хометрике числовые значения (ранги, категориальные шкальные зна­чения) приписываются не стимулам, а индивидам. Дифференциаль­ная психометрика имеет дело с индивидуальными различиями между людьми в качественном и количественном составе психических свойств, каковыми являются способности, отдельные когнитивные функции (память, внимание), мотивы, поведенческие черты, установ­ки, оценки и самооценки, способы психического самосохранения (пси­хической защиты) и т. п.

По отношению к психодиагностике и дифференциальной психо­логии психометрика выступает в статусе технолого-методической дисциплины: она обосновывает требования, которым должны удов­летворять измерительные психодиагностические методы, обосновы­вает процедуры их разработки и применения.

Основываясь на введенном выше основании классификации, со­временные методы психодиагностики условно можно разделить на две категории: 1) стандартизованные, измерительные методы (будем называть их в дальнейшем «тесты»), 2) экспертные методы, или ме­тоды понимания (по традиции, они часто фигурируют под названием «клинические методы»). К первым относятся объективные тесты и стандартизованный самоотчет, ко вторым - проективные и диалоговые методы. В основе первой категории методов лежит соблюдение достаточно строгих и сформулированных в явной форме правил. Эти методы обеспечивают диагноз (и на его основе прогноз) лишь с веро­ятностной точностью, этот диагноз оказывается более надежным по отношению к группе испытуемых, чем по отношению к отдельному испытуемому.

Экспертные методы в большей степени рассчитаны на професси­ональный опыт, психологическую интуицию самого психодиагноста. Эти методы оказываются незаменимыми везде, где не разработаны (или неизвестны) стандартизованные процедуры. Они часто оказы­ваются более эффективными по отношению к психическим явлени­ям, плохо поддающимся объективации (субъективные переживания личностные смыслы, глубинные слои опыта), по отношению к чрез­вычайно изменчивым явлениям, для которых трудно создать фикси­рованную операциональную модель (динамика целей, состояний, на­строений, многоплановых отношений в группе). Если их применяет эксперт высокой квалификации, они оказываются более надёжным средством в случае индивидуальной диагностики. Кроме того, не сле­дует забывать, что глубокий экспертный анализ - необходимый пер­вичный этап в разработке всякой стандартизованной процедуры. По мере стандартизации экспертные методы также подлежат количествен­ному обоснованию (Бешелев С. Д., Гурвич Ф. Г., 1980).

Достоинства измерительных методов: объективный характер про­цедуры, возможность перепроверки - обеспечиваются не автомати­чески, а благодаря выполнению психометрических требований -тре­бований репрезентативности, надежности, валидности (включая дос­товерность). Краткие определения: репрезентативность -соответствие тестовых норм выборки стандартизации тестовым нормам той попу­ляции, на которой применяется тест; надежность - точность и устой­чивость процедуры измерения, ее независимость от варьирующих случайных факторов; валидность - соответствие методики измеряе­мому концепту. Если эти требования не выполнены, то использова­ние тестов - ничуть не менее произвольная процедура, чем стихий­ное «вчувствование» эксперта в испытуемого. Более того, в этом слу­чае результат оказывается в нелепой зависимости от комплекса слу­чайных и побочных обстоятельств; психодиагност в своем отношении к тесту уподобляется фаталисту, склонному уповать на жребий и выразившееся в нем «провидение» (при отсутствии каких-либо разум­ных доводов в пользу того или иного решения). Опасны не тесты сами по себе, а их использование без теории и без психометрики, когда стандартная процедура выполняет фактически лишь роль глухого за­бора, отгораживающего психодиагноста от реального испытуемого. В этом случае тест служит источником иллюзорного впечатления о возможности освобождения психолога от необходимости наблюдения за весьма информативными признаками поведения испытуемого, его манерами, способами работы над заданиями и т. п.

Знание психометрики дает психологу необходимую критичность в понимании ограниченности методик, в понимании тех допущений, которые сделаны при разработке той или иной оценочной шкалы, те­ста, опросника, системы задач и т. п.

Специфика психодиагностических процедур, по сравнению с обычными физическими измерениями, заключается в том, что здесь сама процедура измерения взаимодействует с «объектом» измерения, более того, рождается в этом взаимодействии, зависит от его характе­ристик и «портится», если эти характеристики меняются. В физичес­ких измерениях объект в значительных пределах пассивен и не влия­ет со своей стороны на физический прибор. Человек, напротив, все­гда активен и может применять такую тактику, которую психодиаг­ност при разработке методики вовсе не предусматривал. Диапазон «срабатывания» теста довольно узок и фактически сводится к той популяции, на которой происходила эмпирико-статистическая разра­ботка теста, обеспечивающая его надежность, валидность, репрезен­тативность тестовых норм. Узость этого диапазона можно сравнить со свойствами пружинного динамометра из мягкого металла: доста­точно тяжелый груз, выходящий по весу за допустимые пределы, по­рождает в пружине необратимые деформации и нарушает изометричность шкалы.

Для корректного применения- теста на новой популяции или в но­вых целях (от целей зависит установка испытуемых в ситуации тести­рования) психолог должен провести серию предварительных психо­метрических экспериментов, направленных на перепроверку надеж­ности, валидности и репрезентативности теста в новых условиях. Пе­ренесение теста с одной популяции на другую без проверки как минимум однородности распределения тестовых баллов (устойчивости тестовых норм) может приводить к серьезным диагностическим ошибкам или к непроизводительным затратам на бесполезную пси­ходиагностику. К серьезным ошибкам может привести попытка про­гноза по результатам теста, не проверенного на прогностическую ва­лидность, - в этом случае психолог должен ограничиться лишь теку­щим диагнозом.

Строгое следование требованиям психометрики особенно необ­ходимо при переносе тестов, разработанных за рубежом. В условиях недостаточной разработки отечественных методик многие психологи склонны рассматривать в качестве готовых зарубежные методики, тогда как реальные языковые и социокультурные различия бывают столь сильными, что полная эмпирическая адаптация зарубежной ме­тодики по своему объему не уступает разработке оригинальной мето­дики. Это прежде всего относится к шкалам ценностных ориентации, к характерологическим опросникам и другим личностным тестам. В данной книге читатели познакомятся с процедурами, позволяющими проверить эмпирическую корректность тестовых диагностических шкал. Для того чтобы убедиться в пригодности того или иного зару­бежного теста, психолог должен уметь повторить процедуру, с помо­щью которой конструировался и обосновывался этот тест его автора­ми. Если при конструировании многомерного теста использовался факторный анализ, то нельзя считать адаптированным тест, прошед­ший проверку только на устойчивость тестовых норм; нужно обяза­тельно перепроверить устойчивость самих тестовых шкал (т. е. по­вторить факторный анализ).

1.5. НОРМАТИВНЫЕ ПРЕДПИСАНИЯ РАЗРАБОТЧИКАМ И ПОЛЬЗОВАТЕЛЯМ ПСИХОДИАГНОСТИЧЕСКИХ МЕТОДИК

Развертывание практической работы психологов в различных сферах производства, медицины, образования, требующих примене­ния психодиагностических методик, остро ставит вопрос о норма­тивном регулировании подобной практики. Речь идет о системе конк­ретных требований к разработчикам и пользователям методик.

До недавнего времени практическое и исследовательское при­менение методик плохо разграничивалось, это замедлило выработку свода нормативных предписаний (стандартов) к практическому ис­пользованию тестов и нестандартизованных процедур. Требуется коренным образом изменить такое положение, когда нормативное регулирование отстает от реальной практики: нормативное регулирование должно сопровождаться выработкой такой системы правил, которая бы опережала практику, задавала ей ориентиры, пер­спективы на будущее. Ниже приведен возможный проект некото­рой разумной, с точки зрения авторов, системы правил и ориенти­ров на будущее[7] .

Требования к психодиагностической литературе и методи­ческим материалам. Разработчик и пользователь методик взаимо­действуют между собой прежде всего посредством методической ли­тературы. Стандартные требования к оформлению руководства, ме­тодических указаний, писем и другой методической литературы при­няты в качестве директивных документов обществами психологов ряда стран.

Целесообразно различать круг требований к документам раз­ного типа: 1) к исследовательской литературе, публикуемой в на­учных журналах, сборниках и монографиях, 2) к обзорно-анали­тическим руководствам и справочным изданиям, освещающим процедурные и количественные, а также содержательно-теорети­ческие аспекты применения какой-то методики или какого-то класса методик, 3) к «подручным методическим материалам», непосред­ственно инструктирующим пользователя в применении методики и содержащим стимульный материал, инструкции, тексты заданий, ключи, нормы, правила интерпретации, 4) к популярным издани­ям по психодиагностике.

1. Научные сообщения. Должны освещать: теоретические осно­вания методики (концепт и методический прием), способы разра­ботки и эмпирического обоснования, исследовательские данные о репрезентативности, надежности, валидности шкалы тестовых по­казателей (коэффициенты корреляций, регрессионные и факторные веса). Для читателей в научном сообщении могут быть даны «об­разцы» отдельные примеры тестовых заданий, позволяющие про­иллюстрировать принципы, на которых построена методика. В на­учных сообщениях не должны освещаться: для методик с профес­сиональными ограничениями («п-методик») - полный текст заданий ключи, тестовые нормы, детальные инструкции по проведению и интерпретации. Обо всей этой информации автор научного сообще­ния должен говорить лишь косвенно, используя ссылки на распрос­траняемую среди специалистов «инструктивную» литературу В на­учном сообщении могут быть приведены исчерпывающие описания методик, знание которых (и их возможное применение) непрофес­сионалами не может принести ущерба конкретным людям или пси­ходиагностическому потенциалу самой методики Этот класс мето­дик предлагается условно обозначить термином «открытые методи­ки» («о-методики»).

Автор научного сообщения имеет право определить статус разра­ботанной им методики как открытой методики, но любые модифика­ции или адаптации методики, уже определенной как профессиональ­ная «п-методика», должны освещаться в научных сообщениях в соот­ветствии с указанными требованиями. :

2. Справочно-методические издания. В этих изданиях могут быть приведены инструктивные материалы, включая текст заданий (воп­росов ключи, нормы, но при одном принципиальном условии: изда­нию придается статус издания для специалистов, обеспечивающий ему распространение среди читателей, имеющих необходимую пси­хологическую подготовку. Авторский коллектив такого издания лич­но отвечает перед Обществом психологов за распространение тира­жа этого издания по назначению.

3. Инструктивные документы. Содержат описание методики, обеспечивающее ее адекватное использование в точном соответ­ствии со стандартами: предмет диагностики, сфера применения, контингент испытуемых, процедура применения. Описание обяза­тельно должно снабжаться подробными сведениями о процедуре разработки методики и полученных при этом данных о надежнос­ти и валидности. Приведенные тестовые нормы должны сопровож­даться однозначным описанием выборки стандартизации и харак­тера диагностической ситуации в обследовании: добровольное участие испытуемых, бескорыстно сотрудничающих с психологом в: целях помощи исследованию («научное сотрудничество»), участие платных испытуемых («платное участие»), использование методи­ки в ходе запроса испытуемого на получение консультативной по­мощи («ситуация клиента»), использование методики в ходе при­нудительного (сплошного) административного обследования («си­туация экспертизы»).

Справочно-методические издания и инструктивные документы должны периодически (с определенным интервалом, зависящим от типа методики) пересматриваться, так как условия применения мето­дик со временем неизбежно меняются, а следовательно, изменяются психометрические свойства.

В справочных и инструктивных материалах должны быть одно­значно сформулированы требования к профессиональному статусу пользователя методики.

Инструктивные документы должны пройти объективные испыта­ния на однозначность указанных в них предписаний: пробная группа пользователей методики (теста) должна направлять автору докумен­та копии протоколов по результатам обследования, на основании ко­торых автор должен обеспечить идентичность стандартов авторского варианта методики и тех характеристик методики, которые выявля­ются при ее использовании. Последнее требование имеет принципи­альное значение для методик, предполагающих значительное учас­тие «экспертной» оценки (инструкции к контент-анализу, к интерпре­тации результатов проективной техники, полустандартизованного интервью и т. п.).

Процедуры подсчета тестовых баллов и интерпретации должны быть описаны с однозначной ясностью, позволяющей получать иден­тичные результаты при обработке одинаковых протоколов разными пользователями.

Предпочтительно включение и использование пользователями тестов локальных тестовых норм (по сравнению с не специализиро­ванными по популяции).

4. В популярных изданиях авторы-психологи не имеют права раз­глашать профессиональную тайну: описывать смысл диагностичес­ких приемов, знание которых испытуемыми существенно вредит валидности методики.

1.5.1. Требования к методикам

Целесообразно придерживаться разных требований к психодиаг­ностическим методикам разного типа.

1. Измерительные методы (тесты) должны удовлетворять сле­дующим требованиям:

а) должны быть однозначно сформулированы цели, предмет и область применения методики. Предмет, диагностический конструкт (концепт), должен быть сформулирован в теоретических понятиях и соотнесен на теоретическом уровне с системой релевантных концеп­тов. Должна быть четко выделена область применения, под которой подразумевается особая социальная среда или сфера общественной практики (производство, медицина, семейная жизнь и т. п.), контин­гент испытуемых (пол, возраст, образование, профессиональный опыт, должностное положение). Должны быть конкретизированы цели ис­пользования результатов: для прогноза успешности профессиональ­ной деятельности, для психологического вмешательства, для приня­тия правовых, административных решений, для прогноза стабильно­сти коллектива и т. п.;

б) процедура проведения должна быть задана в виде однозначно­го алгоритма, пригодного для передачи лаборанту, не имеющему спе­циальных психологических знаний, или ввода в компьютер, исполь­зуемый для предъявления заданий и анализа ответов;

в) процедура обработки должна использовать статистически обо­снованные методы подсчета и стандартизации тестового балла (по статистическим или критериальным тестовым нормам). Выводы (ди­агностические суждения) на основе тестового балла должны сопро­вождаться указанием на вероятностный уровень статистической дос­товерности этих выводов;

г) тестовые шкалы должны быть проверены на репрезентатив­ность, надежность и валидность в заданной области применения. Другие разработчики и квалифицированные пользователи должны иметь возможность повторить стандартизационные исследования в своей области и разработать частные стандарты (нормы);

д) процедуры, основанные на самоотчете, должны быть снабже­ны средствами контроля за достоверностью, позволяющими автома­тически отсеивать недостоверные протоколы;

е) головная методическая организация определенного ведомства (области применения) должна вести банк данных, собранных по тесту, и производить периодическую коррекцию всех стандартов методики.

2. Экспертные методы:

а) данный пункт повторяет содержание пункта а) для тестов. До­полнение: инструкции по применению снабжаются указанием на тре­буемую квалификацию экспертов, их необходимое количество для получения надежных данных по методу независимых оценок;

б) инструкции по применению должны пройти специальные ис­пытания на однозначность их выполнения экспертами по отношению к некоторому эталонному набору данных (текстов, рисунков, звуко-или видеозаписей и т. п.);

в) процедура обработки результатов должна включать в себя та­кое документирование промежуточных этапов обработки, которое позволило бы перепроверить конечный результат другому эксперту;

г) пользователи-разработчики должны иметь возможность вос­произвести нормативное исследование по измерению экепертжж со­гласованности на эталонном наборе данных;

д) головная организация должна вести банк данных, обеспечивая подготовку пользователей и их переподготовку (в соответствии с пе­ресмотренными стандартами методики).

Любая методика, неудовлетворяющая перечисленным выше тре­бованиям, не может считаться профессиональной психодиагностичес­кой методикой. Методики должны проходить аттестацию в рамках головных методических организаций в обязанности- которых входит / составление библиотек «аттестованных психодиагностических мето­дик». Вся инструктивная литература по методикам, не прошедшим аттестацию, не может считаться пригодной для применения в практи­ческой психологии. Это не исключает возможность применения не­аттестованных методик в исследовательских целях.

1.5.2. Требования к пользователям

К пользователям, являющимся профессиональными психологами, и к пользователям-непсихологам предъявляются разные требования. Пользователь-психолог:

а) должен знать и применять на практике общие теоретико-ме­тодологические принципы психодиагностики, владеть основами диф­ференциальной психометрики, должен следить за текущей методи­ческой литературой по психодиагностике, самостоятельно вести кар­тотеку и личную библиотечку методик, применяемых в заданной об­ласти;

б) отвечает за решения, принимаемые на основе тестирования, обеспечивая их соответствие репрезентативности и прогностической валидности методики. Он предупреждает возможные ошибки, допус­каемые непрофессионалами, не знакомыми с ограничениями в исполь­зовании того или иного теста;

в) пользуется преимущественным правом по сравнению с непро­фессионалами на проведение психодиагностики в заданной области, на использование протоколов в соответствии с профессионально-эти­ческими принципами и интересами психологии. Он пользуется пре­имущественным правом получения методических материалов, в том числе приобретения их в качестве индивидуальной профессиональ­ной собственности.

Психолог обеспечивает необходимый уровень надежности диаг­ноза, применяя параллельные стандартизованные и нестандартизо­ванные методики, а также метод независимых экспертных оценок;

г) в подборе методик в комплексную программу обследования не руководствуется субъективными предпочтениями и предубеждения­ми в оценке методик, а исходит из требования максимальной эффек­тивности диагностики: максимум надежности при минимуме затрат;

д) параллельно с использованием методик ведет научно-методи­ческую работу, анализируя по собранным данным эффективность применения методики в заданной области. Ведение такой научно-ме­тодической работы входит в основной круг обязанностей психолога, работающего и в исследовательских, и в лечебных учреждениях. В этой работе психолог поддерживает оперативные контакты с голов­ной методической организацией, передавая ей копии протоколов (для накопления банков данных) и получая инструктивные методические материалы;

е) обеспечивает тщательное соблюдение всех требований для про­ведения стандартных методик обследования. Подсчет баллов, интер­претация, прогноз делаются в строгом соответствии с методическими указаниями. Психолог не имеет права отклоняться от стандарта в использовании методики, принятого на определенный период. Все рекламации и предложения по использованию методики психолог направляет в методический центр и требует их учета при очередном пересмотре методики;

ж) обеспечивает конфиденциальность психодиагностической ин­формации, полученной от испытуемого на основе «личного доверия». Психолог обязательно предупреждает испытуемого о том, кто и для чего может использовать эту информацию. Психолог не имеет права скрывать от испытуемого то, какие решения могут быть вынесены на основе психологической диагностики;

з) психолог хранит профессиональную тайну: не передает лицам, не уполномоченным вести психодиагностическую практику, инструк­тивных материалов, не раскрывает перед потенциальными испытуе­мыми секрет той или иной психодиагностической методики, на кото­ром основана его валидность;

и) обязательно рассматривает наряду с наиболее вероятной и аль­тернативную диагностическую гипотезу (интерпретацию данных), применяя в психодиагностике принцип, аналогичный принципу «пре­зумпции невиновности» в судопроизводстве;

к) сообщает в региональные или центральные органы Общества психологов о всех замеченных им где-либо нарушениях нормативных (процедурных и этических) принципов психодиагностики. Психолог уполномочен лично препятствовать некорректному и неэтичному при­менению психодиагностики.

1.5.3. Использование методик специалистами-смежниками

Отдельные, хорошо теоретически и психометрически обоснован­ные методики, не требующие специальных знаний при интерпретации, могут использовать специалисты смежных с психологией областей: учи­теля, врачи, социологи, инженеры, экономисты. При этом специалист-смежник (пользователь) должен выполнять следующие требования:

а) предварительно проконсультироваться с психологами, работа­ющими в данной практической отрасли, о том, какие именно методики могут быть применены для решения поставленных задач. При на­личии аттестованных методик пользователь должен воспользоваться именно ими;

б) если психологи предупреждают пользователя о том, что правиль­ное использование методики требует общих знаний о психодиагности­ке или специальной подготовки (по овладению методикой), то пользо­ватель обязан либо выбрать другую методику, либо пройти соответ­ствующую подготовку, либо привлечь к проведению психодиагности­ки психолога, либо отказаться от проведения психодиагностики;

в) пользователь, получающий доступ к «п-методикам», автомати­чески берет на себя обязательство по соблюдению профессиональ­ной тайны;

г) пользователь соблюдает все этические нормативы в проведе­нии обследования по отношению к испытуемому и любым третьим лицам: он, так же как психолог, не имеет права злоупотреблять дове­рием и обязан предупреждать испытуемого о том, как будет исполь­зована информация;

д) методики, не обеспеченные однозначной стандартной инструк­цией, необходимыми показателями надежности и валидности, требу­ющие параллельного использования высокопрофессиональных экс­пертных методов, не могут использоваться специалистами-непсихологами;

е) пользователь содействует психологам в соблюдении процедур­ных и этических нормативов, предпринимает меры для предотвраще­ния некорректного использования методик.

Все приведенные требования находятся в соответствии с меж­дународными профессионально-этическими стандартами, приняты­ми в работе психологов. Основные идеи этих стандартов могут быть кратко сформулированы в виде следующих принципов: 1) ответ­ственность, 2) компетентность, 3) этическая и юридическая право­мочность, 4) квалифицированная пропаганда психологии, 5) конфи­денциальность, 6) благополучие клиента, 7) профессиональная коо­перация, 8) информирование клиента о целях обследования, 9) мо­рально-позитивный эффект исследования, 10) гражданственность и патриотизм.

ГЛАВА 2 ИЗ ИСТОРИИ ПСИХОДИАГНОСТИКИ

В этой главе мы рассмотрим некоторые вопросы, связанные с историей психодиагностики как научной и практической деятельнос­ти. Конкретно будут рассмотрены три сферы психодиагностики: пси­хологические тесты, проективные процедуры и контент-аналитичес­кие техники, - сферы, которые больше, чем другие, обладают соб­ственной историей.

В истории науки замечено, что нередко приходится возвращаться к вопросам, которые в свое время не были решены. Особенно чув­ствительным влияние этой нерешенности (или незаконченности) ока­зывается в тех случаях, когда тот или иной вопрос, решенный в свое время неверно, наследуется позднейшей наукой именно в этой оши­бочной редакции и оказывает сильнейшее воздействие на все постро­ения (Емельянов Л. И., 1978). Не являются в этом смысле исключени­ем и проблемы психодиагностики.

2.1. ИЗ ИСТОРИИ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ

Предыстория тестов уходит в глубину веков, она связана с испы­таниями различных способностей, знаний, умений и навыков. Сооб­щается, что уже в середине III тысячелетия до н. э. в Древнем Вави­лоне проводились испытания выпускников в школах, где готовились писцы. Профессионально подготовленный писец, благодаря обшир­ным по тем временам знаниям, был центральной фигурой месопотамской цивилизации. Он был обязан знать все четыре арифметичес­ких действия, уметь измерять поля, распределять рационы, делить иму­щество, владеть искусством пения и игры на музыкальных инстру­ментах. Кроме того, проверялось умение разбираться в тканях, металлах, растениях (Дандамаев М. А., 1983).

В Древнем Египте только того обучали искусству жреца, кто был способен выдержать систему определенных испытаний. Вначале кан­дидат в жрецы проходил собеседование, в процессе которого выяс­нялись его биографические данные, уровень образованности; кро­ме того, оценивались внешность, умение вести беседу. Затем следо­вали проверки: умения трудиться, слушать и молчать, испытания огнем, водой, страхом преодоления мрачных подземелий в полном одиночестве и др. (Аванесов В. С., 1982). Все эти довольно жесткие испытания дополнялись угрозой смерти для тех, кто не был уверен в своих способностях к учению и в том, что сумеет выдержать все тяготы длительного периода образования. Поэтому каждому канди­дату предлагалось еще раз подумать и, тщательно взвесив, решить, с какой стороны закрыть за собой дверь в храм - с внутренней или с внешней.

Сообщается, что эту суровую систему испытаний успешно пре­одолел знаменитый ученый древности Пифагор. Вернувшись в Гре­цию, он основал школу, допуск в которую открывал только для тех, кто был способен преодолеть серию различных испытаний, похожих на те, которые он выдержал сам. Как свидетельствуют источники Цит. по: Голицын Н. Н., 1855, q. 118), Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что «не из каждого де­рева можно выточить Меркурия», и потому, вероятно, придавал боль­шое значение диагностике именно этих способностей. Для этого каж­дому давалась сравнительно трудная математическая задача. В слу­чае ее решения вопрос о приеме решался сразу. Однако чаще всего задача не решалась, после чего неудачника вводили в зал, где учени­ки, по правилам испытаний, должны были беспощадно поднимать его на смех, давая ему обидные прозвища. Если поведение новичка в этой критической ситуации характеризовалось умением отвечать на выпа­ды, хорошо и достойно держать себя, его принимали в школу (под­робнее см.: Аванесов В. С., 1982).

Особое значение Пифагор придавал смеху молодых людей, ут­верждая, что манера смеяться является самым хорошим показателем характера человека. Он внимательно относился к рекомендациям ро­дителей и учителей, вел тщательное наблюдение за каждым нович­ком после того, как последнего приглашали свободно высказываться и не стесняться, смелее оспаривать мнения собеседников (там же).

Сообщается (Dubois P., 1970), что за 2200 лет до н. э. в Древнем Китае уже существовала система проверки способностей лиц, желав­ших занять должности правительственных чиновников[8] . Каждые три года чиновники повторно экзаменовались лично у императора по «шести искусствам»: музыке, стрельбе из лука, верховой езде, уме­нию писать, считать, знанию ритуалов и церемоний. Для государства система экзаменов была важным средством отбора достаточно спо­собных, в меру эрудированных и, главное, лояльных по отношению к власти людей для последующего их использования на администра­тивной службе.

Нередко результаты испытания интеллектуальных способностей становились предметом гордости того или иного народа, а иногда служили даже для извлечения доходов. Сообщается, например, что индийский царь Девсарм, желая испытать мудрость персов, прислал им шахматы. Предполагалось, что персы вряд ли сумеют разгадать суть этой игры, и потому они должны были по условию отослать в Индию подать. Сообщается, однако, что визирь Хо-срова Важургмихр понял правила шахматной игры и, в свою очередь, изобрел игру, на­зываемую сейчас нарды. Он послал с новой игрой гонца в Индию, где ее, как выяснилось, разгадать не смогли (Орбели И. А., 1936).

Другим свидетельством использования испытаний тестового ха­рактера являются материалы, излагающие основы религиозного уче­ния чань-буддизма. Учителя чань-буддизма использовали загадки, вопросы-парадоксы с одновременным созданием ситуации психоло­гического стресса. Отвечать на них необходимо было сразу, на разду­мывание не отводилось ни секунды. Как отмечает Н. В. Абаев, в чаньских поединках-диалогах сама парадоксальность постановки вопро­сов (например, была ли борода у бородатого варвара или имеет ли собака природу Будды) создавала драматическое напряжение, кото­рое усиливалось всем образом действий наставника. Хватая своего оппонента и крича на него: «Говори! Говори! Отвечай немедленно!», он создавал ситуацию психического напряжения. Чаньские парадок­сальные загадки использовались, по мнению этого же автора, в каче­стве тестов на определенный, «чаньский» ход мышления. В зависимости от того, как тестируемый отвечал на эти загадки, опытный на­ставник определял, на каком уровне «просветленности» он находил­ся и какие меры нужно принять для углубления его «чаньского опы­та», а также выявлял людей, скрывающих за внешней грубостью и странностью манер свою некомпетентность (Абаев Н. В., 1980).

В созданном чжурчжэнями государстве Цзинь результаты экза­менов применялись для распределения выпускников медицинского училища. Из числа выдержавших экзамены лучшие поступали на государственную службу в качестве практикующих врачей, препо­давателей или исследователей, худшие получали разрешение зани­маться частной практикой. Не выдержавшим экзамен рекомендова­лось либо продолжить подготовку, либо сменить профессию (Воро­бьев М. В., 1983).

Различные конкурсы и экзамены устраивались и в средневековом Вьетнаме. Всего за два года, в период с 1370 по 1372 г., удалось про­вести переаттестацию всех военных и гражданских чиновников, что позволило организовать проверку государственного аппарата по всей стране. В результате этого Вьетнам вновь стал сильным и жизнеспо­собным феодальным государством; особое внимание было уделено созданию боеспособного офицерского корпуса (Берзин Э. О., 1982).

В XV в. конкурсные испытания были упорядочены: они проводи­лись по этапам и турам. Присвоение высших степеней на экзаменах сопровождалось большими почестями. Лауреаты получали подарки от короля, их имена вносились в «золотой список», который вывеши­вался у Восточных ворот столицы, об их победах на конкурсе сооб­щалось в родную общину. Имена наиболее отличившихся высекали на специальных каменных стелах, установленных в Храме Литерату­ры (Берзин Э. О., 1982).

Интересные данные приводятся В. Н. Басиловым в отношении шаманства. У некоторых народов (например, у эскимосов) чуть ли не каждый взрослый мужчина считал себя способным к шаманству, но эти претензии отвергались в процессе испытаний. Проверка и, как результат ее, признание были непременными условиями шаманской деятельности. У разных народов проверка шамана принимала свои формы. В частности, когда у казахов кто-либо объявлял себя шама­ном, то он по требованию народа должен был, ходить по снегу в трес­кучий мороз босиком и с обнаженной головой, лизать языком раскаленные докрасна железные предметы. У народности ханты неудачно­го претендента объявляли сумасшедшим. У ульчей шаман подвергал­ся испытаниям во время поминок. Такой же обычай был у нанайцев (Басилов В. Н., 1984).

Приведенный краткий исторический экскурс позволяет сделать вывод о необходимости рассматривать испытания индивидуальных способностей как важную и неотъемлемую часть общественной жиз­ни многих (если не всех) народов мира со времен древнейших циви­лизаций и до наших дней. Однако можно ли, на основании приведен­ных данных, говорить о глубокой истории и широкой распространен­ности тестов? Если согласиться с наиболее известными сейчас опре­делениями теста, даваемыми как перевод с английского слова «test» - испытание, проверка, проба, то на поставленный вопрос надо ответить утвердительно. Дело, однако, в том, можно ли в наше время так определять тест...

С течением времени обыденное представление о тесте и научное понимание теста все больше удалялись друг от друга. Хотя всякий тест включает в себя элемент испытания, он не сводится только к нему, ибо сейчас это метод исследования, включающий в себя ряд чисто научных требований. На каждом этапе развития науки требования к тестам и они сами менялись. Игнорирование этого диалектического момента нередко приводит к упрощенчеству в оценках тестов.

Настоящая история тестов началась век назад, в канун периода ломки устаревшего общественного строя, революционного измене­ния общественного сознания, совпавшего по времени с научным кри­зисом, сразившим естествознание. Диалектика и материализм потряс­ли идеалистический фундамент психологии и стали основой новой методологии.

К началу XX в. практические потребности изучения преобладаю­щих способностей были сформулированы в виде научной проблемы исследования индивидуальных различий. Эта проблема и дала им­пульс к появлению первых тестов. Известный английский ученый Ф. Гальтон в течение 1884-1885 гг. провел серию испытаний, в кото­рых посетители .лаборатории в возрасте от 5 до 80 лет могли за не­большую плату проверить свои физические качества (силу, быстроту реакции и др.), а также ряд физиологических возможностей организ­ма и психических свойств - всего по семнадцати показателям. В число последних вошли показатели роста, веса, жизненной емкости лег­ких, становой силы, силы кисти и удара кулаком, запоминаемости букв, остроты зрения, различения цвета и другие. По полной програм­ме было обследовано 9337 человек. Ф. Гальтон писал, что практика вдумчивого и методичного тестирования - не фантазия; она требует рассмотрения и эксперимента (Galton F., 1884).

Это был первый существенный отход от тысячелетней практики испытаний и проверок, основанной на интуиции. Применительно к тестам значение деятельности Гальтона можно сравнить с тем, что сделал Галилей для физической науки своими остроумными экспери­ментами. Набиравший силу радикальный эмпиризм рассматривался рядом ученых конца XIX в. как вполне приемлемая альтернатива иде­ализму, а эксперимент - как настоящий фундамент науки. «Только тогда психология сможет стать действительной и точной наукой, -писал, Дж. Кеттелл, — когда она будет иметь своей основой экспери­мент и измерения» (Cattell D., 1890).

Кеттелл, по-видимому, первым увидел в тестах средство измере­ния, казалось бы, неизмеряемых свойств человеческой психики. В работе, опубликованной в 1890 г., он дал список 50 лабораторных те­стов, которые мы бы сейчас назвали не тестами, а контрольными за­даниями. Эти тесты проводились с соблюдением только двух из изве­стных сегодня требований к тестам: имелась инструкция по их при­менению и подчеркивался лабораторный (т. е. научный) характер ис­пытаний. В частности, указывалось, что лабораторию следует хорошо оборудовать, в нее не допускаются зрители во время тестирования; все испытуемые инструктируются одинаково, все они должны хоро­шо усвоить, что и как нужно им делать (Cattell D., 1890).

Надо ли говорить, сколь непривычной казалась идея измерения для психологии XIX века. Измерение с помощью тестов казалось тог­да, а многим кажется и по сей день, делом если не странным, то пре­тенциозным. Обыденное сознание исходило при этом из аналогии с физическими измерениями и рассматривало эти попытки математи­зации как чуждый для гуманитарной психологии уклон. Примерно с такими же трудностями сталкивалась и психофизика.

Тем не менее к концу 20-х годов нашего столетия все больше ста­ла ощущаться потребность в создании специфического направления, связанного с особенностями использования числа и меры. В психологии эту роль выполняла психометрия, в биологии - биометрия, в экономике - эконометрия, в науке в целом - наукометрия. К ним сле­довало бы добавить и социометрию, но последнюю Дж. Морено и Г. Гурвич свели к элементарным методам оценки взаимодействия ин­дивидов в малых группах.

С момента первых публикаций Ф. Гальтона и Дж. Кеттелла идея тестового метода сразу же привлекла к себе внимание ученых разных стран мира. Появились первые сторонники тестов и первые же их противники. В числе сторонников были: в Германии - Г. Мюнстерберг, С. Крепелин, В. Онри, во Франции -А. Бине, в США - Дж. Гил­берт и другие. Это были исследователи нового типа, стремившиеся связать психологию тех лет с запросами практики. Однако стремле­ние к прикладным исследованиям в психологии прошлого расцени­валось как отход от науки. Кетгелл, например, сообщал, что он начал свои первые тестовые лабораторные исследования индивидуальных различий в 1885 году, но публиковаться не мог из-за противодействия В. Вундта (Cattell D., 1896).

Итак, научный статус тестов не был определен, возможность из­мерений в психологии подвергалась сомнению. Психология пережи­вала трудный период: она уже не могла развиваться на старой основе, но и не научилась еще смотреть на мир по-новому. «Причина кризи­са, - писал Л. С. Выготский, - лежит в развитии прикладной психо­логии, приведшей к перестройке всей методологии науки на основе принципа практики. Этот принцип давит на психологию и толкает ее к разрыву на две науки» (цит. по: Ярошевский М. Г., Гургенидзе Г. С., 1977). Общественная практика требовательно выдвигала одну про­блему за другой, и ни одну из них старая психология решить не мог­ла - у нее не было подходящих методов.

Появление в этой ситуации прикладной психологии не было слу­чайностью. Ей было дано название «психотехника». Прикладное на­правление появилось и в педагогике. Хотя педология претендовала на звание науки о комплексном развитии ребенка, в тот период она была в основном прикладной педагогикой. Отвергнутые в традици­онной науке - в психологии и в педагогике, тесты быстро нашли себе применение в прикладных направлениях. В общем, произошло так, как говорили в древности: если какой-либо науке не находится места в храме, она начинает развиваться у его стен.

Активизация роли науки в практическом переустройстве жизни столкнулась с традицией занятий «чистой наукой, созерцанием исти­ны». Для представителей чистой науки прикладность не имела замет­ной ценности. В 30-х годах ученые Кембриджа больше всего горди­лись тем, что их научная деятельность ни при каких мыслимых об­стоятельствах не может иметь практического смысла (Сноу Ч., 1973). Цель, методы и результаты психотехники лежали в сфере практики, в то время как цели, методы и результаты традиционной психологии лежали в области теоретических рассуждений. Различались произво­дительная и познавательная функции этих направлений. То, что име­ло ценность для психотехники, психология того времени ни принять, ни произвести сама не могла, так же как и психотехника мало что могла дать психологии.

Размежевание стало заметным в конце 20-х - начале 30-х годов. Вместо объединения усилий обе стороны приступили к взаимным обвинениям и затяжным дискуссиям. Психология обвинялась в схо­ластике, узком академизме, в неспособности воспринять новое и в отрыве от практики жизни. Психотехника, в свою очередь, осужда­лась за узкий практицизм, противоречащий духу науки, за отрыв от психологии; она обвинялась в голом эмпиризме, прикладности, в чрез­мерном увлечении тестами... Последнее обвинение стало узловым пун­ктом критики.

Разрыв между фундаментальным и прикладным направлениями был до недавнего времени характерен для многих наук, но не везде он протекал столь болезненно, как в психологии. Даже в историчес­кой науке получили распространение взгляды морализирующих ис­ториков, противопоставляющих «чистое и возвышенное познание» различным формам приложения науки, влекущим за собой лишь не­счастья и опасности (Шахназаров Г. X., 1981).

Начало 30-х годов характеризуется широким использованием тес­тов во многих странах. Во Франции они стали применяться для дефек­тологических целей и для профориентации, в США тесты использова­лись при приеме на работу, в колледжи, для оценки знаний школьников и студентов, в социально-психологических исследованиях. В России тесты применялись в основном в двух основных сферах: в народном образовании и в сфере профотбора - профориентации. Затронутые те­стами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений как за, так и против тестов. Большой энтузиазм тех, кто их при­менял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в результате его использования, породили во многих, странах, в том числе и в России, письма в правительственные органы и в газеты с требованием запрета тестов.

В отечественной истории тестов начали 30-х годов характеризу­ется интенсивным и неконтролируемым использованием тестов в системе народного образования и в промышленности. Практика, как это часто бывает, опережала теорию. Массовые тестовые обследо­вания не подкреплялись серьезной проверкой качества инструмен­тария, решения о переводе некоторых учащихся в классы для ум­ственно отсталых детей принимались на основе коротких тестов без учета других факторов, влияющих на результаты проверки. В про­мышленности на основе таких же тестов делались попытки класси­фицировать работников по различным профессиям, без вниматель­ного учета личных склонностей и интересов. Ввиду надвигавшейся тестомании и ряда причин субъективного характера было принято известное постановление «О педологических извращениях в систе­ме наркомпросов» (1936), наложившее запрет на применение бес­смысленных (как там отмечалось) тестов и анкет. Это постановле­ние, по мнению А. Н. Леонтьева, А. Р. Лурия и А. А Смирнова, по­лучило в последующие годы неправомерно расширительное толко­вание и привело к отказу от разработки научно обоснованных методов психологической диагностики личности (Леонтьев А. Н., Лурия А. Р., Смирнов А. А., 1968).

В те годы были, однако, и другие выступления - в пользу тестов. Так, известный психолог М. Я. Басов говорил: «Я думаю все же, что эта долгая, подчас острая критика тестовой методики... в конце кон­цов приведет не к ниспровержению, не к упразднению этой методи­ки, а, напротив, к ее упрочнению и к ее утверждению в определенных границах, в которых она, очевидно, имеет полное право на примене­ние и существование» (Тесты: теория и практика. М., 1928, № 2, С. 54).

Тем не менее, начиная с указанного периода критика тестов при­обрела широкий размах и вышла за рамки чисто научных дискуссий. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, с порога. В США, например, против использования тестов выступали представители основных групп населения США - взрос­лые и дети, белые и негры, рабочие и управленческий персонал, а также представители национальных меньшинств.

В результате проведения серии исследований по социальным по­следствиям тестирования выяснилось, что 37 % опрошенных возра­жали против использования тестов при поступлении на работу, 50 % -при продвижении по службе, 25 % - против использования тестов в школе (Brim S., 1965). Случаи нарушения этики при использовании тестов оказались столь злободневными, что ими вынужден был за­няться Конгресс, устроивший специальные слушания по этому делу. В результате было принято решение, осуждающее неэтичное исполь­зование тестов, практику вторжения в частную жизнь как идущую вразрез с моральными нормами (Armor D., 1974). В августе 1966 г. в Сенате США обсуждалось предложение о полном запрещении тес­тов, но это предложение не было поддержано большинством.

В зарубежной литературе выделяется несколько источников кри­тики тестов. Психолог С. Брим усматривает первый источник в лич­ностном портрете критиков, в числе которых чаще других оказыва­ются те, кто не склонен к самопознанию и интроспекции, авторита­рен в межличностных отношениях, нетерпим к мнению других и возражает против всяких социальных перемен. Как правило, в США эти лица примыкают к правым политическим группам, требующим запрещения тестов. Второй источник критики этот же автор видит в системе социальных ценностей, имеющей свои корни в отношении к вопросам равенства людей. Если в обществе одобряется принцип открытого соревнования его членов, то в каждом поколении на пе­редовые позиции должны выдвигаться наиболее талантливые люди. В таком обществе каждый должен иметь возможность внести свой вклад в соответствии со своими способностями. Последние долж­ны быть оценены, и потому ориентация на этот принцип создает благоприятное отношение к тестам (Brim S., 1965). Третий источ­ник является, по мнению Р. Кеттелла (Cattell R., 1950), следствием эмоционального и сентиментального отношения людей эстетичес­кого и нарциссического типа, возражающих против всякой попытки представить «уникальную, художественную личность» в виде фор­мул. Четвертый источник критики является научным и касается не­достатков тестового метода.

В 30-е годы случилось так, что психотехника не оправдала возла­гавшихся на нее надежд в смысле заметного повышения производи­тельности труда. Она и не могла это сделать, потому что на том, срав­нительно низком уровне промышленного развития прогресс в значи­тельной мере зависел от уровня индустриализации и автоматизации производства. При достижении необходимого уровня развития средств производства человеческий фактор вновь начинает играть ключевую роль. Вот почему именно в последние годы стал заметно увеличи­ваться поток прикладных психологических исследований, нацелен­ных, в частности, на повышение эффективности человека-оператора в управлении сложными техническими системами. Соответственно возросла роль психофизики, психометрии, прикладной и инженерной психологии, психологии труда и безопасности, экспериментальной психологии, научно обоснованной профориентации и профотбора. Вместе с этим опять возросло и значение тестов.

Хотя в 30-е годы практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в на­шей стране не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний, и, наоборот, различные испытания нередко назывались тестами. Суть вопроса, разумеется, не в названи­ях, а в принципиальных отличиях.

Первое отличие состоит в том, что тест является научно обосно­ванным методом эмпирического исследования в психологии и в ряде других наук. Важная мысль К. Маркса о том, что одна экономическая эпоха отличается от другой не тем, что она производит, а тем, каким способом она это делает относится в полной мере и к психологичес­кой науке. В период зрелости в ней, как и везде, все большее внима­ние направляется на способы познания и на критерии обоснования истинности знания.

Второе принципиальное отличие связано со сравнительно новой ролью теста как инструмента теоретического исследования в таких, например, направлениях психологии, как изучение личности, способ­ностей. Здесь использование тестов позволило преодолеть методоло­гический тупик, в котором оказались авторы многочисленных тео­рий, концепций, интуитивных догадок и иных умозрительных пост­роений, не видевших способа обоснования истинности своих сужде­ний. Непосредственное же обращение к практике как критерию истины нередко дает противоречивые результаты, ибо действительно научная аргументация требует определенного структурирования, опос­редования, абстрагирования и, кроме того, методической вооружен­ности исследователя.

Только в последние годы в психологии стала широко осознавать­ся задача согласования теоретических разработок с эмпирическими результатами, для чего стали необходимыми методы, позволяющие это делать без заметной потери качества такого согласования. Тесты являются сейчас, по-видимому, наиболее развитой в научном отно­шении частью методического арсенала, позволяющего адекватно скреплять теорию с эмпирией, в соответствии с некоторыми извест­ными стандартами качества информации. Именно такое понимание тестов все в большей мере начинает утверждаться в новейшей отече­ственной и зарубежной литературе (Анастази А., 1982; Бурлачук Л. Ф., 1979; Кабанов М. М., Личко А. Е., Смирнов В. М., 1983; Кулагин Б. В., 1984; Марищук В. Л. и др., 1984; Мельников В. М., Ямпольский Л. Т., 1985; Практикум по .психодиагностике. Дифференциальная психомет­рика, 1984; Психологические методы исследования личности в кли­нике, 1978; Шванцара И. и др., 1978),

Обоснование качества результатов психологических исследова­ний требует обращения к внепсихологическим понятиям и критери­ям: философским, логическим, математико-статистическим. В част­ности, философский элемент в теорию психологических измерений вносит известный тезис о неизбежности погрешности измерений. Критики психологических тестов нередко апеллируют к этому тезису как к основанию принципиальной порочности тестов в смысле точ­ности измерений. Неточные измерения, считают они, науке вообще не нужны. При этом как-то забывается, что формой преодоления это­го философского скепсиса является тезис о возможности приближен­ного измерения с достаточно приемлемой точностью. Применение на практике последнего тезиса позволило получить, например в фи­зике, те фундаментальные результаты, которыми эта наука по праву гордится.

Не вдаваясь в детальный анализ концепции надежности, представ­ляющей предмет отдельного рассмотрения в данной книге, отметим здесь лишь ее связь с понятием «тест». Действительный отход от уп­рощенного понимания тестов требует наполнения интересующего нас понятия элементами научного языка, восхождения на более высокую ступень абстракции. Концепция надежности составляет одну из ос­нов переосмысления сущности теста, а также одну из характеристик его качества. С появлением корреляционного анализа (в начале XX в.) были предложены три основных методических подхода к определе­нию надежности теста. Это - повторное тестирование, использова­ние параллельных форм одного и того же теста и, наконец, однократ­ное тестирование с последующим разбиением матрицы исходных результатов (X) на две или большее число частей. За показатель на­дежности принимается значение коэффициента корреляции.

Значительно позже появились попытки теоретического осмысле­ния этой концепции. Исходным пунктом всех построений является уже упоминавшийся тезис о неизбежности погрешности измерений и, как следствие, признание множественности возможных причин ис­кажения истинного результата измерения.

Как результат факторно-аналитического переосмысления концеп­ции надежности и гомогенности теста родилась новая технология расчета коэффициента надежности теста. Ее появление надо рассмат­ривать как реакцию на неприемлемость и искусственность ряда та­ких условий и ограничений, как, например, параллельность форм од­ного и того же теста, равенство дисперсий всех высказываний, оди­наковая их коррелируемость друг с другом. Д. Армор использовал известный факт корреляции тестовых высказываний между собой и стал рассматривать ее как аргумент, статистической функцией кото­рого является надежность теста.

Если все высказывания измеряют один и тот же признак (свой­ство), то для фиксированного их числа чем больше корреляция меж­ду ними, тем более надежен тест. С другой стороны, высокая корре­ляция обеспечивает хорошую факторизуемость корреляционной мат­рицы (К) и, следовательно, является залогом выделения такого одно­го фактора, который может объяснить связь большей части дисперсии в R. Следовательно, надежность тестов должна быть связана с резуль­татом факторного анализа. Предложенная Армором формула оказа­лась сравнительно простой (Armor D., 1974, с. 20):

θ =

где θ - коэффициент надежности теста; k— количество высказыва­ний; λ1 - наибольшее значение корня, получаемое при решении ха­рактеристических уравнений вида /R - λ • J / = 0.

Помимо надежности в понятие «тест» входит и концепция валидности. Поскольку в психологии нередки случаи увлечения точностью измерения неточно выделенных свойств, соотношение между надеж­ностью и валидностью можно образно представить в виде кучной стрельбы, но не в центр мишени, т. е. стрельба ведется из оружия впол­не надежного, но прицел стрелок выбрал не совсем точно.

Современный тест - это не только надежный, но и валидный тест, однако не на все случаи жизни, а разработанный для конкретной цели. Нет тестов вообще надежных и валидных. Эти качества характеризу­ют не только инструмент измерения, но обязательно характер, цель и время его применения. В историческом разрезе концепция валидности, так же как и надежности, начиналась с наивного предположения о том, что метод «работает», т. е. каждый создаваемый тест рассматри­вался как валидный, примерно так, как если бы каждая создаваемая социологами анкета годилась для решения поставленных задач. Пер­вые же проявления действительно научной критики развенчали эту, по сути дела, «веру» в валидность. Они же стимулировали поиск. При­влечение известных ученых к созданию тестов было для научной об­щественности в начале нынешнего века гарантией убедительности обоснования валидности как бы по авторитету. Но это был дотеоретический, доэмпирический, по существу, донаучный этап оценки ка­чества тестов.

Поскольку в те годы тесты разрабатывались исключительно для решения практических проблем, эмпиризм и соответствующая ему методология стали главными для обоснования качества инструмен­тария. Это особенно проявилось в создании тестов для решения кад­ровых проблем: профотбора, профориентации, профконсультации, а также распределения принятого контингента по специальностям и отделениям внутри производства или учебного заведения.

С точки зрения истории, можно выделить два основных, эмпири­ческих подхода к валидизации тестов. Первый назовем прогности­ческим. Его логика такова. Если те, кто хорошо работает (по крите­рию У), показывают высокие результаты по какому-либо теcту (X ), значит, здесь есть связь, быть может, и причинная. Иначе говоря, Y , вероятно, зависит от X. Отдавая предпочтение при приеме на работу тем, у кого выше результаты по X, предполагается, что они покажут и более высокую производительность труда. Ожидания такого рода ча­сто сбываются, но в различной степени. Другой подход к эмпиричес­кой валидизации тестов основан на использовании экспертных оце­нок. Здесь логика еще проще: если эксперты (множество авторите­тов) согласованно считают одних более способными, других - менее, значит, «это так». В случае когда результаты теста указывают на сход­ную тенденцию, т. е. данные по тесту коррелируют с данными экс­пертизы, то принимается, что тест является валидным и его можно далее примерять и в других подобных ситуациях. Так проводилась валидизация первого теста для измерения интеллектуальных способ­ностей (Бине А. и Симон Т.), а в наше время - некоторых тестов для измерения социальных потребностей молодежи (Прогнозирование со­циальных потребностей молодежи. М., 1978).

Развитие тестов в тесных рамках эмпиризма не могло продолжать­ся сколь-нибудь долгое время. Без теоретического мышления, как ука­зывал Ф. Энгельс, невозможно связать между собой хотя бы два фак­та природы или уразуметь существующую между ними связь (Маркс К., Энгельс Ф. Соч., т. 20, с. 382). Обращение к внеэмпирическим критериям истинности было неизбежным. Отсюда последо­вали такие подходы к валидизации, в которых теория сочеталась с эмпирией. В качестве примера можно взять важную для традицион­ной психологии область научных конструктов, ключевых психологи­ческих понятий. Именно понятия и конструкты стали основным пред­метом многих исследований с помощью тестов. Последние призваны уточнить эмпирический состав индикаторов (высказываний), соответ­ствующих таким конструктам-понятиям, как личность, темперамент, интеллект, экстраверт и многим другим. В современной психологии они стали предметом эмпирического исследования, и делается это с целью фундаментального обоснования практической значимости те­оретических суждений.

Теперь пора ответить на последний вопрос - что же такое совре­менный психологический тест? Это теоретически и эмпирически обо­снованная система высказываний (заданий), позволяющая получить измерения соответствующих психологических свойств. Теоретичес­кое обоснование предполагает всесторонний анализ теста и результатов его применения в свете известных достижений современной пси­хологической науки. Эмпирическое же обоснование связано с обра­щением к опыту, измерениям и эксперименту.

Здесь может возникнуть ошибочная ассоциация с неопозитивист­ским принципом верификации. Этому способствует наличие в обоих случаях требования эмпирического согласования теоретических кон­цепций (конструктов). Но, как справедливо отмечал Э. М. Чудинов, наука до и независимо от неопозитивизма руководствовалась требо­ванием принципиальной проверяемости своих теорий. Это всегда отличало науку от религии и натурфилософских построений, обеспе­чивало ей строгость и точность. Неопозитивизм абсолютизировал эту грань научного познания, обратив ее против философии и против са­мой науки. Он трансформировал указанное требование в принцип верификации, который накладывает на науку непомерные ограниче­ния и несовместим с ней (Чудинов Э. М., 1977).

Отмеченными выше критериями надежности и валидности про­блема обоснования научности тестов не закрывается. Из используе­мых сейчас двух критериев первый назовем общенаучным, а второй -специально научным. Их широкое применение - всего лишь дань сло­жившейся в теории тестов традиции. В ряде наук идеи валидности преломляются в виде стремления обосновать истинность, необходимость, системность, рациональность и др. Ключевым критерием яв­ляется истинность, которая связана со всеми остальными. Валидность теста соотносится с истинностью через принцип предметности зна­ния, указывающего на степень его соотнесенности с познаваемым. Но все это - область специального исследования, которое еще пред­стоит провести в процессе дальнейшего развития теории и практики применения психологических тестов.

2.2. ИЗ ИСТОРИИ ПРОЕКТИВНОГО МЕТОДА

Проективные методики представляют собой специфическую, до­вольно неоднородную группу психодиагностических приемов клини­ческой ориентации. Последнее означает не столько направленность проективных методик на выявление тех или иных аномалий личнос­ти, сколько способность методик прогнозировать индивидуальный стиль поведения, переживания и аффективного реагирования в зна­чимых или конфликтных ситуациях, выявлять неосознаваемые аспекты личности.

История проективных методик - это и хронология, отмечающая особо важные вехи развития проективной техники, и история разви­тия проективного метода как целостного подхода к пониманию при­роды личности и способов ее экспериментального изучения. Стало традицией вести счет проективным методикам с теста словесных ас­социаций К. Юнга, созданного им в 1904-1905 годах. Метод вызова ответных ассоциаций в психологии известен со времен В. Вундта и , Ф. Гальтона, однако именно К. Юнгу принадлежат открытие и дока­зательство феномена, лежащего в основе всех проективных методик, а именно возможность посредством косвенного воздействия на зна­чимые области-переживания и поведения человека («комплексы») вы­зывать пертурбации в экспериментальной деятельности. Юнг пока­зал таким образом, что бессознательные переживания личности дос­тупны объективной диагностике. Впоследствии разнообразные вари­анты ассоциативного теста применялись для выявления чувства вины (детекторы лжи М. Вертгаймера и А. Р. Лурия), асоциальных вытес­ненных влечений (Дж. Брунер, Р. Лазарус, Л. Постмен, Ч. Эриксен и др.), для отграничения нормы от патологии (Г. Кент и А. Розанов). Тесты незаконченных предложений и рассказов также нередко счита­ют ведущими свое происхождение от ассоциативного-теста Юнга (АнастазиА., 1982; AbtL., BellakL., 1950; Semeonoff В., 1976;Anzieu D., 1967).

Подлинный триумф проективной диагностики связан с появ­лением в 1921 г. «Психодиагностики» Г. Роршаха, опубликованной в Берне на немецком языке. Биография Германа Роршаха, его про­фессиональный путь, по-видимому, немало способствовали направ­лению его исследований и созданию оригинального метода, став­шего одним из самых известных в мировой психологии. Отказав­шись от профессии художника, Роршах тем не менее серьезно ин­тересовался историей искусств. Ему было известно, что великий Леонардо да Винчи тренировал свое воображение путем длитель­ного рассматривания и интерпретации причудливых конфигураций облаков на небе, влажных подтеков и неровностей на стенах, лун­ных отблесков на застывшей воде. Заметим, что способность человека одушевлять окружающий предметный мир присуща всем людям, а детям и художникам - в особенности. Вспомним излюб­ленный прием Г.-Х. Андерсена, заставлявшего кухонную утварь оживать по ночам, сплетничать о соседских обедах и философство­вать. Не исключено, что эта же особенность лежит в основе эсте­тического восприятия действительности. И. Сельвинский писал:

Отчего, когда глядим на волны,

Видим вечность и судьбу людей?

…………………………………….

Отчего пургу зовем «седою»,

«Шепот» слышим там, где камыши?

Оттого, что втайне красотою

Мы зовем полет своей души.

Диссертация Г. Роршаха по медицине была посвящена изучению механизмов галлюцинаций, где он, между прочим, ссылается на од­нажды пережитое им состояние: во время первой в его медицинс­кой практике аутопсии он явственно «видел», как ему пласт за плас­том разрезают «мозг» и как эти пласты падают перед ним один за другим (Anzieu D., 1967). Переживание было очень ясным, живым и не только зрительным, но и сопровождавшимся явственными так­тильными и моторными ощущениями. Роршах предположил, что в наших мечтах и фантазиях наряду со зрительными образами при­сутствует память и о пережитых движениях - кинестетические об­разы, которые слагаются в особый способ, модус мышления. Впос­ледствии Г. Роршах предположил, что чернильные пятна, адресо­ванные зрительному воображению, растормаживают, оживляют мо­торные фантазии.

Известно, что до и независимо от Роршаха с чернильными пятна­ми экспериментировали и другие психологи (например, Ф. Е. Рыба­ков в России, А. Бине и В. Анри - во Франции), однако именно Рор­шах был первым, кто доказал связь образов фантазии с основопола­гающими чертами и свойствами личности. «Роршахиана» как даль­нейшее развитие исследований и идей Роршаха в настоящее время представлена двумя ведущими направлениями: американским (Beck S., 1944; KlopferB., Davidson H., 1962; Rapaport D. et al., 1945-1946) и европейским (Bohm E., 1978; Loosli-Usteri M, 1965).

Американских психологов отличает тенденция к теоретическому обоснованию теста в русле идей «нового взгляда» и психологии «эго», а также стремление к более строгому формализованному представле­нию и анализу эмпирических результатов. Европейские психологи в значительной мере сохраняют верность оригинальной версии Роршаха, развивая и дополняя ее в духе ортодоксального психоанализа.

За время, прошедшее после выхода в свет «Психодиагностики», появились методики, родственные тесту Роршаха. Наиболее извест­ны среди них Бен-Роршах («Bero»)-тест, тест Цуллигера и тест Хольцмана. Bero-тест создавался Роршахом и его непосредственным сотруд­ником как параллельная серия оригинального набора таблиц. Работа над тестом была закончена Цуллигером, также работавшим вместе с Роршахом; Цуллигеру удалось доказать, что по основным показате­лям теста (общему количеству ответов, количеству целостных отве­тов, ответов на белое пространство, ответов с участием цвета и дви­жения) Bero -тест эквивалентен оригинальному набору таблиц. В 1948 г. Цуллигер предложил и собственный вариант теста - Z-тест, -который состоит из трех таблиц: черно-белой, полихромией и черно-красной; обработка включает ряд отсутствующих в финальной вер­сии показателей; главное отличие теста - краткость, формализован-ность анализа результатов.

Тест чернильных пятен Хольцмана (Я I. Т.) отличается еще боль­шей стандартизованностью и схематизацией; используются две па­раллельные серии таблиц по 45 карточек в каждой; на вопрос каждой карточки испытуемый должен дать только один ответ. Достоинством теста Н. I. Т., сделавшим его наиболее валидным и надежным тестом среди «дериватов» методики Роршаха, является наличие нормативов и процентильных показателей по основным категориям шифровки от­ветов.

В отечественной психологии первые, крайне немногочисленные, попытки применения теста Роршаха относятся к 20-м годам и имеют выраженную направленность на выявление аномалий личности в связи с конституциональными типами для диагностики неврозов и психо­патий, а также при исследовании больных эпилепсией (цит. по: Бур-лачук Л. Ф, 1979). С 60-х годов тест Роршаха все шире внедряется в исследовательскую и клинико-диагностическую работу психологов, выходят первые методические руководства (Белая И. И., 1978; Белый Б. И., 1981; Бурлачук Л. Ф., 1979; Соколова Е. Т., 1980; Беспалько И. Г., 1978; Беспалько И. Г., Гильяшева И. Н., 1983). Важно подчерк­нуть, что использование теста Роршаха в качестве диагностического инструмента сопровождается четкой, глубокой рефлексией диагнос­тических задач и теоретических моделей обоснования теста на осно­ве марксистской методологии. Опираясь на базисные положения о пристрастном характере психической деятельности, конкретные тео­ретические обоснования психологи строят на основе таких катего­рий, как «установка» (Цуладзе С. В., 1969; Норакидзе В. Г., 1975), «личностный компонент» восприятия (Савенко Ю. С., 1969, 1978; Блейхер В. М, Бурлачук Л.Ф., 1978), «индивидуальный стиль лично­сти» (Соколова Е. Т., 1978, 1980).

Интересной и многообещающей выглядит попытка А. М. Эткинда трактовать природу связи перцепции и личности в терминах «об­раза мира» как изоморфизм двух структур - чувственной ткани пер­цептивного образа и аффективно-когнитивного единства личности (Эткинд А. М., 1981).

Продолжая хронологический обзор истории развития проектив­ных методов, мы, естественно, не можем не отметить 1935 год, ког­да впервые в журнальном варианте, под двойным авторством, по­явилось сообщение о Тематическом апперцептивном тесте (ТАТ) как методике экспериментального изучения фантазии (Morgan С., Murray H., 1935). В то время тест не был обеспечен ни общей теоре­тической концепцией - в качестве метода исследования личности он стал рассматриваться в более поздних публикациях Г. Мюррея (Murray Н., 1938, 1943), - ни стандартизованным руководством по применению. У этого метода», как и у теста Роршаха, имелись свои предшественники и своя предыстория (см., напр., Abt L., Bellak L., 1950; Rapaport D., 1968). Психологам и психиатрам давно было из­вестно, что рассказы по сюжетным картинкам, специально подобран­ным для исследуемого контингента, позволяют судить о склоннос­тях людей и нередко выявляют болезненные состояния психики. На первый взгляд замысел ТАТ казался более простым и очевидным, чем идея Г. Роршаха. Действительно, разве Чарльзу Диккенсу, за­канчивающему свой любимый роман о Дэвиде Копперфилде, не чудилось, как он сам писал, «будто он отпускает в сумеречный мир частицу самого себя» (Диккенс Ч., 1984, т. 6, с. 7). Мы также различаем за нравственными страданиями героев Ф. М. Достоевского искания его собственной мятущейся души. К сожалению, подобные аналогии, к которым прибегал сам Мюррей при обосновании свое­го метода, мало что проясняют в понимании того, какие именно ас­пекты личного опыта автора прямо и зеркально отражаются в порт­ретах и судьбах его героев, а какие, напротив, трансформируются в прямо противоположные. А. Моруа, например, недвусмысленно на­мекает, что морализм Дюма-сына был не столько «генуинным», сколько формированием реакции в ответ на внутренние запреты и стыд за гуляку-отца. Это отразилось в его авторской позиции, в час­тности в драме «Дама с камелиями» (Моруа А., 1965).

Появление Тематического апперцептивного теста поставило ряд острых проблем, обсуждаемых и по сей день. Одна из них касается прогностичности ТАТ. Исследования 30—50-х годов, проведенные в русле идей «нового взгляда», в целом подтвердили положение Мюррея об отражении в рассказах ТАТ фрустрируемых или отвергаемых «Я»-потребностей. Лишение сна, пищевая, сексуальная депривация, предшествующие успехи или неудачи существенно сказываются на ответах по ТАТ.

Однако в этих же экспериментах обнаружилось, что «сила» потребности и ее отражение в ТАТ связаны не линейной, а U-образной зависимостью: наиболее непосредственно в рассказах проявляются потребности умеренной интенсивности; очень сильная депривация приводит к вытеснению или искажению соответствующих образов фантазии (Sanford R., 1936). Тот же компенсаторный принцип дей­ствует и применительно к так называемым латентным или социально неодобряемым потребностям, например агрессии или гомосексуаль­ности. В итоге действия защитных механизмов в рассказах ТАТ мо­жет искажаться реальная картина личностных особенностей. Так, Эриксон и Лазарус показали, что лица, страдающие скрытым гомо­сексуализмом, на провоцирующие таблицы ТАТ дают нейтральные рассказы (Eriksen С. W., 1951, 1968). Еще более сложным является вопрос о соотношении рассказов и реального поведения. Согласно Мюррею, латентные потребности не осознаются и невыводимы из открыто наблюдаемого поведения, а проявляются только в фантазиях и фантазиоподобной активности типа ТАТ. Эксперименты уточнили эту гипотезу: если потребность - явная или латентная - не имеет «моторной разрядки», фрустрируется в открытом социальном поведении, то она находит компенсаторное удовлетворение в рассказах ТАТ (Lazarus R. S., 1961).

Однако лица, уже совершившие особо тяжкие преступления, мо­гут продуцировать нейтральные или подчеркнуто просоциальные темы (Станишевская М. М., Гульдан В. В., Владимирская М. Т., 1974). Су­щественной детерминантой ответа оказывается и сама ситуация обследования. Если она воспринимается как экспертная, то проявле­ния агрессии строго контролируются. Из сказанного следует, что про­гноз реального поведения на основе прямого отождествления «героя» и обследуемого осуществим только для ограниченного круга личнос­тных черт и тенденций. Так, например, вариант ТАТ Д. Макклелланда и Дж. Аткинсона оказался высоко валидным в отношении мотива­ции достижения (Atkinson J., 1958).

Возвращаясь к хронологии, следует остановиться на работах Ло-уренса Фрэнка 1939—1948 гг., в которых он впервые сформулировал основные принципы проективной психологии. Ему же принадлежит приоритет в использовании термина «проекция» для обозначения осо­бой группы методов исследования личности. Наиболее существен­ной чертой проективных методик Фрэнк считал неопределенность стимульных условий, позволяющих испытуемому проецировать свой способ видения жизни, свои мысли и чувства. Чем более неструкту­рированным является «стимульное поле», тем в большей степени его структурирование индивидом будет изоморфично структуре его ре­ального жизненного пространства (Frank L., 1939).

Концепция Фрэнка, испытавшая сильное влияние «холистичес­ких» теорий личности, акцентирует ряд моментов, чрезвычайно важ­ных, на наш взгляд, для понимания назначения и диагностических границ проективных методик. Проективные методики направлены на раскрытие внутреннего мира личности, мира субъективных пе­реживаний, чувств, мыслей, ожиданий, а вовсе не на экспресс-диаг­ностику реального поведения. Узкопрагматическая ориентация мно­гих исследований часто игнорировала это ограничение, составляю­щее суть проективного метода как особого подхода, способа пони­мания человека. Важно не то, как человек действует, а то, что он чувствует и как управляет своими чувствами. Ясно, что совпаде­ние поведенческого уровня и плана переживаний есть частный случай, поэтому возможность прогноза поведения по проективным ме­тодам ограниченна, зато открывается перспектива проникновения в уникальный мир человеческих чувств и внутреннюю логику его по­строения.

Исследования Фрэнка, теоретико-методологические по своему жанру, породили множество экспериментальных исследований, сре­ди которых особо следует выделить два направления: изучение роли стимула в проекции личностно-значимого материала и изучение фе­номена проекции как психологического механизма, лежащего в основе действенности этой группы методов. Неопределенность стимульных условий неоднократно указывалась в качестве признака, отлича­ющего проективные методики от других, например психометричес­ких, процедур. Тест Роршаха и ТАТ дают примеры двух типов стимульной неопределенности - структурного и содержательно-смыс­лового. Неопределенной является для испытуемого и сама ситуация обследования, не ограничивающая его действия какими-либо стан­дартами и нормативными оценками, но предоставляющая максималь­но широкий выбор способов поведения (Lindsey D., 1959; Бурлачук Л. Ф., 1979; Соколова Е. Т., 1980; Анастази А., 1982). Дж. Брунер также предполагал, что неопределенность, неоднозначность или «за­шумленность» - необходимые стимульные условия для предоставле­ния приоритета личностным субъективным факторам в детермина­ции восприятия и других видов познавательной активности (Брунер Дж., 1977).

В духе экспериментов «нового взгляда» в 40—50-е годы складыва­лись теоретические обоснования теста Роршаха (Draguns J., 1967) и ТАТ (Bellak L., 1950).

Акцентирование неопределенности стимульных условий позво­лило, кроме всего прочего, согласовать проективные методы с психо­аналитическим стилем клинического мышления. Чем более неопре­деленны условия (т. е. чем меньше давление реальности), тем в боль­шей степени психическая активность приближается по своей приро­де к «первичным» психическим процессам (воображению, галлюци­нациям), движимым принципом удовольствия. Проективные методы, на первый взгляд, давали основание для подобного осмысления (см., напр., экспериментальные исследования аутистического восприятия), однако в этом случае необходимо было признать тождество «первичных» процессов и психической активности в ситуации проективного исследования. Не все исследователи склонны были следовать тради­ции ортодоксального психоанализа. Набиравшая силу «психология Эго», и конкретные экспериментальные клинические исследования формировали новую теоретическую парадигму для обоснования про­ективного подхода. Значительный вклад был внесен американс­кими клиническими психологами во главе с Давидом Рапапортом (Rapaport D., 1944-1945; 1968). Проанализировав исследования «но­вого взгляда», особенно той его ветви, которая занималась изучением когнитивного стиля, Рапапорт по-новому определил специфику про­цессов, детерминирующих проективный ответ. Проективная продук­ция рассматривается как результат сложной познавательной деятель­ности, в которой слиты воедино и собственно когнитивные моменты (отвечающие «реальности» - ситуации эксперимента, задаче -инструк­ции, определенным характеристикам стимульного материала), и аффек­тивно-личностные факторы -«периферические»мотивы, индивидуаль­ные способы контроля и защиты.

Вслед за работами Рапапорта и его коллег началось интенсивное изучение роли стимульных факторов в характеристике проективных ответов. Применительно к ТАТ, в частности, было продемонстриро­вано наличие таблиц, стойко провоцирующих стандартные темы, на­пример депрессию и суицид (ТАТ, табл. 3, 14, 15), сексуальные перверзии (ТАТ, табл. 13, 18) (Bellak L., 1978; Rapaport D., 1968).

Интересны в этой связи результаты, полученные при исследова­нии сопутствующего значения стимульных характеристик таблиц Рор­шаха методом семантического дифференциала (Kenny D., 1964). Ока­залось, что каждая таблица обладает определенным эмоциональным значением:

Таблица I - уродливый, грязный, жестокий, грубый, активный.

Таблица II - счастливый, сильный, активный, быстрый.

Таблица III— хороший, чистый, счастливый, легкий, активный, быстрый.

Таблица IV - плохой, грязный, жестокий, сильный, мужественный.

Таблица V - легкий, активный.

Таблица VI - большой по размеру.

Таблица VII- хороший, красивый, чистый, хрупкий, нежный, женственный.

Таблица VIII — чистый, активный.

ТаблицаIX-сильный, активный, горячий.

Таблица X-хороший, красивый, чистый, счастливый, легкий, ак­тивный, быстрый[9] .

Д. Кении приходит к выводу, что высокоструктурированные изоб­ражения, «насыщенные» тем или иным побуждением, максимально выявляют индивидуальные различия по степени выраженности этого побуждения. Другие авторы полагают, что проекция того или иного побуждения на слабоструктурированные стимулы зависит от интен­сивности данного побуждения, а также от готовности субъекта к са­мораскрытию.

В настоящее время имеется достаточно обширный выбор вари­антов и модификаций ТАТ с таблицами, «значения» которых подо­браны заранее с учетом диагностических задач. Среди них наиболее известны серии Д. Макклелланда и Дж. Аткинсона для диагностики мотивации достижения (McClelland D., Atkinson J., 1953), ТАТ для детей и пожилых людей (Bellak L., 1978), ТАТ для подростков (Symonds D., 1949), ТАТ для исследования семейных установок (Jackson L., 1950), ТАТ для национальных меньшинств. Установлено, что опти­мальным условием для проекции глубинных слоев личности являет­ся умеренный уровень неоднозначности стимульнаго материала. Ин­дивидуальные вариации ответов на стандартные значения стимулов в этом случае оказываются диагностически более значимыми и выяв­ляют не столько аффективные состояния и актуальную силу потреб­ности, сколько устойчивые личностные характеристики, в том числе аномалии (Murstein В., 1963).

Тест Роршаха и ТАТ представляют две группы наиболее распрос­траненных проективных методик по критерию ответной реакции ис­пытуемого, относимых соответственно к тестам на структурирова­ние («конституирование» - по Фрэнку) и интерпретацию. Предпола­гается также, что эти методики наиболее удачно дополняют друг дру­га, выявляя соответственно формальный аспект личности: индивидуальный когнитивный стиль, способы аффективного реагирования и контроля - и содержательный аспект: структуру потребностей, содер­жание конфликтных переживаний, апперцепцию «Я» и своего соци­ального окружения.

Не ставя перед собой задачу обзорного анализа существующих проективных приемов, хотелось бы кратко обрисовать относительно новые и мало известные по отечественной литературе направления в проективной психологии.

Это прежде всего тенденция рассматривать в качестве проектив­ных или квазипроективных те методики, которые традиционно направ­лены на диагностику интеллекта и познавательных процессов в целом. Впервые эта точка зрения наиболее четко была сформулирована Д. Рапапортом в уже упоминавшихся исследованиях 1946 г. и затем в более поздних работах его сотрудников по Меннингерской клинике (напри­мер, Klein G., 1970), а также Г. Виткином (Witkin H., 1954; 1974).

Можно сказать, что авторы имеют в виду качественный анализ выполнения испытуемым интеллектуальных проб, однако на самом деле речь идет о феноменах, в которых находит выражение влияние личностных и аффективно-мотивационных факторов на познаватель­ные процессы. Для иллюстрации приведем пример анализа процесса мышления на основе известной нам методики Выготского-Сахарова (цит. по: Semeonoff B., 1976). Рапапорт, использовавший эту методи­ку в целях дифференциальной диагностики при исследовании психи­чески больных разных нозологии, выделяет пять категорий «личнос­тных форм мышления», по существу, представляющих собой фено­мены, описанные Б. В. Зейгарник как нарушения мотивационного ком­понента мышления (Зейгарник Б. В., 1962). При выполнении методи­ки депрессивные тенденции проявляются в общей инертности, нежелании манипулировать фигурками, неспособности отказаться от ранее сформулированной ошибочной гипотезы. Реакция на фрустра­цию, неудачу, затруднения выражается в аутоагрессии, дискредита­ции задания, нарушении планирования или настаивании на необыч­ных идеях. Один и тот же «симптом», как мы видим, может по-разно­му проявляться у разных людей, что и позволяет говорить об индиви­дуальном стиле познавательной активности. Аналогичным образом различные индивидуальные стратегии выполнения какого-либо пер­цептивного теста (например, теста вставленных фигур - EFT) позволяют сделать вывод о соответствующих индивидуально-типологичес­ких особенностях личности: полезависимости или поленезависимости (WitkinH., 1954; 1974).

Давая оценку этому направлению, следует подчеркнуть, что рас­ширительное толкование интеллектуальных тестов как проективных имеет своей целью привлечение внимания клинических психологов к процессу выполнения интеллектуальных задач, его качественно­му анализу, что, несомненно, более точно отвечает специфике кли­нической диагностики. Снимается также противопоставление ин­теллектуальных и личностных тестов как относящихся к разным «областям» личности; иными словами, реализуется, правда, несколь­ко упрощенно, целостный подход к личности как к сплаву аффекта и интеллекта.

Другое направление в развитии проективных методов связано с активной разработкой проблем межличностного восприятия и взаи­модействия и исследования «Я-образа».

В определенном смысле все проективные методы направлены на изучение того, как субъект воспринимает других людей и самого себя. Наиболее распространено мнение, что проективные методики выяв­ляют неосознаваемый компонент социальной перцепции и «Я-обра­за» (Wylie R, 1974).

«Неспецифическими» методиками указанной ориентации являют­ся ТАТ и тест Роршаха. Предполагается, что в рассказах ТАТ находит отражение не столько реальный характер межличностных отношений обследуемого, сколько их апперцепция, т. е. эмоциональное отноше­ние и пристрастное видение этих отношений. Изображенные на кар­тинках фигуры кроме буквальных значений имеют и символический смысл. Так, фигура немолодого мужчины - олицетворение отца, на­чальника, вообще власти и мужского начала. В этом случае интерпре­тация темы рассказа в зависимости от общего контекста либо «сужа­ется» до анализа внутрисемейных отношений, либо расширяется и рассматривается как отражение взаимоотношений обследуемого с ши­роким социальным окружением, отношение к нормативам общества и его ценностям. Тест Роршаха дает также некоторую информацию об общей благоприятной или неблагоприятной аффективной установке обследуемого по отношению к другим людям - враждебно-защитной

С 60-х годов начал разрабатываться и получил широкое рас­пространение тест Роршаха для исследования общения - Совмес­тный тест Роршаха (СТР), используемый чаще всего для диагнос­тики внутрисемейных отношений. Развитие семейного консульти­рования и семейной психотерапии послужило толчком к созданию ряда методик, нацеленных на диагностику семейных отношений. К ним прежде всего следует отнести тест семейных установок (Jackson L., 1950), тест семейных отношений (Bene L., Antony S., 1957), «кинетический тест рисования семьи» (Bums R., Kaufman S., 1972) и его варианты.

К относительно новому направлению, инициировавшему созда­ние новых методик, относится исследование «Я-образа». Среди тра­диционных проективных методик следует отметить тест Роршаха, выявляющий формальные характеристики «Я-образа» - самоконтроль, самооценку, самореализацию, а также специальную модификацию теста для диагностики физического «Я-образа», «границ образа фи­зического Я» (Fisher S., Cleveland S., 1958).

Недостаточные валидность и надежность проективных методик заставляют исследователей искать новые диагностические парадиг­мы. К ним относится включение в проективные процедуры психо­метрических принципов - так построены вариант ТАТ Столина В. В. и Кальвиньо М. (1982) и методика косвенного исследования системы самооценок Соколовой Е. Т. и Федотовой Е. О. (1982).

Продуктивным оказывается также создание процедур так называе­мой управляемой проекции (Столин В. В., 1981), позволяющей иссле­довать микроструктуру самоотношения в структуре самосознания.

Общая оценка проективных методик как психодиагностических процедур исторически связана с обсуждением так называемой про­блемы проекции. В отечественной литературе дискуссия по этому поводу также достаточно освещена, однако сама проблема, на наш взгляд, еще далека от своего разрешения.

Как известно, Л. Фрэнк ввел термин «проекция», не определив его конкретного психологического содержания. Подразумевалось, что благодаря неопределенности стимульного материала личность «про­ецируется» на него, как на экран (Frank L., 1939). Образное выраже­ние Фрэнка породило представление о проективных методиках как о своего рода «рентгеновских лучах», высвечивающих глубины личности. Ясно, что подобное толкование механизма проекции не удовлет­воряло исследователей. Первые содержательные интерпретации про­екции как феномена, возникающего в ситуации проективного иссле­дования, связывались в теоретическом отношении с концепцией 3. Фрейда; для подтверждения психоаналитической концепции при­влекались также эксперименты Г. Мюррея, Р. Сэнфорда и других ис­следователей, посвященные изучению мотивации через продукты во­ображения (Bellak L., 1944). Однако фрейдовское понятие «проекции» не отличалось однозначностью, что сразу же породило ряд трудно­стей при попытках интерпретировать проективные методики с пози­ций психоанализа. Это отмечалось и отечественными исследователя­ми (Бурлачук Л. Ф., 1979; Реньге В. Э., 1979).

Главные из этих трудностей могут быть-сформулированы в трех пунктах:

1) недостаточная разработанность, многозначность термина «про­екция» в психоанализе, многообразие описываемых явлений;

2) лишь частичное сходство феноменов, обозначаемых в психо­анализе этим термином, с процессами, имеющими место в проектив­ном исследовании;

3) различие типов проекции в разных проективных тестах. Остановимся на анализе каждого из перечисленных пунктов. Впервые термин «проекция» в его психологическом значении был использован 3. Фрейдом для объяснения патологических симптомов паранойи в 1896 г., а затем при разборе «случая Шребера» в 1911 г. В этих работах проекция понималась как приписывание другим людям социально неприемлемых желаний, в которых человек как бы отка­зывает сам себе. В этом случае проекция рассматривалась Фрейдом как механизм защиты против неосознаваемых асоциальных влечений, в частности гомосексуальности, которая лежит в основе бредообразования при паранойе. Впоследствии была описана так называемая фобическая защитная проекция - вынесение вовне, экстериоризация страха, тревоги, в действительности имеющих эндогенную природу (Фрейд 3., 1924). В работах последующих лет наряду с концепцией защитной проекции, входящей в состав различных патологических состояний, Фрейд вводит понятие .проекции как нормального психо­логического процесса, участвующего в формировании нашего вос­приятия внешнего мира. Проекция интерпретируется им как первичный процесс «уподобления» окружающей реальности собственному внутреннему миру (Фрейд 3., 1925а; 19256; 1924). Таков механизм, на­пример, детского или религиозно-мифологического мировосприятия.

Таким образом, проекцией Фрейд называет два существенно от­личающихся друг от друга явления, в основе которых лежат процесс самозащиты и процесс «самоуподобления». Их объединяет неосозна-ваемость трансформаций, которым подвергаются исходные влече­ния, - в сознании выступает лишь продукт этих преобразований. Со временем проекция стала столь расхожим термином, что дифферен­цировать ее от явлений идентификации, переноса и некоторых дру­гих психоаналитических феноменов стало чрезвычайно трудно (Laplanche J., Pontalis J., 1963). Например, говорят о проекции в пси­хотерапевтической ситуации, когда на врача «переносятся» чувства, предназначенные другому лицу; называют проекцией своеобразное отождествление художника со своим творением (Г. Флобер говорил: «Эмма- это я»), а также «сопереживание» при восприятии художе­ственных произведений; проекцией объясняют существование расо­вых и этнических предрассудков.

Б. Мюрстейн и Р. Прайер, критикуя многозначность и, следова­тельно, недостаточную разработанность понятия проекции, предла­гают различать несколько видов проекции (Murstein В., Pryer R., 1959). Классическая защитная проекция Фрейда находит подтверждение во многих клинических наблюдениях. Атрибутивная проекция - это приписывание собственных мотивов, чувств и поступков другим лю­дям (по смыслу близка к фрейдовскому «уподоблению»). Аутистическая проекция – это детерминированность восприятия потребнос­тями воспринимающего; для иллюстрации этого вида проекции авто­ры ссылаются на эксперименты New Look. Рациональная проекция отличается от классической защитной проекции «рациональной» мо­тивировкой: например, по данным одного из экспериментов, когда студентам .предложили высказать свои замечания по структуре учеб­ного процесса, оказалось, что на отсутствие дисциплины жаловались отпетые прогульщики, а недостаточной квалификацией преподавате­лей были недовольны двоечники. Здесь, как и в случае обычной ра­ционализации, вместо признания собственных недостатков испытуе­мые склонны были приписывать ответственность за собственные не­удачи внешним обстоятельствам или другим людям.

Д. Холмс, подводя итоги многолетних исследований, считает не­обходимым выделить два «измерения» проекции (Holmes D., 1968). Первое из них относится к тому, что проецируется; субъект воспри­нимает в другом свои собственные черты или черты, ему самому не присущие. Второе измерение - осознаёт ли субъект обладание той чертой, которая проецируется, или нет. Комбинация этих измерений позволяет классифицировать все известные виды проекции (табл. 2).

Д. Холмс утверждал, что, несмотря на неоднократные попытки экспериментального изучения, проекция неосознаваемых черт не может считаться доказанной. Исходя из психоаналитической концеп­ции, симилятивная проекция выполняет защитные функции, препят­ствуя осознанию того факта, что субъект в действительности облада­ет какой-то нежелательной чертой. Проекция, метафорически назван­ная в честь «Панглосса» и «Кассандры», может рассматриваться как вариант защитного механизма «реактивное образование». Что каса­ется черт, наличие которых субъект осознаёт, то их интенсивное изу­чение шло в русле проблемы межличностного восприятия. Экспери­ментальное подтверждение находит прежде всего атрибутивная про­екция - приписывание другим людям имеющейся у субъекта и осоз­наваемой им черты. Р. Кеттелл считал этот вид проекции наивным умозаключением, основанным на недостатке опыта: люди склонны воспринимать других по аналогии с собой, приписывать другим те же мысли, чувства и желания, которые находят в самих себе. Комплиментарная проекция предполагает проекцию черт, дополнительных к тем, которыми субъект обладает в действительности. Например, если человек ощущает страх, то он склонен других воспринимать как уг­рожающих; в этом случае приписываемая черта служит причинным объяснением собственного состояния.

Таблица 2

Классификация видов проекции по Холмсу

Осознание субъектом проецируемой черты

Наличие у субъекта проецируемой черты

Отсутствие у субъекта проецируемой черты

Субъект не осознает свою черту

Симилятивная проекция

Проекция «Панглосса» или «Кассандры»

Субъект осознает свою черту

Атрибутивная проекция

Комплиментарная проекция

Как соотносятся эти виды проекции с процессами, имеющими место в проективном исследовании? По этому вопросу не существует единства взглядов. Например, Г. Мюррей, употребляя термин «иден­тификация» применительно к ТАТ, фактически имел в виду защит­ную проекцию 3. Фрейда (симилятивный вид проекции по Холмсу); отождествляя себя с «героем», испытуемый получает возможность нео­сознанно приписать ему собственные «латентные» потребности. В этом случае уподобление себя другому позволяет успешно избегать осознания своей «плохости» или психической ненормальности. Вме­сте с тем клинические и экспериментальные исследования показали, что содержание проекции не сводимо к асоциальным тенденциям: объектом проекции могут стать любые положительные или отрица­тельные проявления личности. По-видимому, само проективное по­ведение является производным от многих факторов. В частности, ока­залось, что даже манера экспериментатора, индуцируемые им чув­ства, влияют на аффективный знак тематических рассказов: агрес­сивная установка приводит к возрастанию агрессивных «тем», дружелюбная- к преобладанию релаксационных (Bellak L., 1944). Таким образом, в целом защитную концепцию проекции неправомерно рассматривать в качестве принципа «обоснования проективного ме­тода, хотя сам феномен защиты может иметь место, в частности, если ситуация эксперимента воспринимается как угрожающая (Lazarus R. S., 1961). Что касается других видов проекции, то их экспериментальное изучение применительно к проективным тестам не дало однозначных результатов. Однако большинство авторов, опираясь на идею 3. Фрей­да об «уподоблении», считают возможным привлекать феномены атри­бутивной и аутистической проекций для доказательства значимости проективной продукции. К сожалению, в обоснованиях подобного рода описание тех или иных явлений, наблюдающихся в эксперименте, не­редко заменяет раскрытие их собственно психологических механизмов. Как одну из попыток преодоления кризиса в обоснования проективно­го метода можно рассматривать отказ от понятия проекции в виде объяс­нительной категории; примером такого подхода является концепция апперцептивного искажения Л. Беллака.

Исходя из анализа фрейдовской концепции проекции, Беллак приходит к выводу о неадекватности использования этого понятия в целях обоснования проективного метода, так как оно не способно описать и объяснить процессы, обусловливающие проективное по­ведение; последнее должно быть рассмотрено в контексте пробле­мы «личность и восприятие» (Abt L., Bellak L., 1950), Основу кате­гориальной системы Беллака составляет понятие «апперцепция», по­нимаемая как процесс, посредством которого новый опыт ассими­лируется и трансформируется под воздействием следов прошлых восприятий. Термин «апперцепция» имеет принципиально иное со­держание, чем в теории Мюррея, так как учитывает природу стимульных воздействий и описывает не «первичные» процессы, а соб­ственно когнитивные.

В дискуссии по оценке диагностической значимости проектив­ных методик Р. Кеттелл занимал пессимистическую позицию (Cattell R., 1957). Проективные методики, по его мнению, характери­зует крайне слабая научная обоснованность. Основные аргументы Кеттелла состоят в следующем:

1) проективная психология оказалась не способной четко сфор­мулировать гипотезу о том, какие слои личности преимущественно отражаются в показателях проективных тестов - открыто проявляю­щиеся, осознаваемые или, напротив, бессознательные, скрытые;

2) интерпретационные схемы не учитывают, что защитные ме­ханизмы - идентификация и проекция - могут искажать восприя­тие проективных стимулов одновременно и притом в разных направ­лениях, так что апелляция к механизму проекции до того, как при­рода искаженного восприятия; доказана, неправомерна. Например, испытуемый со скрытым гомосексуализмом может давать больше соответствующих ответов в ТАТ (при идентификации) или меньше, если действует механизм обратной проекции или формирования реакции;

3) остается неясным вопрос о том, какие именно личностные пе­ременные проецируются - влечения, бессознательные комплексы, динамические аффективные состояния, устойчивые мотивы.

К этим аргументам, подтверждающим концептуальную слабость проективных методик, Кеттелл считает нужным добавить упрек в низкой надежности и валидности проективных процедур. К сожале­нию, следует признать обоснованность критических замечаний Кет­телла, особенно если оценивать проективные техники как психомет­рические инструменты или тестовые процедуры.

Большинство проективных методик, или проективных техник, как их иногда предпочитают называть, не являются, по-видимому, теста­ми в узком понимании этого термина. Согласно одному из принятых определений, «психологический тест - это стандартизованный инст­румент, предназначенный для объективного измерения одного или более аспектов целостной личности через вербальные или невербаль­ные образцы ответов либо другие виды поведения» (Freeman E, 1971). В соответствии с этим определением, наиболее существенными при­знаками тестов являются:

1) стандартизованность предъявления и обработки результатов;

2) независимость результатов от влияния экспериментальной си­туации и личности психолога;

3) сопоставимость индивидуальных данных с нормативными, т. е. полученными в тех же условиях в достаточно репрезентативной группе.

В настоящее время далеко не все проективные методики и отнюдь не в равной степени удовлетворяют выделенным критериям. Так, об­щепринятым является мнение о недостаточной объективности про­ективной техники. При этом ссылаются на многочисленные наблюде­ния и эксперименты, доказывающие влияние на тестовые результаты таких факторов, как пол экспериментатора, ситуативные условия и переживания испытуемого, атмосфера исследования (Abt L., Bellak L., 1950; Draguns L, Haley E., Philips L., 1968; Freeman F., 1971). Для це­лого ряда проективных методик нормативные данные отсутствуют; более того, некоторыми исследователями оспаривается принципиаль­ная возможность их существования для подобного рода «идеографи­ческих» методов. Чрезвычайно важным и до сих пор дискуссионным остается вопрос о стандартизованности проективных методик. Оста­новимся на нем подробнее.

В отличие от тестов интеллекта или способностей, при проектив­ном испытании практически невозможно полностью унифицировать и стандартизовать не только анализ и интерпретацию результатов, но даже и саму процедуру исследования. Ведь совершенно различно поведение экспериментатора с робким, чувствительным, уязвимым или спокойным, уверенным субъектом, с таким, который открыт, ак­тивно ищет помощи, или с тем, кто «защищается» при малейших по­пытках проникнуть в его внутренний мир. Хотя в любом капиталь­ном руководстве и описываются наиболее распространенные стратегии поведения экспериментатора, они, конечно же, не охватывают все­го многообразия конкретных случаев. К тому же жесткая формализа­ция и стандартизация, как указывают ряд исследователей, противоре­чила бы самому духу проективной техники.

Сошлемся в связи с этим на высказывание Лоуренса Фрэнка, од­ного из крупнейших теоретиков в этой области: «...нельзя надеяться, что стандартизованная процедура сможет широко осветить личность как уникальную индивидуальность. Она также не сможет способство­вать проникновению в динамические процессы личности» (цит. по: Бом Э., 1978). И тем не менее исследования по стандартизации про­ективных методик необходимы, так как без них затруднительна оцен­ка валидности и надежности последних.

Анализируя обширную и весьма противоречивую литературу, можно сделать вывод, что согласно традиционным способам оценки проективные методики имеют средние показатели валидности и на­дежности (Гильбух Ю. 3., 1978; Freeman F., 1971; Sechrest L., 1968). Подобный вывод может объясняться, однако, и тем, что критерии ва­лидности и надежности, разработанные для традиционных тестов, во­обще неприменимы в данном случае. Учитывая потребности практи­ки, а также тенденции развития исследовательского инструментария современной психологии, можно, по-видимому, ожидать постепенного сближения проективных методик с тестами. Работа в этом направле­нии, если она будет выполняться совместно квалифицированными кли­ническими психологами и специалистами в психометрике, позволит расширить сферу применения проективных методик и сделает их до­стоянием широкого круга исследователей.

2.3. ИЗ ИСТОРИИ КОНТЕНТ-АНАЛИЗА КАК ПСИХОДИАГНОСТИЧЕСКОЙ ПРОЦЕДУРЫ

В современной отечественной психодиагностике контент-анализ, вообще качественно-количественное изучение документов, применя­ется крайне редко по сравнению со всевозможными тестами, проек­тивными методиками, опросниками. В то же время в истории разви­тия метода изучения документов имеется довольно разнообразный опыт его использования для психодиагностических целей.

Начиная с 20-х годов нашего века в социологии и психологии помимо интуитивно-качественного подхода в изучении документов все чаще стали применяться количественные методы. Следует заме­тить, что документы в социальных науках понимаются достаточно широко; к ним, как показывает исследовательская практика, относят­ся официальная и личная документация в собственном смысле слова, в том числе письма, автобиографии, дневники, фотографии и т. п., материалы массовой коммуникации, литературы и искусства.

В нашей стране еще в 20-х годах количественные методы при изуче­нии документов использовали психологи Н. А. Рыбников, И. Н. Шпильрейн, П. П. Блонский, социолог В. А. Кузьмичев и др.

В США тогда же квалификацию в исследования материалов мас­совой коммуникации вводили М. Уилли, Г. Лассуэлл и другие. В 40-50-е годы в США формируется специальный междисциплинарный метод изучения документов - контент-анализ (content analysis). По­зднее он проникает в европейские страны. В нашей стране с конца 60-х годов этот метод также получает распространение в социологи­ческих и социально-психологических исследованиях (подробнее см.: Семенов В. Е., 1983).

Сущность контент-анализа заключается в систематической надежной фиксации заданных единиц изучаемого содержания и в их квантификации. Делаться это может в самых разнообразных целях в рус­ле той или иной концептуальной схемы или теории, в том числе и для нужд психодиагностики, для исследования межличностных и меж­групповых различий и специфики, их динамики во времени. Остано­вимся на исследовательском опыте качественно-количественного изу­чения документов, либо имеющем прямое отношение к традицион­ной психодиагностике, а также к социально-психологической диаг­ностике, либо близком к психодиагностическому опыту.

Качественно-количественный анализ содержания в 20-е годы ис­пользовал в своих работах известный русский советский исследова­тель биографических материалов Н. А. Рыбников, который, в частно­сти, рассматривал автобиографии как психологические документы, документирующие личность и ее историю. Он разделял автобиогра­фии на спонтанные и спровоцированные, понимая под последними прием побуждения испытуемого говорить о себе, причем говорить по определенному плану. Такой прием, по мнению Н. А. Рыбникова, «гарантирует однообразие собираемого материала, что имеет огромные преимущества, давая возможность сравнивать, объединять, обобщать собираемые факты и т. д.» (Рыбников Н. А., 1930, с. 40). Подобным образом им были, например, проанализированы более 500 автобио­графических сочинений детей рабочих, написанных в 1926-1928 гг. При этом исследователь предлагал школьникам описать свою жизнь, давая тему: «Как я живу теперь». В ходе анализа сочинений, в частно­сти, прослеживалось, как распределяются положительные и отрица­тельные оценки школьниками своей жизни в зависимости от возрас­та и пола.

Автор делает вывод, что в среднем девочки дают более высокий процент положительных оценок, но этот перевес над мальчиками у них приходится на младшие группы. В старших же группах они усту­пают мальчикам. Причиной этого является возрастание нагрузки по работе в семье у девочек старшего возраста.

Далее Рыбников анализирует «мотивы того или иного собы­тия, мотивы общего жизненного процесса, встречающиеся в детс­ких автобиографиях». Эти мотивы он разбивает натри группы: ма­териальные, психологические и неопределенные. Чаще всего встре­чаются мотивы материального характера (53 %), мотивы психоло­гического характера дает около одной трети ребят (31 %). Иссле­дователь отмечает, что «хорошее житье чаще всего мотивируется причинами психологического характера (67 % против 25 %); на­оборот, плохое житье-бытье вдвое чаще обосновывается мотива­ми материального характера (31 % против 16 %)». Автор также кон­статирует, что большинство детских высказываний носит описа­тельный характер, таковых высказываний встречается 63,7 % («учусь в, школе, хожу гулять на улицу, играю с товарищами» и т. д.) (Рыбников Н. А., 1930, с. 42).

Рыбников не ограничивается только анализом документов, «По­скольку детские жизнеописания носят по преимуществу фактичес­кий характер, представляется возможным сравнить их с фактическим времяпрепровождением ребенка. Одновременно с собиранием детс­ких жизнеописаний мы вели собирания бюджета времени ребенка. Это сравнение объективных данных о бюджете времени с субъектив­ным описанием времяпрепровождения показывает, что целый ряд моментов, как неинтересных и неважных, ребята совершенно обходят, другие, наоборот, оттеняют. Так, школа и все связанное с ней ока­зывается особенно действенной для ребенка, она занимает 39 % его высказываний, тогда как в бюджете времени ее удельный вес не так велик» (Рыбников Н. А., 1930).

Применял количественный анализ документов и психолог П. П. Блонский, который проанализировал 190 собранных им «пер­вых воспоминаний» учителей и студентов, а также 83 письменные работы школьников (в основном 11-13 лет) на тему «Мое самое ран­нее воспоминание детства», в целях выявления характера первых вос­поминаний (Блонский П. П., 1930).

Исследователь делает вывод, что содержанием 68 % воспомина­ний взрослых и 74 % воспоминаний школьников является несчастье. «Несчастье и страх - таковы основные мнемонические факторы», что противоречит фрейдовской теории забывания как вытеснения непри­ятного. Как видим, простой количественный анализ содержания по­зволил Блонскому сделать весьма важное заключение. Однако проце­дура этого анализа, как и у Рыбникова, не была изложена. При этом вопросы процедуры и надежности полученных данных в значитель­ной мере снимаются тем, что все исследование, включая сбор пер­вичной информации, в те годы обычно проводил сам исследователь,: крупный ученый, подобный Блонскому или Рыбникову. Тем не менее качественно-количественное изучение содержания документов, про­водимое в 20-х годах в нашей стране, в целом нельзя назвать безус­ловно строгим. Таковым оно тогда и не могло еще быть в силу объек­тивного положения в эмпирических социальных исследованиях, ме­тодология которых только начинала складываться.

Тогда же в социолого-журналистских целях В. А. Кузьмичев про­вел тематический анализ 12 еженедельных советских газет, использовав ту же группировку содержания, что и известный исследователь американской прессы тех лет М. Уилли: «I) политика, 2) экономика, 3) культура, 4) сенсации (уголовщина, разоблачения и т. д.), 5) спорт,. 6) персоналии (об отдельных людях), 7) мнения (редакционные ста­тьи, карикатуры), 8) просто интересный материал, для развлечения, 9) журнальный материал (рассказы, моды, кулинарии фотография и т. д.), 10) смесь» (Кузьмичев В, А., 1930, с. 37-38). Как видим, в этом случае своеобразная психодиагностика осуществляется уже на уров­не общественного сознания в различных социальных системах. .

Данные, полученные автором, показывают, что в советских газе­тах на первых местах находились темы экономики и политики, а в американских - журнальный материал и персоналии. Это красноре­чиво, свидетельствует о различиях в направленности советских и аме­риканских еженедельников. Как пишет Кузьмичев, «важнейшие для воспитания широких масс материалы (политика и экономика) в аме­риканской газете отходят на задний план перед оглушающим, раз­влекающим читателя материалом (сенсации, моды, описание отдель­ных персон и т. д.)» (Кузьмичев В. А., 1930).

В качестве примера более позднего медико-психодиагностическо­го изучения документов можно привести тематический анализ содер­жания 4000 записанных сновидений здоровых и больных людей, кото­рый осуществлялся В. Н. Касаткиным на протяжении 30-50-х годов (Касаткин В. Н., 1967). При этом учитывались основные особенности качеств и условий жизни людей, сновидения которых изучались: воз­раст, пол, образование, специальность, состояние здоровья, семейное положение, родной язык и владение другими языками, местожитель­ство, биографические сведения, дата, содержание дня, предшествую­щего сновидению, и состояние испытуемого при пробуждении.

Автор, в частности, нашел, что в «сновидениях взрослых людей встречались элементы, связанные с работой, трудовой деятельностью (специальностью), в 62,5 % всех сновидений; элементы быта, как то: жилище, одежда, пища и т. п. - в 41,4 % всех сновидений; элементы, связанные со здоровьем, — в 44,3 %; эпизоды из семейной жизни — в 38,6 %, сексуальные - в 8,0 % всех сновидений» (там же). Эти и дру­гие данные позволили Касаткину оспаривать фрейдистскую теорию сновидений.

Американскими исследователями контент-анализ стал использо­ваться с 40-х годов и для определения психологических особеннос­тей, психических состояний личности и групп. Например, психоло­гическую структуру отдельной конкретной личности на основе ана­лиза коллекции личностных документов исследовали Г. Оллпорт (Allport G., 1942) и А. Болдуин (Baldwin A., 1942). Психическую на­пряженность, предсуицидные состояния и мотивацию посредством анализа содержания писем, записок, дневников пытались измерить Дж. Доллард и О. Маурер (Dollard J., Mowrer О., 1947), Ч. бсгуд и Е.Уолкер (Osgood Ch,, Walker Е., 1959).

В целях специфической психолого-политической диагностики изучали различия в социальных ценностях у представителей США и Германии К. Левин и X. Себалд (Lewin К., 1 947; Sebald H., 1962). Первый исследователь анализировал американскую и немецко-фаши­стскую литературу для юношества, а второй - песенники этих же стран, изданные в 1940 г. В обоих исследованиях были обнаружены явные различия в ценностных ориентациях, которые пропагандиро­вались американскими и немецкими изданиями тех лет.

К подобного же рода анализу относится исследование использо­вания эмоциональных стереотипов в газете «Чикаго Трибюн», оппо­зиционно настроенной к президенту Рузвельту и его политике, про­веденное в 30-х годах С. Сарджентом (Sargent S., 1939). Для выраже­ния отношения к политике и практике рузвельтовского направления газета использовала негативные стереотипы типа «диктатура, инкви­зитор, регламентация, подачка», тогда как в газете «Нью-Йорк тайме» в аналогичных случаях употреблялись термины: «контроль, рассле­дователь, регулирование, помощь». Множественное сопоставление со­ответствующих выражений и понятий в газетах выявило отношение стоящих за газетами групп к определенным политическим лидерам, партиям и явлениям.

Л. Лоуэнталь на основе количественного анализа биографий, пуб­ликуемых в популярных журналах, показал, как изменялись ценнос­ти и кумиры американского общества на протяжении первых четы­рех десятилетий нашего века от «идолов производства» (бизнесмены, менеджеры, банкиры и т. д.) к «идолам потребления» (певцы, кино­звезды, спортсмены и т. п.) (Lowenthal L., 1950).

Многочисленные, зачастую спекулятивные, исследования были проведены западными психологами и психоаналитиками для изуче­ния личностных особенностей писателей на основе контент-анализа их литературных произведений (особенно часто анализировались со­чинения В. Шекспира и Ф. М. Достоевского).

Вместе с тем контент-анализ репрезентативных выборок про­изведений художественной литературы и искусства может позво­лить выявить обобщенные «характеристики и особенности авто­ров в зависимости, например, от социально-демографических при­знаков. Подобные статистические закономерности особенностей отражения людей и социальной среды писателями были обнаружены нами при изучении художественной прозы и портретной живописи» (Семенов В. Е., 1983). Сошлемся и на контент-анализ эпизодов жестокости и агрессии в западных и отечественных ки­нофильмах, выполненный под нашим руководством Н. Н. Лепехи­ным и Ч. А. Шакеевой. Анализ выявил количественное преоблада­ние и более жестокий характер подобных эпизодов в западных фильмах (Социально-психологические проблемы нравственного воспитания личности. Л., 1984).

С 50-х годов получает распространение качественно-количествен­ный анализ вербальной коммуникации в малых группах, начатый Р. Бейлсом (следует отметить, что обычно такие исследования приня­то относить к наблюдению, хотя речь, зафиксированная, например, на магнитной ленте, становится уже документом). Посредством ана­лиза диалогов, деловых бесед, дискуссий в малых группах и первич­ных коллективах можно диагностировать стиль руководства, социаль­но-психологический климат, конфликтность и т. п. (см., напр.: Обо­зов Н. Н., 1979). Аналогичные возможности открываются для психо­диагностики процессов и состояний при изучении массового вербального поведения на улице, в транспорте, магазинах и т. д. (Semenov V., 1984).

Таким образом, опыт применения качественно-количественного анализа различных документов демонстрирует его значительные воз­можности для психодиагностики, причем как на уровне личности, так и на уровне малых и больших групп. В качестве эмпирических объек­тов изучения могут быть использованы личные документы (письма, фотографии, дневники, автобиографии и т. п.), материалы групповой, коллективной и массовой коммуникации (записи разговоров, дискус­сий, совещаний, всевозможные уставы, приказы, объявления, газеты, радиопередачи, реклама и т. п.), а также продукты деятельности лю­дей, включая литературу и искусство.

Помимо самостоятельного применения или равноправного при­менения в комплексе с другими методами контент-анализ может выс­тупать и в качестве вспомогательной техники для обработки данных, полученных посредством прожективных методик (например, ТАТ, тест Роршаха), нестандартизованных интервью, открытых вопросов ан­кет и т. п. (Логинова Н. А., Семенов В. Е., 1973; Столин В. В., 1982; Lindner R., 1950; Hafner A., Kaplan A., 1960).

Следует подчеркнуть, что контент-анализ основан на принципе повторяемости, частотности различных смысловых и формальных элементов в документах (определенных понятий, суждений, тем, об­разов и т. п.). Поэтому данный метод применяется только тогда, когда имеется достаточное количество материала для анализа (представле­но много отдельных однородных документов, автобиографий, писем, фотографий и т. д. или есть несколько и даже один документ, напри­мер дневник, но достаточного объема). При этом интересующие нас элементы содержания (единицы анализа) также должны встречаться в исследуемых документах с достаточной частотой. В противном слу­чае выводы будут лишены статистической достоверности. Критери­ем здесь служит закон больших чисел.

Не все виды документов пригодны для контент-анализа по при­чине затруднений с формализацией их содержания. Иногда невозмож­но задать четкие однозначные правила для фиксирования нужных характеристик содержания (например, трудно или совершенно невоз­можно формализовать описание лирического героя некоторых поэти­ческих произведений).

Следовательно, объекты анализа должны удовлетворять требова­ниям статистической значимости и формализации.

Квантификация в контент-анализе от простого подсчета частот встречаемости тех или иных элементов-единиц содержания постепен­но эволюционировала к более сложным статистическим средствам. В частности, еще в 1942 г. А. Болдуином был предложен подсчет совме­стной встречаемости слов в тексте (Baldwin А., 1942). В конце 50-х годов Ч. Осгуд с сотрудниками обогатил контент-анализ методикой «связанности символов», в которой развивается принцип Болдуина, что позволяет обнаруживать неслучайные, связанные между собой элементы содержания, представленные в специальных матрицах (Се­менов В. Е., 1983; Osgood Ch., 1959). В сущности, эта методика была началом введения в контент-анализ корреляционной техники, а затем и факторного анализа.

Новым этапом в развитии контент-анализа стала его компьюте­ризация в 60-х годах. Ё Массачусетском технологическом институте появился «универсальный анализатор» (The General Inquirer) - комп­лекс компьютерных программ анализа текстовых материалов, при по­мощи которого можно подсчитывать частоты категорий содержания текста, получать различные индексы на основе совместного появле­ния этих категорий и т. д. (Stone Ph., Dunphy D., 1966). Подобным образом были исследованы речи двадцати американских президен­тов при их вступлении на этот пост, редакционные статьи в газетах разных стран, личные письма, сочинения, вербальное поведение пси­хически больных людей и прочие материалы. С 70-х годов в США разрабатываются стандартные компьютерные программы анализа раз­нообразных документов, которые предлагаются организациям и час­тным лицам (Сохоп А., 1977), компьютерный контент-анализ разви­вается и в других странах (Deichelsel A., 1975).

Естественно, что использование компьютерных программ в кон­тент-анализе обеспечивает этому методу явные преимущества, зак­лючающиеся в надежности получаемых данных и быстроте анализа, по сравнению с ручным, выполняемым людьми-кодировщиками, ко­торые подвержены ошибкам из-за утомления и субъективных факто­ров. Таким образом, трудоемкость составления программ окупается тем огромным объемом содержания, которое достаточно быстро и на­дежно можно проанализировать на компьютере, а также освобожде­нием кодировщиков от их чрезвычайно утомительного труда. В це­лом проблемы использования машинного контент-анализа близки общей стратегии применения компьютеров в эмпирических соци­альных исследованиях. Важно правильно определить, когда следует воспользоваться машинным, а когда ручным анализом, что зависит от задач исследования, от объема материалов, подлежащих анализу, от степени их формализуемости.

ГЛАВА 3 ПСИХОМЕТРИЧЕСКИЕ ПСИХОДИАГНОСТИКИ

3.1. РЕПРЕЗЕНТАТИВНОСТЬ ТЕСТОВЫХ НОРМ

Основные статистические принципы построения тестов достаточ­но полно освещены в появившейся в начале 80-х годов на русском языке литературе по дифференциальной психометрике (Аванесов В. С., 1982; Анастази А., 1982; Гайда В. К., Захаров В. П., 1982). Тем не менее в указанных руководствах центральная проблема пси­хометрики тестов - вопрос о тестовых нормах - еще не получила пос­ледовательного освещения. Прежде всего это относится к руковод­ству известной представительницы американской тестологии А. Ана­стази.

В руководстве Анастази не получают достаточного критического обсуждения две основополагающие предпосылки традиционной за­падной тестологии: вопрос о применении статистических норм (кван­тилей распределения баллов) в качестве диагностических норм и воп­рос о сведении всех эмпирических распределений к нормальной мо­дели. Ниже эти предпосылки будут проанализированы в контексте краткой реконструкции системы основных понятий дифференциаль­ной психометрики.

Статистическая природа тестовых шкал. Типичный измери­тельный тест в психодиагностике - это последовательность кратких заданий, или пунктов, дающая в результате ее выполнения испытуе­мым последовательность исходов, которая затем подвергается одно­значной количественной интерпретации. Примеры интерпретации в интеллектуальных тестах, состоящих из отдельных задач: «правиль­ное решение», «ошибочное решение», «отсутствие ответа» (пропуск задачи из-за нехватки времени). Примеры интерпретации в случае лич­ностных опросников, состоящих из высказываний, предлагаемых для подтверждения испытуемым: «подтверждение» (ответ «верно»), «от­вержение» (ответы «не согласен», «неверно»).

Суммарный балл по тесту подсчитывается с помощью ключа: ключ устанавливает числовое значение исхода по каждому пункту. Напри­мер, за правильное решение задания дается «+1», за неправильное решение или пропуск - «О». Тогда балл буквально выражает количе­ство правильных ответов.

Исход по отдельному заданию подвержен воздействию не только со стороны измеряемого фактора - способности или черты личности испытуемого, но и побочных шумовых факторов, которые являются иррелевантными по отношению к задаче измерения. Примеры слу­чайных факторов: колебания внимания, вызванные неожиданными от­влекающими событиями (шум на улице, стук в дверь и т. п.), трудно­сти в понимании смысла задания (вопроса), вызванные особенностя­ми опыта данного конкретного испытуемого, и т. п. Последователь­ность исходов оказывается последовательностью событий, содержа­щей постоянный и случайный компоненты. Как известно, основным приемом, позволяющим устранить искажающее влияние случайных факторов на результат (суммарный балл), Является балансировка это­го влияния с помощью повторения. При этом фактически предпола­гается, что повторение обеспечивает рандомизацию (случайное варь­ирование) неконтролируемого фактора, в результате чего при сумми­ровании исходов Положительные и негативные эффекты случайных факторов взаимопоглощаются (о механизме рандомизации см.: Готтсданкер Р., 1982).

В оптимальном тесте набор и последовательность заданий орга­низуются таким образом, чтобы повысить долю постоянного компо­нента и сократить долю случайного в величине суммарного балла. Тем не менее, несмотря на различные статистические ухищрения, суммарный балл в психологических измерениях содержит несравнен­но большую долю случайного компонента, чем в обычных физичес­ких измерениях. В силу этого суммарный балл оказывается опреде­ленным лишь в известных пределах, заданных ошибкой измерения.

Для того чтобы оценить эффективность, дифференциальную цен­ность всей процедуры измерения, необходимо соотнести размеры ошибки измерения с размерами разброса суммарных баллов, вызван­ных индивидуальными различиями в измеряемой характеристике между испытуемыми. В терминах Статистики речь идет о сравнении так называемой истинной дисперсии распределения суммарных баллов с дисперсией ошибки. Именно этим обусловлен необходимый интерес психометристов к распределению суммарных баллов. Поэто­му анализ распределения необходим не только при использовании статистических норм, но и в случае абсолютных и критериальных норм.

Как известно, частотное распределение суммарных баллов имеет удобную графическую интерпретацию в виде кривых распределений: гистограммы и кумуляты (см., в частности, удачное популярное вве­дение в описание распределений в книге: Кимбл Г., 1982, с. 55-70). В случае гистограммы по оси абсцисс откладываются «сырые очки» -первичные показатели суммарных баллов, возможных для данного теста, по оси ординат - относительные частоты (или проценты) встре­чаемости баллов в выборке стандартизации (Анастази А., 1982, с. 66). Как известно, для «колоколообразной» кривой нормального распре­деления дисперсия визуализируется как параметр, ответственный за «распластанность» графика плотности вероятности (теоретического аналога эмпирической кумуляты) вдоль оси X. Чтобы визуализиро­вать дисперсию ошибки измерения, нужно было бы многократно про­вести тест с одним испытуемым и построить графическое распреде­ление частот его индивидуальных баллов (рис. 1).

Очевидно, что дифференцирующая способность теста сводится к нулю, если кривые, иллюстрирующие «истинную» и «ошибочную» дисперсии» совпадают. Как видим, анализ распределения тестовых баллов необходим уже для анализа надежности теста (см. раздел 3.2).

Проблема меры в психометри­ке и свойства пунктов теста. В физических измерениях калибров­ка шкалы производится на основе контроля за равномерным варьиро­ванием измеряемого свойства в эта­лонных объектах. Носителем меры является эталон- физический объект, стабильно сохраняющий заданную величину измеряемого свойства. В дифференциальной психометрике такие физические эталоны отсутствуют: мы не располагаем индивидами, которые были бы постоянными носителями за­данной величины измеряемого свойства.

Рис. 1.Соотношение индивидуальной и общей вариации тестовых баллов

Роль косвенных эталонов в психометрике выполняют сами тесты: в том смысле, в каком труд­ность задач можно рассматривать как величину, прямо пропорцио­нально сопряженную со способностью (чем труднее задача, тем выше должен быть уровень способности, требуемый для ее решения). Ана­логом понятия «трудность» для «ли-вопросов»[10] опросника является «сила»: более «сильные» высказывания (в логическом смысле) вызы­вают подтверждение (согласие) у меньшего числа испытуемых. Ни трудность, ни силу пунктов теста нельзя выявить иначе, чем с помо­щью проведения теста. Операциональным определением трудности оказывается «процентильная мера»: процент испытуемых, справив­шихся с заданием теста (или ответивших «верно» на «ли-вопрос»). Чем меньше процент, тем выше трудность.

Кривая распределения тестовых баллов отражает свойства пунк­тов, из которых составлен тест. Если кривая имеет правостороннюю асимметрию, то в тесте преобладают трудные задания; если кривая имеет левостороннюю асимметрию, значит, большинство пунктов в тесте - легкие (слабые) (рис. 2).

Рис. 2.Асимметрии распределения тестовых баллов

Тесты первого типа плохо дифференцируют испытуемых с низ­ким уровнем способностей: все эти испытуемые получают примерно одинаковый низкий балл. Тесты второго типа, наоборот, хуже диффе­ренцируют испытуемых с высоким уровнем способностей.

Если пункты обладают оптимальным уровнем трудности (силы), то кривая распределения зависит от того, насколько пункты однород­ны. Если пункты разнородны (исход по одному пункту не предопре­деляет исход по другому), то мы получаем тест в виде последователь­ности независимых испытаний Бернулли. Как известно из математи­ческой статистики, при достаточно большом количестве независимых испытаний с двумя разновероятными исходами кривая биномиально­го распределения (кривая суммарного балла) по закону больших чи­сел автоматически приближается к кривой нормального распределе­ния (центральная предельная теорема Муавра - Лапласа). Если тест содержит разнородные задания примерно равного уровня трудности (именно такие задания и подбираются для измерения интегральных свойств личности), то нормальность распределения суммарных бал­лов возникает автоматически - как артефакт самой процедуры под­счета суммарных баллов. При этом, конечно, форма кривой распре­деления баллов не позволяет говорить о реальной форме распределе­ния измеряемого свойства, каким оно является само по себе - в ши­рокой популяции испытуемых. Нормальность распределения есть артефакт, прямое следствие направленного отбора пунктов с задан­ными свойствами.

Если подбираются пункты, тесно положительно коррелирующие между собой (испытания не являются статистически независимыми), то в распределении баллов возникает отрицательный эксцесс (рис. 3,а), Максимальных значений отрицательный эксцесс достигает по мере возрастания вогнутости вершины распределения - до образования двух вершин -двух мод (с «провалом» между ними -рис. 3,6). Бимо­дальная конфигурация распределения баллов указывает на то, что вы­борка испытуемых разделилась на две категории (с плавными пере­ходами между ними): одни справились с большинством заданий (со­гласились с большинством «ли-вопросов»), другие - не справились.

Рис. 3. Отрицательные (а, б) положительный (в) эксцессы распределения тестовых баллов

Такая конфигурация распределения свидетельствует о том, что в ос­нове пунктов лежит какой-то один общий им всем признак, соответ­ствующий определенному свойству испытуемых: если у испытуемых есть это свойство (способность, умение, знание), то они справляются с большинством пунктов, если этого свойства нет - то не справляют­ся. В некоторых редких ситуациях пункты могут отрицательно корре­лировать друг с другом. В этом случае на кривой возникает положи­тельный эксцесс (рис. 3, в): вся масса эмпирических точек собирается вблизи среднего значения. Такое возможно в двух случаях: 1) когда ключ составлен неверно -объединены при подсчете отрицательно свя­занные признаки, которые обусловливают взаимоуничтожение бал­лов; 2) когда испытуемые применяют, разгадав направленность оп­росника, специальную тактику «медианного балла» - искусственно балансируют ответы «за» и «против» одного из полюсов измеряемого качества.

Итак, когда в качестве единственного эталона измерения психодиагностами рассматривается сам тест, то в качестве меры измеряе­мого свойства выступает положение балла на кривой распределения. Применяется процентильная шкала. В качестве универсальной меры, пригодной для разных (по своей качественной направленности и ко­личеству пунктов) тестов, используется «процентильная мера». Процентилъ — процент испытуемых из выборки стандартизации, кото­рые получили равный или более низкий балл, чем балл данного испы­туемого. Таким образом, в качестве источника данной меры высту­пает нормативная выборка (выборка стандартизации), на которой построено нормативное распределение тестовых баллов. Процентильные шкалы лежат в основе всех традиционных шкал, применяе­мых в тестологии (Т-очки MMPI, баллы IQ, стены 16 PF и др.).

Подчеркнем, что с точки зрения теории измерений, процентильные шкалы относятся к порядковым шкалам: они дают информацию о том, у кого из испытуемых сильнее выражено измеряемое свойство, но не позволяют говорить о том, во сколько раз сильнее. Для того чтобы строить на базе таких шкал количественный прогноз, нужно повысить уровень измерения (популярное изложение представлений о теории измерений см. в книге: Клигер С. А. и др., 1978). Переход к шкалам интервалов производят либо на базе эмпирического распределения, либо на базе произвольной модели теоретического распределения. В абсолютном большинстве случаев в роли такой теоретической модели ока­зывается модель нормального распределения (хотя в принципе может быть использована любая модель).

В целом кроме статистических, процентильных шкал следует от­личать нередко используемые в дифференциальной психометрике еще 2 вида шкал (и соответственно 2 вида тестовых норм). Это, во-пер­вых, то, что можно условно назвать «абсолютными тестовыми нор­мами» — в роли шкалы для вынесения диагноза выступает сама шкала «сырых» очков, во-вторых, «критериальные» тестовые нормы. При­менение таких норм можно считать оправданным в двух случаях: 1) когда сама тестовая «сырая» шкала имеет практический смысл (на­пример, студент, изучающий иностранный язык, должен знать как можно больше слов этого языка, и сырой показатель лексического теста имеет практический смысл); 2) когда сырой балл по тесту в ре­зультате эмпирических исследований связывается с заданной вероят­ностью успешности какой-либо практической деятельности (вероят­ность успеха «критериальной» деятельности, каковой для упомяну­того выше примера может быть синхронный перевод монолога в те­чение 30 минут).

Процентильная нормализация шкалы. Выше Показано, что нор­мальность распределения достигается искусственным подбором пун­ктов теста с заданными статистическими свойствами: Опишем еще ряд процедур, которые также широко используются для искусствен­ной нормализации.

1. Нормализация пунктов. Ключ для данного пункта корректиру­ется на базе нормальной модели. Если среди нормативной выборки с данным заданием справились только 16 % испытуемых, то данному пункту на интервальной шкале «трудности» (при условии априорно­го принятия нормальной модели с параметрами М = 0 и а = 1) соот­ветствует значение +1 (см. график в книге: Анастазй А., 1982, с. 181). Если справились 75 % испытуемых, то балл пункта на сигма-шкале равен-0,67. В результате суммирования по пунктам баллов, скоррек­тированных нормализацией, суммарные баллы лучше приближаются к нормальному распределению.

2. Нормализация распределения суммарных баллов (или интер­вальная нормализация). В этом случае по таблице нормального рас­пределения (нормального интеграла) производится переход от процентильной шкалы к сиг­ма-шкале: используется функция, обратная интег­ральной, - от ординаты производится переход к абсциссе нормального рас­пределения.

Рис. 4. Преобразование процентильной шкалы (по оси X ) в нормализованную сигма-шкалу (по оси Y )

На рис. 4 дана условная графическая ил­люстрация этого перехода (кривая, обратная традици­онной S-образной интег­ральной кривой нормаль­ного распределения).

Приведем пример интервальной нормализации (табл. 3). Пусть строка X содержит сырые баллы (не нормализованные) по тесту, по­лученные простым подсчетом правильных ответов. В строке Р - час­тоты встречаемости сырых баллов в выборке из 62 испытуемых. В строке F - кумулятивные частоты: = . В строке F* - кумулятивные баллы: . В строке PR - процентильные ранги: . В строке σ даются нормализованные баллы, по­лученные из соответствующих процентильных рангов по таблицам, а -оценки часто называются в зарубежной литературе также z-оценками.

Таблица 3

X

P

F

F*

PR

σ

3

2

2

1

1,6

-2,1

4

18

20

11

17,7

-0,9

5

13

33

26,5

42,7

-0,2

6

8

41

37

59,7

0,2

7

10

51

46

74,2

0,6

8

6

57

54

87,1

1,1

9

4

61

59

95,2

1.7

10

1

62

61.5

99.2

2.4

n=62

Σ= 100

M=0

σ =1

Трудность, с которой сталкиваются начинающие при использова­нии интервальной нормализации, состоит в том, что обычные статис­тические таблицы не приспособлены для психометрики: нужно отыс­кивать значение процентильного ранга внутри таблицы, а соответству­ющую сигма-оценку – с краю. Для облегчения ориентации приведем фрагмент таблицы соответствий PR, а и стенов (табл. 4):

Таблица 4

PR

σ

стен

99

2,33

10

95

1,64

10

90

1,28

9

85

1,04

8

80

0,84

8

75

0,68

7

70

0,52

6,5

65

0,39

6,5

50

0,25

6

55

0,13

6

PR

σ

стен

50

0,0

5,5

45

-0,13

5

40

-0,25

35

-0,39

4,5

30

-0,52

4

25

-0,68

4

20

-0,84

15

-1,04

3

10

-1,28

2

5

-1,64

1

1

-2,33

1

В обычных таблицах из соображений симметрии даны лишь зна­чения для PR > 50. Для PR < 50 соответствующие значения находят­ся из тех же таблиц σ = ψ -1 (1- PR/100). Например, для PR =35 мы находим 1 - PR/100 = 1 - 0,35 = 0,65, затем - по табл. ψ -1 = 0,39 и бе­рем это значение с отрицательным знаком -0,39. Для нормализации удобно пользоваться графическим методом (нормальной бумагой, стандартной 5-образной кривой и т. п.).

В результате нормализации интервалы между исходными сыры­ми баллами переоцениваются в соответствии с нормальной моделью. В отличие от процентильной шкалы, нормальная шкала придает боль­ший вес (в дифференциации испытуемых) краям распределения: раз­личия между испытуемыми, набравшими 95 и 90 процентилей, оце­ниваются как более высокие, чем различия между испытуемыми, набравшими 65 и 60 процентилей.

В применении к шкалам оценок (рейтинговым шкалам) метод нормализации интервалов называется «методом последовательных интервалов» (Клигер С. А. и др., 1978, с. 75-81).

В результате применения процедуры нормализации исследователь-психометрист получает для нормативной выборки таблицу перевода сырых баллов в нормализованные баллы. На основе этих таблиц час­то строят графики: деления сырых баллов наносят на числовую ось с неравными интервалами, так что эмпирическое распределение час­тот максимально близко приближается к нормальной форме. Пример такой графической нормализации - профильные листы MMPI (Анастази А., 1982, с. 129).

Так как нормальное распределение описывается всего двумя па­раметрами: средним М (мерой положения) и средним квадратическим (или стандартным) отклонением а (мерой рассеяния), то диаг­ностические нормы в случае нормализованных шкал описываются в единицах отклонений от среднего по выборке; например, заключают, что испытуемый А показал результат, превышающий средний балл на две сигмы, испытуемый В -результат, оказавшийся ниже среднего балла на одну сигму, и т. п. На процентильной шкале этому соответ­ствуют процентильные ранги 95 и 16 соответственно.

Переход к нормальному распределению создает очень удобные условия для количественных операций с диагностической шкалой: как со шкалой интервалов с ней можно производить операции ли­нейного преобразования (умножение и сложение), можно описы­вать диагностические нормы в компактной форме (в единицах от­клонений), можно применять линейный коэффициент корреляции Пирсона, критерии для проверки статистических гипотез, постро­енные в применении к нормальному распределению, т. е. весь ап­парат традиционной статистики (основанной на нормальном рас­пределении). !

Неправомерность онтологизации нормального закона. В тради­ционной психометрике нормальное распределение выступает в роли инструментального понятия, облегчающего оперирование с данны­ми. Но это не означает, что можно забывать об искусственном проис­хождении нормального распределения. Традиции западной тестологии, основанные еще Ф. Гальтоном, предполагают однородность тео­ретических представлений психометрики и биометрики. Точно так же как происхождение нормального распределения при исследовании вариативности биологических характеристик человеческого организма связывается с наличием взаимодействия постоянного фактора гено­типа и изменчивых случайных факторов фенотипа, - происхождение межиндивидуальных психологических различий связывается с гене­тическим кодом, якобы предопределяющим положение индивида на оси нормальной кривой. В действительности же нет никаких оснований приписывать появление нормальной кривой, часто получаемой с помощью специальных статистических непростых процедур, дей­ствию механизма наследственности.

В тех случаях, когда на большой выборке удается получить нор­мальное распределение без каких-либо искусственных способствую­щих этому мер, это опять-таки не означает вмешательства генетики. Закон нормального распределения воспроизводится всякий раз, когда на измеряемое свойство (на формирование определенного уровня спо­собностей индивида) действует множество разных по силе и направ­ленности факторов, независимых друг от друга. История прижизнен­ных средовых воздействий, которые испытывает на себе субъект, так­же подобна последовательности независимых событий: одни факторы действуют в благоприятном направлении, другие - в неблагоприятном, а в результате взаимопогащение их влияний происходит чаще, чем тен­денциозное однонаправленное сочетание (большинство благоприятных или большинство неблагоприятных), т. е. возникает нормальное рас­пределение. Массовые исследования показывают, что введение конт­роля над одним из средовых популяционных факторов (уровень обра­зования родителей, например) приводит к расслоению кривой нормаль­ного распределения: выборочные кривые оказываются смещенными относительно друг друга (Анастази А., 1982, с. 201). Эти результаты служат ярким подтверждением социокультурного происхождения ста­тистических диагностических норм, что одновременно служит осно­ванием для серьезных предосторожностей при переносе норм, полу­ченных на одной популяции, на другие популяции. Однородными мож­но считать только те популяции, по отношению к которым действует одинаковый механизм выборки: ив ситуации создания (стандартиза­ции) теста, и в ситуации его диагностического применения. Здесь при­ходится учитывать и такие нюансы выборочного механизма, как фено­мен нормальных добровольцев. Если выборку стандартизации форми­ровать на студентах, добровольно согласившихся участвовать в тести­ровании, а применение теста планируется на сплошных выборках (в административном порядке), то это грозит определенными ошибками в диагностических суждениях, так как психологический портрет «доб­ровольца» в существенных чертах отличается от портрета испытуемо­го, соглашающегося на тестирование только под административным давлением (Шихирев П.Н, 1979, с. 181).

Подсчет параметров и оценка типа распределения. Для описа­ния выборочного распределения, как правило, используются следую­щие известные параметры:

1. Среднее арифметическое значение:

, (3.1.1)

где xj – балл i -го испытуемого;

yi -значение i -го балла по порядку возрастания;

pi - частота встречающегося i -го балла;

n - количество испытуемых в выборке (объем);

m - количество градаций шкалы (количество баллов).

2. Среднее квадратическое (стандартное) отклонение:

3.

, (3.1.2)

где - сумма квадратов тестовых баллов для и испытуемых.

3. Асимметрия:

(3.1.3)

где - среднее арифметическое значение;

S - стандартное отклонение;

θ - среднее кубическое значение: ,

С - среднее квадратическое:

4. Эксцесс:

, (3.1.4)

где Q - среднее значение четвертой степени: .

Стандартная ошибка среднего арифметического значения (мате­матического ожидания) оценивается по формуле:

(3.1.5)

На основе ошибки математического ожидания строятся довери­тельные интервалы: )

Если тестовый балл какого-либо испытуемого попадает в грани­цы доверительного интервала, то нельзя считать, что испытуемый обладает повышенным (или пониженным) значением измеряемого свойства с заданным уровнем статистической значимости.

Асимметрия и эксцесс нормального распределения должны быть равны нулю. Если хотя бы один из двух параметров существенно от­личается от нуля, то это означает анормальность полученного эмпи­рического распределения.

Проверку значимости асимметрии можно произвести на основе общего неравенства Чебышева:

(3.1.6)

где Sa - дисперсия эмпирической оценки асимметрии:

, (3.1.7)

где р - уровень значимости или вероятность ошибки первого рода: ошибки в том, что будет принят вывод о незначимости асимметрии при наличии значимой асимметрии (в формулу подставляют стандар­тные р = 0,05 или р = 0,01 и проверяют выполнение неравенства). Сходным образом оценивается значимость эксцесса:

(3.1.8)

где Sе - эмпирическая дисперсия оценки эксцесса:

. (3.1.9)

]

Гипотезы об отсутствии асимметрии и эксцесса принимаются с вероятностью ошибки р (пренебрежимо малой), если выполняются неравенства (3.1.6) и (3.1.8).

Более легкий метод проверки нормальности эмпирического рас­пределения основывается на универсальном критерии Колмогорова. Для каждого тестового балла у. (для каждого интервала равнозначно­сти при дискретизации непрерывной хронометрической шкалы) вы­числяется величина D. - модуль отклонения эмпирической и теорети­ческой интегральных функций распределения:

(3.1.10)

где F- эмпирическая интегральная функция (значение кумуляты в данной точке у j ); U — теоретическая интегральная функция, взятая из таблиц[11] . Среди Dj отыскивается максимальное значение Dmax , и вели­чина сравнивается с табличным значением критерия Колмогорова.

В таблице 5 приведены асимптотические критические значения для распределения Колмогорова (при ). Близость эмпиричес­кого значения λе к левосторонним стандартным квантилям λt позво­ляет констатировать близость эмпирического и предполагаемого тео­ретического распределения с пренебрежимо малой вероятностью ошибки р (0,01; 0,05; 0,10 и т, п.). Близость λе к правосторонним стан­дартным квантилям λ­­t позволяет сделать вывод о статистически зна­чимом отсутствии согласованности эмпирического и теоретического распределений. Надо помнить, что критерий Колмогорова, очень про­стой в вычислительном' отношении, обеспечивает надежные выводы лишь при 200: Критерий Колмогорова резко снижает свою эф­фективность, когда наблюдения группируются по малому количеству интервалов равнозначности. Например, при n = 200 количество ин­тервалов должно быть не менее 20 (примерно по 10 наблюдений на каждый интервал в среднем).

Таблица 5

Квантиль λt

0,44

0,52

0,57

0,61

0,65

0,71

Вероятность p

0,99

0,95

0,90

0,85

0,80

0,70

Квантиль λt

0,89

0,97

1,07

1,22

1,36

1,52

1,63

Вероятность p

0,40

0,30

0,20

0,15

0,05

0,02

0,01

Если проверка согласованности эмпирического распределения с нормальным дает положительные результаты, то это означает, что полученное распределение можно рассматривать как устойчивое -репрезентативное по отношению к генеральной совокупности - и, следовательно, на его основе можно определить репрезентативные тестовые нормы. Если проверка не выявляет нормальности на требу­емом уровне, то это означает, что либо выборка мала и нерепрезента­тивна к популяции, либо измеряемые свойство и устройство теста (спо­соб подсчета) вообще не дают нормального распределения.

В принципе отнюдь не обязательно все нормативные распределе­ния сводить к нормальным. Можно с равным успехом пользоваться хорошо разработанными моделями гамма-распределения, пуассоновского распределения и т. п. Критерий Колмогорова позволяет оценить близость вашего эмпирического распределения к любому теоретичес­кому распределению. При этом устойчивым и репрезентативным мо­жет оказаться распределение любого типа. Если из нормальности, как правило, следует устойчивость, то обратное неверно -устойчивость вовсе не обязательно предполагает нормальность распределения.

Наличие значимой положительной асимметрии (см. рис. 2,а) сви­детельствует о том, что в системе факторов, детерминирующих зна­чение измеряемого показателя, преобладают факторы, действующие в одном направлении - в сторону повышения показателя. Такого рода отклонения появляются при использовании хронометрических пока­зателей: испытуемый не может решить задачу быстрее определенно­го минимально необходимого периода, но может существенно долго задерживаться с ее решением. На практике распределения такого рода преобразуют в приближенно нормальное распределение с помощью логарифмической трансформации:

(3.1.11)

При этом говорят, что распределение хронометрических показа­телей подчиняется «логнормальному» закону.

Подобную алгебраическую нормализацию тестовой шкалы при­меняют и к показателям с еще более резко выраженной положитель­ной асимметрией. Например, в процедурах контент-анализа сам тес­товый показатель является частотным: он измеряет частоту появле­ния определенных категорий событий в текстах. Для редких катего­рий вероятность появления значительно меньше 0,5. Формула преобразования

(3.1.12)

позволяет придать необходимую 5-образную форму кумуляте.

Стандартизация шкалы. В психометрике следует различать две формы стандартизации. Под стандартизацией теста понимают преж­де всего стандартизацию самой процедуры проведения инструкций, бланков, способа регистрации, условий и т. п. Без стандартизации теста невозможно получить нормативное распределение тестовых баллов и, следовательно, тестовых норм.

Под стандартизацией шкалы понимают линейное преобразование масштаба нормальной (или искусственно нормализованной) шкалы. В общем случае формула стандартизации выглядит так:

, (3.1.13).

где xi - исходный балл по «сырой» шкале, для которой доказана нор­мальность распределения;

- среднее арифметическое по «сырому» распределению; S - «сырое» стандартное отклонение;

М- математическое ожидание по выбранной стандартной шкале;

σ - стандартное отклонение по стандартной шкале.

Если шкала подвергалась предварительной искусственной норма­лизации интервалов, то формула упрощается:

zj =σ zj =M (3.1.14)

Приведем параметры для наиболее популярных стандартных шкал:

1) T -шкала Маккола (тест-опросник MMPI и другие тесты):

М = 50 и σ = 10,

2) шкала IQ : М = 100 и σ = 15,

3) шкала «стэнайнов» (целые численные значения от 1 до 9 -стан­дартная девятка): М = 5,0 и σ = 2,

4) шкала «стенов» (стандартная десятка, 16PF Кеттелла):

М = 5,5 .и σ = 2.

Чтобы различать стандартные баллы, полученные с помощью линейной стандартизации и нелинейной нормализации интервалов, Р. Кеттелл ввел понятие «S-стенов» и «n-стенов». Таблицы «и-стенов», естественно, точнее отражают квантили эмпирического нормального распределения. Приведем образец такой таблицы для фактора А из тест-опросника 16PF;

Сырые баллы 0-4 5-6 7 8-9 10-12 13 14-15 16 17-18 19-20 Стены 1 2 3 4 5 6 7 8 9 10

Применение стандартных шкал позволяет использовать более грубые, приближенные способы проверки типа распределения тесто­вых баллов. Если, например, процентильная нормализация с перево­дом в стены и линейная нормализация с переводом в стены по фор­муле (3.1.13) дают совпадающие целые значения стенов для каждого Y, то это означает, что распределение обладает нормальностью с точ­ностью до «стандартной десятки».

Применение стандартных шкал необходимо для соотнесения ре­зультатов по разным тестам, для построения «диагностических про­филей» по батарее тестов и тому подобных целей.

Проверка устойчивости распределения. Общая логика проверки устойчивости распределения основывается на индуктивном рассуж­дении: если половинное (полученное по половине выборки) распре­деление хорошо моделирует конфигурацию целого распределения, то можно предположить, что это целое распределение будет также хоро­шо моделировать распределение генеральной совокупности.

Таким образом, доказательство устойчивости распределения оз­начает доказательство репрезентативности тестовых норм. Традици­онный способ доказательства устойчивости сводится к наличию хо­рошего приближения эмпирического распределения к какому-либо те­оретическому. Но если эмпирическое распределение не приближается к теоретическому, несмотря на значительное увеличение объема выборки, то приходится прибегать к более общему индуктивному ме­тоду доказательства.

Простейший его вариант может быть сведен к получению таблиц перевода сырых баллов в нормализованную шкалу по данным всей выборки и применению этих таблиц для каждого испытуемого из по­ловины выборки; если распределение нормализованных баллов из по­ловины выборки хорошо приближается к нормальному, то это значит, что заданные таблицами нормализации тестовые нормы определены устойчиво. Близость к нормальному распределению проверяется с по­мощью критерия Колмогорова (при n <200 целесообразно использо­вать более мощные критерии: «хи-вадрат» или «омега-квадрат»).

При этом под «половиной выборки» подразумевается случайная половина, в которую испытуемые зачисляются случайным образом -с помощью двоичной случайной последовательности (типа подбра­сывания монетки и т. п.). В более общем случае такой простейший метод установления однородности двух эмпирических распределений может быть применен и при разбиении выборки по какому-либо сис­тематическому признаку. Если, в частности, по какому-либо из популяционно значимых признаков (пол, возраст, образование, профес­сия) психолог получает значимую неоднородность эмпирических распределений; то это значит, что относительно данных популяционных категорий тестовые нормы должны быть специализированы (одна таблица норм - для мужчин, другая - для женщин и т. д.).

Более статистически корректный метод проверки однородности двух распределений, полученных при расщеплении выборки на рав­ные части, опять же связан с применением критерия Колмогорова. Для этого с табличным значением сравнивается:

(3.1.15)

где Ке - эмпирическое значение статистики Колмогорова;

Fj 1 - кумулятивная относительная частота для у-того интервала шкалы по первой половине выборки;

Fj 2 - та же частота для второй половины;

n - полный объем выборки.

Точные значения квантилей распределения Колмогорова для опре­деления размеров выборки можно найти в кн.: Мюллер П. и др., 1982.

Применение критерия Колмогорова не зависит от нормальности целого распределения и от необходимости производить нормализа­цию интервалов.

* * *

Итак, априорная предпосылка нормальности распределения тес­товых баллов основывается скорее на принципах операционального удобства, чем на теоретической необходимости. Психометрически корректные процедуры получения устойчивых тестовых норм возмож­ны с помощью специальных методов непараметрической статистики (критерий «хи-квадрат» и т. п.) для распределений произвольной фор­мы. Выбор статистической модели распределения - законный произ­вол психометриста, пока сам тест выступает в качестве единственно­го эталона измеряемого свойства. В этом случае остается лишь тща­тельно следить за соответствием сферы применения диагностичес­ких норм той выборке испытуемых, на которой они были получены. Произвольность в выборе статистической модели шкалы исчезает, когда речь заходит о внешних по отношению к тесту критериях.

Репрезентативность критериальных тестов. В таких тестах в качестве реального эталона применяется критерий, ради которого со­здается тест, - целевой критерий. Особое значение такой подход имеет в тех областях практики, где высокие результаты могут дать узкоспеци­ализированные диагностические методики, нацеленные на очень кон­кретные и узкие критерии. Такая ситуация имеет место в обучении: тестирование, направленное на получение информации об уровне ус­воения определенных знаний, умений и навыков (При профессиональ­ном обучений), должно точно отражать уровень освоения этих навы­ков и тем самым давать надежный прогноз эффективности конкретной профессиональной деятельности, требующей применения этих навы­ков. Так возникают «тесты достижений», по отношению к которым критериальный подход обнаружил свою высокую эффективность (Гуревич К. М, Лубовский В. И,, 1982).

Рассмотрим операциональную схему шкалирования, применяе­мую при создании критериального теста. Пусть имеется некоторый критерий С, ради прогнозирования которого психодиагност создает тест X. Для простоты представим С как дихотомическую перемен­ную с двумя значениями: 1 и 0. С, = 1 означает, что j -й субъект достиг критерия (попал в «высокую» группу по критерию), Сj =0 означает, что i -й субъект не достиг критерия (попал в «низкую» группу). Пси­ходиагност применяет на нормативной выборке тест X, и в ре­зультате каждый индивид получает тестовый балл Xi . После того как для каждого индивида из выборки становится известным значение С (иногда на это требуются месяцы и годы после момента тестирова­ния), психодиагност группирует индивидов по порядку возрастания балла Xi и для каждого деления исходной шкалы сырых тестовых бал­лов подсчитывает эмпирическую вероятность Р попадания в «высо­кую» группу по критерию С. На рис. 5 показаны распределения веро­ятности Р (Ci = 1) в зависимости от Xi

Рис. 5 Эмпирическая зависимость между вероятностью критериального события и тестовым баллом

Очевидно, что кривая на рис. 5 по своей конфигурации может со­вершенно не совпадать с кумулятивной кривой распределения частот появления различных Xi . Кривая, представленная на рис. 5, является эмпирической линией регрессии С по Xi Теперь можно сформулиро­вать основное требование к критериальному тесту: линия регрессии должна быть монотонной функцией С от Xi Иными словами, ни для одного более высокого значения X. вероятность Р не должна быть мень­шей, чем для какого-либо менее высокого значения Xi Если это усло­вие выполняется, то открывается возможность для критериального шка­лирования сырых баллов X. Так же как в случае с интервальной норма­лизацией», когда применяется поточечный перевод интервалов Х в ин­тервалы Z, для которых выполняется нормальная модель распределения, так и при критериальном шкалировании к делениям сырой шкалы X применяется поточечный перевод прямо в шкалу Р на основании эмпи­рической линии регрессии. Например, если испытуемый А получил по тесту X 18 сырых баллов и этому результату соответствует Р=0,6, то испытуемому А ставится в соответствие показатель 60 %.

Конечно, любая эмпирическая кривая является лишь приближен­ной моделью той зависимости, которая могла бы быть воспроизведе­на на генеральной совокупности. Обычно предполагается, что на ге­неральной совокупности линия регрессии С по Х должна иметь более сглаженную форму. Поэтому обычно предпринимаются попытки ап­проксимировать эмпирическую линию регрессии какой-либо функ­циональной зависимостью, что позволяет затем производить прогноз с применением формулы (а не таблицы или графика).

Например, если линия регрессии имеет вид приблизительно та­кой, какой изображен на рис. 6, то применение процентильной нор­мализации позволяет получить простую линейную регрессию С по нормализованной шкале Z. Это как раз тот случай, когда имеет мес­то эквивалентность стратегии, использующей выборочно-статисти­ческие тестовые нормы, и стратегии, использующей критериальные нормы.

Рис. 6. Зависимость вероятности критериального события Р от

нормально распределенного диагностического параметра X

Операции по анализу распределения тестовых баллов, построе­нию тестовых норм и проверке их репрезентативности. Завершая этот раздел, кратко перечислим действия, которые последовательно должен произвести психолог при построении тестовых норм.

1. Сформировать выборку стандартизации (случайную или стра­тифицированную по какому-либо параметру) из той популяции, на которой предполагается применять тест. Провести на каждом ис­пытуемом из выборки тест в сжатые сроки (чтобы устранить иррелевантный разброс, вызванный внешними событиями, происшедшими за время обследования).

2. Произвести группировку сырых баллов с учетом выбранного интервала квантования (интервала равнозначности). Интервал опре­деляется величиной W/m , где W=x max — х max ; m - количество интерва­лов равнозначности (градаций шкалы).

3. Построить распределение частот тестовых баллов (для задан­ных интервалов равнозначности) в виде таблицы и в виде соответ­ствующих графиков гистограммы и кумуляты.

4. Произвести расчет среднего арифметического значения и стандар­тного отклонения, а также асимметрии и эксцесса с помощью компьюте­ра. Проверить гипотезы о значимости асимметрии и эксцесса. Сравнить результаты проверки с визуальным анализом кривых распределения.

5. Произвести проверку нормальности одного из распределений с помощью критерия Колмогорова (при n < 200 с помощью более мощ­ных критериев) или произвести процентильную нормализацию с пе­реводом в стандартную шкалу, а также линейную стандартизацию и сравнить их результаты (с точностью до целых значений стандарт­ных баллов).

6. Если совпадения не будет - нормальность отвергается; в этом случае произвести проверку устойчивости распределения расщепле­нием выборки на две случайные половины. При совпадении норма­лизованных баллов для половины и для целой выборки можно счи­тать нормализованную шкалу устойчивой.

7. Проверить однородность распределения по отношению к варь­ированию заданного популяционного признака (пол, профессия и т. п.) с помощью критерия Колмогорова. Построить в совмещенных коор­динатах графики гистограммы и кумуляты для полной и частной вы­борок. При значимых различиях разбить выборку на разнородные подвыборки.

8. Построить таблицы процентильных и нормализованных тесто­вых норм (для каждого интервала равнозначности сырого балла). При наличии разнородных подвыборок для каждой из них должна быть своя таблица.

9. Определить критические точки (верхнюю и нижнюю) для до­верительных интервалов (на уровне Р < 0,01) с учетом стандартной ошибки в определении среднего значения.

10. Обсудить конфигурацию полученных распределений с учетом предполагаемого механизма выполнения того или иного теста.

11. В случае негативного результата: отсутствия устойчивых норм для шкалы с заданным числом градаций (с заданной точнос­тью прогноза критериальной деятельности) - осуществить обсле­дование более широкой выборки или отказаться от использования, данного теста.

3.2. НАДЕЖНОСТЬ ТЕСТА

В дифференциальной психометрике проблемы валидности и надежности тесно взаимосвязаны, тем не менее мы последуем традиции раздельного изложения методов проверки этих важнейших пси­хометрических свойств теста.

Надежность и точность. Как уже отмечалось в разделе 3.1, общий разброс (дисперсию) результатов произведенных измерений мож­но представить как результат действия двух источников разнообразия: самого измеряемого свойства и нестабильности измерительной процедуры, обусловливающей наличие ошибки измерения. Это пред­ставление выражено в формуле, описывающей надежность теста и виде отношения истинной дисперсии к дисперсии эмпирически заре­гистрированных баллов:

(3.2.1)

Так как истинная дисперсия и дисперсия ошибки связаны оче­видным соотношением, формула (3.2.1) легко преобразуется в фор­мулу Рюлона:

(3.2.2)

где а - надежность теста; . -дисперсия ошибки.

Величина ошибки измерения - обратный индикатор точности из­мерения. Чем больше ошибка, тем шире диапазон неопределенности на шкале (доверительный интервал индивидуального балла), внутри которого оказывается статистически возможной локализация истинного балла данного испытуемого. Таким образом, для проверки гипо­тезы о значимости отличия балла испытуемого от среднего значения оказывается недостаточным только оценить ошибку среднего, нужно еще оценить ошибку измерения, обусловливающую разброс в поло­жении индивидуального балла (рис. 7).

Рис. 7. Соотношение распределений Sm стандартное отклонение эмпирического среднего, St стандартное отклонение ошибки

Как же определить ошибку измерения? На помощь приходят кор­реляционные методы, позволяющие определить точность (надеж­ность) через устойчивость и согласованность результатов, получае­мых как на уровне целого теста, так и на уровне отдельных его пун­ктов.

Надежность целого теста имеет две разновидности.

1. Надежность-устойчивость (ретестовая надежность). Измеряется с помощью повторного проведения теста на той же выборке испыту­емых, обычно через две недели после первого тестирования. Для ин­тервальных шкал подсчитывается хорошо известный коэффициент корреляции произведения моментов Пирсона:

где х1 i . - тестовый балл i -го испытуемого при первом измерении;

х2 i . - тестовый балл того же испытуемого при повторном измерении;

n - количество испытуемых.

Оценка значимости этого коэффициента основывается на несколь­ко иной логике, чем это обычно делается при проверке нулевой гипо­тезы - о равенстве корреляций нулю. Высокая надежность достига­ется тогда, когда дисперсия ошибки оказывается пренебрежительно малой. 'Относительную долю дисперсии ошибки легко определить по формуле

(3.2.4)

Таким образом, для нас существеннее близость к единице, а не отдаленность от нуля. Обычно в тестологической практике редко уда­ется достичь коэффициентов, превышающих 0,8. При г = 0,75 отно­сительная доля стандартной ошибки равна . Этой ошиб­кой, очевидно, нельзя пренебречь. При такой ошибке эмпирически полученное отклонение индивидуального тестового балла от средне­го по выборке оказывается, как правило, завышенным. Для того что­бы выяснить «истинное» значение тестового балла индивида, приме­няется формула

(3.2.5)

где - истинный балл; '

хi — эмпирический балл i -го испытуемого;

r - эмпирически измеренная надежность теста;

- среднее для теста.

Предположим, испытуемый получил балл IQ по шкале Стэнфорда.-Бине, равный 120 нормализованным очкам, М = 100, г = 0,9. Тог­да истинный балл = 0,9 120 + 0,1 100 =118.

Конечно, требование ретестовой надежности является коррект­ным лишь по отношению к таким психическим характеристикам ин­дивидов, которые сами являются устойчивыми во времени. Если мы создаем тест для измерения эмоциональных состояний (бодрости, тре­воги и т. д.), то, очевидно, требовать от него ретестовой надежности бессмысленно: у испытуемых быстрее изменится состояние, чем они забудут свои ответы по первому тестированию.

Для шкал порядка в качестве меры устойчивости к перетестиро­ванию используется коэффициент ранговой корреляции Спирмена:

, (3.2.6)

где di — разность рангов /-го испытуемого в первом и втором ранго­вом ряду.

С помощью компьютера определяется более надежный коэффи­циент ранговой корреляции Кендалла (1975).

2. Надежность- согласованность (одномоментная надежность).

Эта разновидность надежности не зависит от устойчивости, име­ет особую содержательную и операциональную природу. Простей­шим способ ее измерения состоите коррелировании параллельных форм теста (Анастази Д., 1982, кн. 1,с. 106). Чаще всего параллель­ные формы теста получают расщеплением составного теста на «чет­ную» и «нечетную» половины: к первой относятся четные пункты, ко второй - нечетные. По каждой половине рассчитываются суммар­ные баллы и между двумя рядами баллов по испытуемым определя­ются допустимые (с учетом уровня измерения) коэффициенты кор­реляции. Если параллельные тесты не нормализованы, то предпоч­тительнее использовать ранговую корреляцию. При таком расщеп­лении получается коэффициент, относящийся к половинам теста. Для того чтобы найти надежность целого теста пользуются формулой Спирмена - Брауна:

(3.2.7)

где rx - эмпирически рассчитанная корреляция для половин.

Делить тест на две половины можно разными способами, и каж­дый раз получаются несколько разные коэффициенты (Аванесов В. С., 1982, с. 122), поэтому в психометрике существует способ оценки син­хронной надежности, который соответствует разбиению теста на та­кое количество частей, сколько в нем отдельных пунктов. Такова фор­мула Кронбаха:

(3.2.8)

где а - коэффициент Кронбаха;

k- количество пунктов теста;

- дисперсия по j -му пункту теста;

- дисперсия суммарных баллов по всему тесту.

Обратите внимание на структурное подобие формулы Кронбаха (3.2.2) и формулы Рюлона (3.2.8).

Несколько раньше была получена формула Кьюдера - Ричардсо­на, аналогичная формуле Кронбаха для частного случая - когда отве­ты на каждый пункт теста интерпретируются как дихотомические переменные с двумя значениями (1 и 0):

(3.2.9)

где KR20 - традиционное обозначение получаемого коэффициента;

-дисперсия i -и дихотомической переменной, какой является

i -й пункт теста; р = , q = 1 - p

В 1957 г. Дж. Ките предложил следующий критерий для оценки статистической значимости коэффициента a :

(3.2.10)

где - эмпирическое значение статистики % квадрат с п-1 степе­нью свободы;

k - количество пунктов теста;

n - количество испытуемых;.

a - надежность.

Формулы (3.2.8) и (3.2.9) позволяют оценить взаимную согласо­ванность пунктов теста, используя при этом только подсчет диспер­сий. Однако коэффициенты а и KR2 I > позволяют оценить и среднюю корреляцию между i -м и j -м произвольными пунктами теста, так как связаны с этой средней корреляцией следующей формулой:

11)

где - средняя корреляция между пунктами теста. Легко увидеть идентичность формулы (3.2.11) обобщенной формуле Спирмена - Бра­уна, позволяющей прогнозировать повышения синхронной надежно­сти теста с увеличением количества пунктов теста в k раз (Аванесов В. С., 1982, с. 121). Из этой формулы видно, что при больших k малое значение может сочетаться с высокой надежностью. Пусть = 0,1, a k =100, тогда по формуле (3.2.11)

Широкое распространение компьютерных программ факторного анализа для исследования взаимоотношений между пунктами теста (по одномоментным данным) привело к обоснованию еще одной до­статочно эффективной формулы надежности теста, которой легко воспользоваться, получив стандартную распечатку компьютерных результатов факторного анализа по методу главных компонент:

(3.2.12)

где θ - коэффициент, получивший название тета-надежности теста;

k - количество пунктов теста;

λ1 - наибольшее значение характеристического корня матрицы

интеркорреляций пунктов (наибольшее собственное значение, или аб­солютный вес первой главной компоненты).

Как и предыдущие формулы, формула (3.2.12) также относится к оценке надежности теста, направленного на измерение одной характе­ристики. Но, кроме того, она применима и для многофакторного теста, хотя и нуждается в пересчете после первоначального отбора пунктов, релевантных фактору (после того, как на основании многофакторного анализа отобраны пункты по одному фактору, снова проводится фак­торный анализ - только для этих отобранных пунктов).

Надежность отдельных пунктов теста. Надежность теста обес­печивается надежностью пунктов, из которых он состоит. Чтобы по­высить ретестовую надежность теста в целом, надо отобрать из ис­ходного набора пунктов, апробируемых в пилотажных психометри­ческих экспериментах, такие пункты, на которые испытуемые дают устойчивые ответы. Для дихотомических пунктов (типа «решил - не решил», «да - нет») устойчивость удобно измерять с использованием четырехклеточной матрицы сопряженности:

Тест 1

Да Нет

a

B

c

D

Да Тест 2

Нет

Здесь в клеточке а суммируются ответы «Да», данные испытуе­мым при первом и втором тестировании, в клеточке b - число случа­ев, когда испытуемый при первом тестировании отвечал «Да», а при втором - «Нет» и т. д. В качестве меры корреляции вычисляется фи-коэффициент:

(3.2.13)

Как известно, значимость фи-коэффициента определяется с по мощью критерия хи-квадрат:

(3.2.14)

Если вычисленное значение хи-квадрат выше табличного с од­ной степенью свободы, то нулевая гипотеза (о нулевой устойчивос­ти) отвергается. Удобство использования фи-коэффициента состоит в том, что он одновременно оценивает степень оптимальности данного пункта теста по силе (трудности): фи-коэффициент оказывает­ся тем меньшим, чем сильнее частота ответов «да» отличается от частоты ответа «нет».

Кроме того, сама четырехклеточная матрица позволяет просле­дить возможную несимметричность в устойчивости ответов «да» и «нет» (это важнее для задач, чем для вопросов: например, может ока­заться, что все испытуемые, уже решившие однажды данную задачу, решают ее при повторном тестировании; это наводит на мысль о том, что при втором тестировании происходит сбережение опыта, приоб­ретенного при первом тестировании). Выявленные в результате тако­го анализа неустойчивые и неинформативные (слишком сильные или слишком слабые) пункты должны быть исключены из теста. Пункты следует считать недостаточно устойчивыми, если на репрезентатив­ной выборке величина превышает 0,71. При этом φ< 0,5.

Для т<?го чтобы повысить одномоментную (синхронную) надеж­ность теста, следует из исходной пилотажной батареи пунктов отбро­сить те, которые плохо согласованы с остальными[12] . В отсутствие ком­пьютера согласованность для пунктов также очень просто определяет­ся с помощью четырехклеточной матрицы. В этом случае в первом стол­бце суммируются ответы испытуемых из «высокой».группы (пр величине суммарного балла), во втором столбце - из «низкой».

Высокая Низкая

A

B

C

D

Да

Нет

При нормальном распределении частот суммарных баллов «вы­сокая» и «низкая» группы отсекаются справа и слева 27%-ными мар­гинальными квантилями (рис. 8).

Для оценки согласованности с суммарным баллом применяется полная[13] или упрощенная формула фи-коэффициента:

(3.2.15) [14]

где - количество ответов «верно» («да») на i -й пункт теста;

N* - сумма всех элементов матрицы;

N* = n • 0,54 где n - объём выборки;

Pi = а + b - При включении в эстремальную группу 1/3 выборки

N* = 0,66 • n.

Рис. 8. Квантили «высокой» и «низкой» группы на графике распределения тестовых баллов

В некоторых случаях подобный анализ позволяет уточнить ключ для пункта: если пункт получает значимый положительный фи-коэф­фициент, то ключ определяется значением «+1», если пункт получает значимый отрицательный фи-коэффициент значением «-1». Если пункт получает незначимый фи-коэфф.ициент, то его целесообразно исключить из теста.

При ручных вычислениях фи-коэффициента удобно вначале с помощью формул (3.2.14) и (3.2.15) определить граничное значение значимого (по модулю) фи-коэффициента. Например, при объеме выборки в 100 человек и уровне значимости р < 0,01 пороговое зна­чение вычисляется так:

(3.2.16)

При постоянном использовании компьютера при подсчете сум­марных баллов ключ для каждого пункта Q целесообразно опреде­лить в виде самого фи-коэффициента (или другого коэффициента корреляции), определенного при коррелировании ответов на пункт с сум­марным баллом. Тогда тестовый балл подсчитывается по формуле

(3.2.17)

где хi — суммарный балл i -го испытуемого;

- ответ «верно» (+1) или «неверно» (-1) i -го испытуемого на i -й пункт;

Сi - ключ для i -го пункта: С = +1 для прямого, С= -1 для обрат­ного.

Более чувствительный коэффициент, который также применяет­ся для дихотомических пунктов, - это точечный бисериальный коэф­фициент корреляции, учитывающий амплитуду отклонения индиви­дуальных суммарных баллов от среднего балла:

3.2.18)

где x* - сумма финальных баллов тех индивидов, которые дали утвердительный ответ на i -й пункт теста (решили i -ю задачу);

Sx - стандартное отклонение для суммарных баллов всех индиви­дов из выборки;

- стандартное отклонение по i -му пункту;

- средний балл по всем пунктам.

А. Анастази относит критерий внутренней согласованности тес­та к валидности (Анастази А., 1982, кн. 1, с. 143), однако если и мож­но в данном случае говорить о валидности, то только в смысле осо­бой внутренней валидности теста. Как правило, слишком высокая со­гласованность снижает внешнюю валидность теста по критерию (см. раздел 3.3). Если проверяется согласованность пунктов, составлен­ных одним автором (одним коллективом по стандартной инструкции), то выявление достаточного набора согласованных пунктов свидетель­ствует о внутренней валидности (согласованности) разработанного диагностического понятия (конструкта).

В компьютерных данных факторного анализа аналогом корреля­ции пункта с суммарным баллом является нагрузка пункта на веду­щий фактор («факторная валидность» в терминах А. Анастази). Если прибегать к геометрическому изображению нагрузки как проекции вектора-пункта на ось-фактор, то структура пунктов хорошо согласо­ванного теста предстанет в виде пучка векторов, плотно прилегаю­щих к фактору и вытянувшихся вдоль его оси (рис. 9).

Рис. 9. Векторная модель соотношения «прямых» и «обратных» эмпирических пунктов с релевантным (измеряемым) фактором и иррелевантными («шумовыми») факторами

Последовательность действий при проверке надежности:

1. Узнать, существуют ли данные о надежности теста, предпо­лагаемого к использованию, на какой популяции и в какой диагнос­тической ситуации проводилась проверка. Если проверки не было или признаки новых популяции и ситуации явно специфичны, про­вести заново проверку надежности с учетом указанных ниже воз­можностей.

2. Произвести повторное тестирование на всей выборке стан­дартизации и подсчитать все коэффициенты, как для целого теста, так и для его отдельных пунктов. Анализ полученных коэффициен­тов позволит понять, насколько пренебрежима ошибка измерения, дает ли данный тест интервальную шкалу (высокий r) или только диагностичен для крайних групп (высокий φ), насколько устойчиво измеряемое свойство во времени (возможен ли статистический про­гноз - проекция тестового балла на будущее), в каких своих пунк­тах тест менее надежен (анализ этих пунктов позволяет психологи­чески осмыслить содержательный механизм взаимодействия пунк­тов с испытуемыми).

3. Если возможности обследования испытуемых ограниченны, произвести повторное тестирование только на части выборки (не ме­нее 30 испытуемых), подсчитать (вручную) ранговую или четырех-клеточную корреляцию для оценки внутренней согласованности и ста­бильности теста в целом.

3.3. ВАЛИДНОСТЬ ТЕСТОВ

Проблемы валидизации психологических тестов являются цент­ральными для дифференциальной психометрики, но, к сожалению, до сих пор решенными не до конца. Решение этой проблемы зависит не от статистического аппарата, а от уровня развития теоретического аппарата дифференциальной психологии.

Валидность и надежность. Валидность (или обоснованность) всякой процедуры измерения состоит в однозначности (устойчивос­ти) получаемых результатов относительно измеряемых свойств объек­тов, т, е. относительно предмета измерения. Отличие понятия валидности от надежности измерения удобно раскрывать с помощью раз­личения «объекта» и «предмета» измерения. Надежность - это устой­чивость процедуры относительно объектов. Надежность не обязательно предполагает валидность. В психологии довольно часто возникает такая ситуация, когда исследователь вначале предлагает определенную процедуру измерения, показывает ее надежность -способность устойчиво различать объекты, но вопрос о валидности остается открытым.

Если в сенсорной психофизике вопрос о валидности измерений оказывается в значительной степени затушеванным тем обстоятель­ством, что простейшие физические стимулы достаточно однозначно детерминируют измеряемые свойства ощущений, то в дифференци­альной психометрике значимость проблемы валидности резко возра­стает. Здесь ситуация подобна той, когда в психофизическом опыте испытуемому не указывают, по какому именно параметру следует срав­нивать стимулы. Пусть испытуемый А понял инструкцию так, что стимульные объекты надо сравнивать по весу, а испытуемый Б - по раз­меру. Если процедура измерения будет повторена по отношению к тем же объектам, то она даст вполне устойчивые данные относитель­но объектов, но не даст валидной информации ни о шкале ощущений «веса», ни о шкале ощущений «размера».

При измерении способностей предъявляемый тест отнюдь не обя­зательно актуализирует именно тот психический процесс, который предполагается измерить. Например, столкнувшись с уже встречав­шейся однажды задачей (например, с анаграммой «дзиканпр»), испы­туемый может начать запоминать просто то решение, к которому он уже однажды пришел (слово «праздник»), чем заново решать эту за­дачу. Здесь будет измеряться скорее уровень словесной памяти, чем уровень вербального интеллекта. Точно так же реальная валидность некоторых тестов раскрывается только в результате значительного опыта работы с ними. Например, доказано, что ряд тестов, внешне вы глядящих интеллектуальными, на деле измеряют скорее личностно-стилевые особенности индивида, чем операциональные возмож­ности интеллекта, например, методика «креативного поля» Д. Б. Бо­гоявленской.

Устойчивость теста относительно объектов (испытуемых) явля­ется необходимым, но не достаточным условием его устойчивости относительно измеряемых атрибутов (свойств) объектов. Надежность является необходимым, но не достаточным условием валидности. Отсюда вытекает основное соотношение психометрики:

валидность ≤ надежность.

Это означает, что валидность теста не может превышать его надеж­ность.

Данное соотношение, однако, неверно трактовать как указание на прямую пропорциональную связь валидности и надежности. По­вышение надежности отнюдь не обязательно приводит к повышению валидности[15] . В терминах А. Анастази валидность определяется ре­презентативностью теста относительно измеряемой области поведе­ния. Если эта область поведения складывается из разнообразных фе­номенов, то содержательная валидность теста автоматически требует представленности в нем моделей всех этих разнообразных феноме­нов. Возьмем глобальное понятие «речевая способность» (этому психолингвистическому термину в традиционной тестологии соответству­ет термин «вербальный интеллект»). Сюда относятся такие относи­тельно независимые друг от друга навыки, как навыки письма и чте­ния. Если заботиться о содержательной валидности соответствую­щего теста, то нужно ввести в него группы заданий на проверку этих довольно разных по своему операциональному составу компонентов вербального интеллекта. Вводя разнородные пункты и субшкалы (суб­тесты), мы обязательно сокращаем внутреннюю согласованность, од­номоментную надежность теста, но зато добиваемся существенного повышения валидности. Таким образом, для расширения области при­менения теста психодиагност должен избегать излишнего повыше­ния внутренней согласованности. Одновременно с этим снижением внутренних корреляций между различными пунктами теста (об этом уже говорилось в разделе 3.1) обязательно исчезает отрицательный эксцесс на кривой распределения тестовых баллов, и она все более приближается по форме к нормальной кривой.

Эмпирическая валидность. Если в случае с содержательной ва-лидностью оценка теста производится за счет экспертов (устанавли­вающих соответствие заданий теста содержанию предмета измере­ния), то эмпирическая валидность измеряется всегда с помощью ста­тистического коррелирования: подсчитывается корреляция двух ря­дов значений - баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.

Прагматические традиции западной тестологии привязывали эм­пирическую валидность теста к внешним для психологии социально-прагматическим критериям. Эти критерии являются показателями, обладающими непосредственной ценностью для определенных об­ластей практики. Практика всегда имеет целью либо повысить, либо понизить эти показатели. Например, в области педагогической пси­хологии это «успеваемость» (которую надо повысить), в психологии труда это «производительность труда» и «текучесть кадров», в меди­цине - «состояние здоровья пациента», в психологии управления -«совместимость», «срабатываемость» коллектива, в юридической пси­хологии - «преступность» (которую надо понизить) и т. п.

Ориентируясь непосредственно на эти категории, психолог, пы­тающийся скоррелировать результаты теста с этими показателями, фактически решает сразу две задачи: задачу измерения валидности и задачу измерения практической эффективности своей психодиагнос­тической программы. Если получен значимый коэффициент корреля­ции, то можно считать, что решены с позитивным результатом сразу обе эти задачи. Но если корреляции не обнаружено, то остается нео­пределенность: либо невалидна сама процедура (тестовый балл не отражает, например, стрессоустойчивость оператора), либо неверна гипотеза о наличии причинно-следственной связи между психичес­ким свойством и социально значимым показателем (стрессоустойчивость не влияет на процент аварийных ситуаций).

Таким образом, социально-прагматические критерии являются комплексными: они позволяют измерить валидность-эффективность, но не каждое из этих двух свойств теста отдельно. На практике пси­холога часто ожидает и еще более сложная ситуация, когда заказчик требует от психолога на основании полученного диагноза сразу же определенных мер по вмешательству в ситуацию (отбор, консульти­рование, обучение и т. п.). В этом случае повышение показателей (достоверное по сравнению с контрольной группой) доказывает од­новременно и валидность-эффективность диагностики, и эффектив­ность самого вмешательства. А отрицательный результат дает еще большую неопределенность, так как оказывается невозможным от­делить неэффективность вмешательства от низкой валидности ди­агностики.

Ориентация на социально-прагматические критерии, приводящие к склейке понятий «валидности измерения» и «причинного прогноза по результатам измерения», бесспорно, сдерживала и продолжает сдер­живать развитие концептуального аппарата дифференциальной пси­хологии. При этом суть самого предмета измерения: измеряемого пси­хического свойства - оказывается вне фокуса внимания не только заказчика, но и самого психолога, превращающегося в этом случае в тестолога, которого не интересует, что именно он измеряет, главное лишь, чтобы от этого «нечто» перекидывался мостик к полезному эффекту, обеспечивающему психологу социальное признание.

Процедура эмпирической валидизации. Организация выборки при эмпирической валидизации зависит от временного статуса критерия. Если этот критерий - событие в прошлом (ретроспективная валидизация), то к участию в психодиагностическом обследовании доста­точно привлечь только тех испытуемых, которые оказались на экстремальных полюсах по этому критерию[16] . В результате применяется ме­тод экстремальных (контрастных) групп. Коррелирование с суммар­ным баллом по тесту оценивается с помощью бисериального коэф­фициента по формуле (3.2.17). При этом в статусе дихотомической переменной (на месте отдельного пункта) оказывается сам критерий валидности: x— сумма баллов по тесту, полученных «высокой» груп­пой по критерию; - стандартная ошибка критерия, связанная с численностью «высокой» (р) и «низкой» (q) групп.

Если критерий - будущее событие (проспективная валидизация), то выборка должна быть составлена с запасом - с учетом вероятного объема экстремальных групп в будущем. Например, нужно выяснить, позволяет ли диагностика темперамента прогнозировать повышен­ный риск психосоматических заболеваний (гипертония, язва, астма и т. п.). Пусть на основании эпидемиологических исследований извес­тно, что в течение трех лет из. 1000 здоровых людей этими болезнями заболевают 57 человек. Это означает, что превентивной (предупреж­дающей) диагностикой должно быть охвачено около 2000 человек, чтобы получить численность «высокой» группы (заболевших) поряд­ка 100 человек. Проспективная валидизация выявляет прогностичес­кую эффективность диагностической процедуры. Высокая прогнос­тическая валидность доказывает как валидность самого измерения, так и наличие предполагаемой причинной связи.

Ретроспективная валидизация позволяет в лучшем случае решить только первую из двух задач. Например, если для исследования лич­ностной предрасположенности к совершению краж проведено обсле­дование лиц, находящихся под следствием (т. е. уже совершивших преступление), то выявление акцентированных черт «тревожности», «агрессивности» и т. п. еще не может интерпретироваться как свиде­тельство причинных факторов преступности - эти черты могут быть лишь следствием сложившихся обстоятельств: лишение свободы, уг­рызения совести и т. п. (Ратинов А. Р., 1979). Во многих медико-пси­хологических исследованиях был выделен особый диагностический синдром «госпитализации», который обнаруживается у любой кате­гории госпитализированных больных (обычно он выражается в по­вышении шкал «депрессии» и «ипохондрии» по MMPI – Шхвацабая, 1980). Очевидно, что подобные личностные сдвиги никак нельзя ин­терпретировать в смысле симптомов предрасположенности к опреде­ленным психогенным заболеваниям, ибо они относятся к следстви­ям, а не к причинам этих заболеваний.

Конструктная валидность. В отличие от прагматической валидизации собственно психологическую валидизацию порой оказыва­ется провести гораздо труднее в силу отсутствия какого-либо более объективного внутрипсихологического критерия, чем сам тест.

Наиболее благополучная ситуация имеется тогда, когда для из­мерения данного свойства в психологии уже имеется процедура с известной валидностью. В этом случае корреляция между балла­ми двух тестов - линейная (см. формулу 3.2.3) или ранговая (см. формулу 3.2.5)- указывает на то, обладает ли новый тест конвер­гентной валидностью по отношению к старому. Если новый тест обнаруживает высокую конвергентность результатов со старым и одновременно оказывается более компактным и экономичным 'в проведении и подсчете, то психодиагносты получают возможность использовать новый тест вместо старого.

Однако во многих случаях для измеряемого свойства психодиа­гност не может найти в литературе ни одного уже апробированного теста с известной валидностью. В этом случае он может сформулиро­вать ряд предсказательных гипотез о том, как будет коррелировать его новый тест с другими тестами, измеряющими родственные характеристики испытуемых. Эти гипотезы выдвигаются на основе теоретических представлений об измеряемом свойстве. Их подтвержде­ние указывает на валидность выдвигаемого конструкта, т. е. на конструктную валидность теста. В западной литературе это операциональное определение конструктяой валыидности называется предполага­емой валидностью (assumed validity).

Представления о конструктной валидности тестов постоянно развиваются с пополнением репертуара методик. Эмпирические иссле­дования взаимосвязей результатов, получаемых с помощью разных методик, обогащают теоретические представления об измеряемых свойствах.

С другой стороны, понятие конструктной валидности указывает на высокую зависимость эмпирических связей теста от теоретичес­ких представлений его автора об измеряемом свойстве. Для иллюст­рации приведен пример взаимоотношений между двумя популярны­ми тест-опросниками: MAS Ж. Тейлор и EPI Г. Айзенка. Многочис­ленные корреляционные исследования, проведенные на репрезента­тивных выборках, показали, что шкала MAS (тревожность) Ж. Тейлор положительно коррелирует со шкалой «нейротизм» и отрицательно со шкалой «экстраверсия» Айзенка. Эти соотношения можно проил­люстрировать графически (рис. 10): вектор MAS оказывается распо­ложенным в квадранте «Нейротизм - Интроверсия», образованном си­стемой из ортогональных (статистически независимых) факторов EPL С точки зрения концепции Г. Айзенка, эти данные можно рассмат­ривать как свидетельства низкой валидности шкалы Ж. Тейлор: MAS коррелирует не только с релевантным фактором «нейротизм», но и с иррелевантным фактором «интроверсия». С этой точки зрения, оп­росник EPI оказывается просто нечувствительным к особой разно­видности «нейротизма» - к нейротизму (тревожности) экстравертов; в перечне пунктов MAS отсутствуют высказывания, в которых могла бы проявиться тревожность экстраверта. Однако с точки зрения тоготеоретического смысла, который приписывают показателям MAS К. Спенс и Ж. Тейлор, эта ситуа­ция вполне закономерна, жела­тельна и никак не является арте­фактом - следствием дефекта их диагностического средства. Со­гласно К. Спенсу, пытавшемуся перенести на человеческое пове­дение теорию научения Халла, MAS измеряет общий уровень драйва - неспециализированного побуждения, которое достигает максимума как раз при сочетании нейротизма (специфическая ак­тивация по Г. Айзенку) и интро-версии (неспецифическая активация)

Рис. 10. Векторная модель соотношения показателя «Тревожность» по тест-опроснику MAS с факторами тест-опросника EPI

Таким образом, вовсе не всегда краткие названия тестов од­нозначно выражают теоретический статус диагностического конст­рукта - понятия об измеряемом свойстве.

Конвергентная и дискриминантная валидность. От того, как пси­холог определяет диагностический конструкт, зависит стратегия вклю­чения в тест определенных пунктов. Если Айзенк определяет свой­ство «нейротизм» как независимое от экстраверсии-интроверсии, то это означает, что в его опроснике примерно поровну должны быть представлены пункты, с которыми будут соглашаться невротичные интроверты и невротичные экстраверты (векторы этих пунктов дол­жны быть примерно поровну распределены в правом и левом нижних квадрантах; см. рис. 10).-Если же на практике окажется, что в тесте будут преобладать пункты из квадранта «Нейротизм-Интроверсия», то, с точки зрения теории Айзенка, это означает, что фактор «нейро­тизм» оказывается нагруженным иррелевантным фактором - «интроверсией». (Точно такой же эффект возникает, если появится перекос в выборке - если в ней будет больше невротичных интровертов, чем невротичных экстравертов.)

Для того чтобы не сталкиваться с такими сложностями, психо­логи хотели бы иметь дело с такими эмпирическими показателями (пунктами), которые однозначно информируют только об одном факторе. Но это требование реально никогда не выполняется: вся­кий эмпирический показатель оказывается детерминированным не ; только тем фактором, который нам нужен, но и другими - иррелевантными задаче измерения (рис. 11).

На рис. 11 постоянным для всех показателей является релевант­ный фактор А, но каждый раз он оказывается сопряжен с иррелевант-ными факторами - X, К и Z. Задача состоит в таком подборе пунктов,

чтобы все потенциальные иррелевантнв!е факторы были уравнове­шены, т. е. чтобы ни один из них не встречался бы чаще других на множестве показателей (пунктов), включенных в тест.

Рис, 11. Связь эмпирических показателей П1 , П2 , П, с релевантным (измеряемым) фактором А и с иррелевантными («шумовыми») факторами X , Y , Z , обусловливающими невалидность показателей

Таким обра­зом, по отношению к факторам, которые концептуально определяют­ся как ортогональные к измеряемому (встречающиеся с ним во всех комбинациях), составитель теста должен при отборе пунктов приме--нить стратегию искусственного балансирования (Готтсданкер Р., 1982);

Соответствие пунктов измеряемому фактору обеспечивает конвергентную валидность теста. Сбалансированность пунктов относи­тельно иррелевантных факторов обеспечивает дискриминантную валидностъ. Эмпирически она выражается в отсутствии значимой кор­реляции с тестом, измеряющим концептуально независимое свойство.

С точки зрения теории Айзенка, тест Ж. Тейлор не обладает дискриминантной валидностью по отношению к факторам «экстраверсия-интроверсия», хотя и обладает определенной конвергентной ва­лидностью по отношению к релевантному фактору - «нейротизм».

Экспертная эмпирическая валидизация. В отсутствие какого-либо уже валидизированного теста, параллельно измеряющего изучаемое свойство, а также в отсутствие разработанного теоретического кон­текста, позволяющего проверять конструктную валидность; психодиагност оказывается перед необходимостью привлечения экс­пертов к валидизации теста. В отличие от экспертного анализа содер­жания теста., эмпирическая экспертная валидизация предполагает ра­боту экспертов не с тестом (лучше, чтобы о нем эксперты вообще ничего не знали), а с испытуемыми из выборки стандартизации.

Необходимо экспертам обеспечить стандартные условия для на­блюдения за испытуемыми. Но не всегда такое стандартизованное на­блюдение удается организовать. Даже если предприняты серьезные усилия по организации наблюдения за поведением испытуемых в ка­кой-либо искусственной лабораторной ситуации, такое наблюдение все равно будет значительно уступать по информативности полевому наблюдению - в естественных условиях. Если измеряемое свойство теоретически определено как устойчивая универсальная черта лич­ности - как диспозиция к инвариантному поведению в широком спек­тре ситуаций (см. главу 4), то и отдельного полевого наблюдения ока­жется недостаточно для получения полноценного экспертного критерия валидности.

Поэтому на практике часто прибегают к оценкам особого типа -к субъективным оценкам, которые выносят испытуемому люди из его круга, имеющие опыт реального общения с ним. С учетом этого, про­цедура оценивания приспосабливается к обычным людям, не являю­щимся психологами. На психолога падает большая нагрузка по со­ставлению детальной инструкции оценщикам, однозначно задающей смысл оцениваемой характеристики. Лучшие условия для такой процедуры возникают при наличии группы испытуемых, тесно общаю­щихся между собой; тех, которые могут одновременно побывать и испытуемыми по отношению к тесту, и оценщиками по отношению друг к другу. В отечественной литературе эта процедура получила со­кращенное обозначение ГОЛ - «групповая оценка личности» (Кузь­мин Н. В., Семенов В. С., 1977).

Для того чтобы групповая оценка личности была источником дей­ствительно валидной информации, оценщики должны согласованно оценивать испытуемых. Если в оценках разных оценщиков нет согла­сованности, то это означает, что либо оцениваемое свойство не про­явилось у объекта оценивания, либо оценщики по-разному проинтерпретировали инструкцию. Для измерения согласованности должна быть составлена таблица с оценками (табл. 6).

Таблица 6

Оценщики

Испытуемые

О1

О2

Оk

И1

x11

x12

x1k

C1

И2

x21

x22

x2k

C2

Иn

xn1

xn2

xnk

Cn

Методы анализа данных, содержащихся в такой таблице, формаль­но совершенно эквивалентны тем методам, которые применяются для обработки таблиц «испытуемые - пункты» (см. раздел 3.1), В частно­сти, суммы по строкам дают суммарные баллы, полученные каждым испытуемым у всех оценщиков. Таким образом, оценщики в данном случае оказываются формально в роли пунктов теста. Рассчитывая попарные корреляции между различными столбцами этой таблицы, можно получить коэффициенты согласованности для отдельных пар оценщиков. Глобальной мерой согласованности оценщиков может служить коэффициент надежности а Кронбаха - см. формулу (3.2.8).

Если же групповая оценка не обнаруживает надежности, то она не может использоваться в качестве критерия валидизации при про­верке валидности теста.

Эмпирическое значение коэффициента валидности рассчитыва­ется как линейная или ранговая корреляция между двумя рядами зна­чений: тестовыми баллами и суммарными баллами экспертной оцен­ки. Это эмпирическое значение при наличии невысокого коэффици­ента надежности критерия корректируют по формуле

(3.3.1)

где - эмпирическая корреляция с критерием;

ас — надежность критерия;

rtx - корреляция с «истинным» критерием («истинная» валидность теста).

Анализ пунктов по критерию валидности. Валидность всего тес­та целиком зависит от валидности входящих в него пунктов. Макси­мальная валидность достигается за счет отбора таких пунктов из пи­лотажной батареи, которые, обладая значимой корреляцией с крите­рием, минимально коррелируют между собой. Отбор пунктов имен­но по критерию валидности обеспечивает максимальную прагматическую эффективность теста. Вручную (на калькуляторе) та­кой отбор можно произвести, рассчитав бисериальную корреляцию (или фи-корреляцию) критерия с каждым пунктом из пилотажной батареи, - см. формулы (3.2.15) и (3.2.17). Компьютер позволяет ис­пользовать более эффективный алгоритм, основанный на анализе ча­стных корреляций между критерием и пунктами и предполагающий построение уравнения множественной регрессии (Аванесов В. С., 1982, с. 153-157). В результате в таком уравнении каждый пункт по­лучает весовой коэффициент[17] , количественно выражающий его вклад в критерий, не сводимый к вкладу других пунктов, т. е. поиск опти­мального набора пунктов автоматизируется. X. Гаррет приводит сле­дующую яркую иллюстрацию эффективности алгоритма, позволяю­щего подобрать оптимальный набор пунктов. Пусть имеется 20 пунк­тов, каждый из которых имеет корреляцию с критерием порядка 0,30. Оказывается, если эти пункты в среднем коррелируют друг с другом на уровне = 0,60, то множественная корреляция суммарного тесто­вого показателя с критерием равняется 0,38, если же га = 0,30, мно­жественная корреляция повышается до 0,52. Наконец, при rtj = 0,10

эффективность (валидность) теста достигает весьма высокого уров­ня: 0,79. Те же самые проблемы возникают при подборе оптимальной батареи тестов, направленных на прогнозирование какого-то одного социально ценного показателя (успеваемость, производительность труда и т. п.).

Как уже указывалось в разделе 3.1, тест, обладающий высокой критериальной валидностью должен давать монотонную зависимость величины критерия от тестового балла (см. рис. 6). Для того чтобы получить монотонную линию регрессии, психодиагност должен вклю­чить в тест X только такие пункты, которые являются валидными по критерию С. В противном случае на кривой неминуемо появятся про­валы[18] . Крутизну линии регрессии можно существенно повысить за счет нацеленного отбора из первоначальной батареи только таких за­даний, которые обладают значимо высокой корреляцией (или регрес­сионным коэффициентом в уравнении множественной регрессии) с критерием.

После отбора валидных пунктов должна быть произведена пере­крестная валидизация (см. Анастази А., 1982, с. 197). В чем ее смысл? Если при анализе корреляций между батареей из 200 заданий и ка­ким-то критерием получают 10 заданий, значимо коррелирующих е критерием на уровне ошибки р < 0,05, то это может быть следствием чисто случайного совпадения (сравните 10/200=0,05). Чтобы убедиться в том, что отобранные пункты теста действительно могут различать (или прогнозировать) критерий, нужно рассмотреть, как коррелиру­ют с критерием эти пункты на другой выборке, которая не использо­валась при их отборе.

Простой метод реализации принципа перекрестной валидизации состоит в том, что вся выборка делится на две случайные половины и производится раздельный расчет корреляций пунктов с критерием для-. каждой половины выборки. Если выделенные (значимые) пункты совпадают, то перекрестную валидизацию можно считать удачной.

Метод критериального тестирования очень трудоемок. .Прак­тически невозможно построить критериальный тест за счет одной статистики, сколь бы мощными выборками и батареями заданий мы ни располагали. Необходима работа над содержательной валидностью заданий. Критериальное тестирование имеет ограни­ченное применение в задачах построения методик с широкой областью применения.

Следует еще раз подчеркнуть, что анализ валидности отдельных пунктов служит не только прагматическим целям, но может и должен служить целям углубления представлений о содержательно-теоретическом смысле измеряемого свойства: на основании содержательно­го анализа пунктов, отобранных по критерию, психолог уточняет и корректирует свою первоначальную теоретическую схему, свое по­нимание измеряемого свойства.

Достоверность самоотчета. Рассматривая общую проблемы валидности целесообразно выделить вопрос об обеспечении ва­лидности процедур стандартизованного самоотчета. Сюда относят­ся различные техники шкалирования, классифицирования, срав­нения и тест-опросники. Вербальная форма тестового материала порождает у испытуемого определенные встречные гипотезы о цели тестирования. Если ситуация диктует испытуемому необходимость фальсификации ответов, то он редко отказывается от этой возмож­ности.

Валидность — характеристика любых измерений, в том числе и физических. Специфические проблемы валидности, связанные с актив­ностью человека как объекта психодиагностики, целесообразно обозначить особым образом - проблемы обеспечения достоверности.

Психологические факторы, от которых зависит достоверность са­моотчета, условно можно сгруппировать в следующие классы:

1. Факторы знания. У испытуемого может быть более или менее четкое представление о следующем: а) свойственно ли ему в действи­тельности или нет тестируемое поведенческое проявление (с некото­рыми ситуациями, имплицитно подразумеваемыми в вопросе тест-оп­росника, испытуемый мог на практике никогда не встречаться: напри­мер, утверждение «После выигрыша в спортлото Вы покупаете боль­ше лотерейных билетов» подразумевает, что испытуемый, во-первых, играет в спортлото и, во-вторых, выигрывает); б) какое личностное свой­ство скрывается у психолога за тем или иным конкретным поведением, описанным в суждении; в) как это свойство соотносится с общеприня­тыми моральными нормами и признаками социального успеха.

2. Фактор социальной желательности. Обозначает тенденцию испытуемого давать о себе социально одобряемую информацию. Сила этой тенденции зависит как от общей внеситуативной установки испы­туемого на морализацию «Я-образа» и социальную успешность, так и от того, насколько эту установку актуализирует сама ситуация тестиро­вания. Однако эта тенденция не будет давать систематического искаже­ния, если испытуемые не смогут разгадать направленность теста-оп­росника и связать диагностируемое свойство с тем или иным полюсом социальной желательности. Таким образом, действие этого фактора до некоторой степени опосредовано действием факторов знания. Однако при диагностике личностных свойств, тесно связанных с психической «нормальностью» или «социальной успешностью», фактор социальной желательности ответа обусловливает очень серьезные искажения.

3. Факторы индивидуальной тактики. Здесь подразумевается действие «Я-концепции» («Я» для себя) и «Я-образа» («Я» для дру­гих) на ситуативную тактику испытуемого в момент тестирования. Выполняя тест, испытуемый всегда находится в невольном диалоге с самим собой и в своих ответах на вопросы раскрывает себя не только для других, но и для себя самого. Испытуемый стремится подтвер­дить «Я-концепцию» или фальсифицировать определенный «Я-образ» с заданными свойствами. Как правило, в ситуациях высокого соци­ального риска «Я-образ» полностью доминирует: например, преступ­ник при экспертизе стремится прежде всего предстать больным или неприспособленным к жизни, хотя в действительности ему было бы приятно думать о себе как о вполне адаптированном здоровом чело­веке. Точно так же склонны подчеркивать свои трудности и проблемы клиенты, обратившиеся за помощью к психологу или психотера­певту (чтобы вызвать к себе его повышенное внимание). В менее рег­ламентированных ситуациях, наоборот, может доминировать мотива­ция самопознания: в этом случае испытуемый невольно стремится подтвердить с помощью теста свои гипотезы о самом себе.

Заслуживают внимания и особые формы отказа испытуемого от тестирования: позиционный стиль ответа (соглашательство или, на­оборот, отрицание), случайные ответы. Для выявления подобных от­казов обычно достаточно довольно простых мер: 1) для исключения влияния соглашательства (отрицания) применяются перечни с «пря­мыми» (ответ «верно» в пользу измеряемого свойства) и «обратны­ми» (ответ «неверно» в пользу измеряемого свойства) пунктами. Кро­ме того, производится подсчет баланса подтверждающих и отверга­ющих ответов: если баланс резко нарушается, то протокол признает­ся бракованным; 2) для выявления случайных ответов в большие перечни вводят вопросы-дубли (синонимические перефразы) или пря­мые повторы: если испытуемый слишком часто по-разному отвечает на одинаковые вопросы, значит, он применяет случайную тактику. Вводят также и крайне редкие утверждения, с которыми испытуемые, как правило, соглашаются только по ошибке.

Более изощренные методы требуются для борьбы с социальной желательностью. Ниже рассмотрены три наиболее часто используе­мых варианта.

1. Введение особых «шкал лжи» в диагностический вариант методики. Они составляются из вопросов-ловушек: тот или иной ответ на эти вопросы явно предопределен социальной желательностью. Если испытуемый набирает слишком высокий балл по этой шкале, его протокол бракуется. Более тонкий вариант — введение «шкал коррекции» (например, в MMPI): получение определенного балла по этим шкалам вызывает внесение поправок к баллу по другим шкалам, скоррелированным со шкалой коррекции. Величина поправок определяется коэффициентом линейной регрессии (измеренным в нормативном эксперименте) между баллами, полученными по шкале коррекции и основной диагностической шкале (шкале свойства).

2. Устранение или сбалансирование социальной желательности с помощью использования инструкции на преднамеренную фальсификацию результатов. Участникам пилотажных замеров кроме обычной инструкции дается дополнительная (во вторую очередь): «Заполните опросник от лица человека, желающего произвести самое благопри­ятное впечатление». Затем производится отбор пунктов на основании того, насколько процент ответов на них отличается от 50 процентов (значение, ожидаемое для пунктов, являющихся нейтральными с точ­ки зрения социальной желательности).

В качестве меры желательности в данном случае можно восполь­зоваться следующим коэффициентом:

(3.3.2)

где N (+) — сумма ответов «верно» на данный пункт при инструкции на фальсификацию;

N (-) - сумма ответов «неверно» в тех же условиях;

n - объем выборки.

Значимость коэффициента приближенно оценивается по крите­рию «хи-квадрат», определенному формулой (3.2.14), которой в пра­вой части вместо φ подставляется .

Поскольку инструкция на преднамеренную фальсификацию соз­дает условия, в которых социальная желательность суждений акцен­тируется, то значимыми следует считать такие высокие по модулю значения при которых , превышает теоретическое значение для квантиля

р < 0,001. Из таблицы для распределения «хи-квад­рат» находим = 10,83. Таким образом, при наличии выборки объе­мом 50 человек . Это означает следующее: если

на i пункт более чем 36 испытуемых из 50 ответили «верно», то его нужно отнести к положительному полюсу шкалы социальной жела­тельности, если менее чем 14 ответили «верно» — к отрицательному. Такие пункты должны быть либо полностью исключены из опросни­ка (что редко удается), либо количество положительных и отрицатель­ных пунктов должно быть уравновешено.

Таким образом могут быть отобраны и пункты для шкалы лжи. Суммарный балл по этой шкале распределяется так, как показано на рис. 12. В качестве критерия разделения испытуемых выбирается критическая точка, которая позволяет минимизировать ошибки типа «про­пуск» (зачисление лживых испытуемых в число правдивых) и ошиб­ки типа «ложная тревога» (зачисление правдивых в число лживых). Положение критической точки на шкале можно менять в зависимос­ти от баланса цены двух типов ошибок: в некоторых случаях «про­пуск» гораздо опаснее, чем «ложная тревога».

Рис. 12. Смещение распределения тестовых баллов по «шкале лжи» к полюсу высоких значений X при инструкции на выполнение теста-опросника с позиции «идеального» человека

Фальсифицирующая инструкция используется также и для иссле­дования степени «скрытности-открытости» формулировок вопросов. Например, испытуемым дается инструкция на симуляцию высокой тревожности по опроснику MAS Ж. Тейлор. В этом случае, как это уже было показано, ответы на многие пункты значимо изменяются. Такие пункты являются слишком открытыми — они информируют испытуемого об измеряемом свойстве и позволяют ему вносить тен­денциозные искажения в результаты в своих интересах.

3. С распространением факторного анализа чаще стала приме­няться стратегия «балансирования социальной желательности». При этом исследователь-психометрист задается целью обеспечить дискриминативную валидность своего теста относительно шкалы «соци­альной желательности». Это достигается с помощью факторного ана­лиза корреляций между пунктами. Факторный анализ в применении к одномерному тесту-опроснику, как правило, выделяет два фактора: относящийся к самому измеряемому свойству и относящийся к соци­альной желательности. На рис. 13 схематически представлено фак­торное пространство для опросника «Склонность к риску».

Рис. 13. Иллюстрация рассеяния векторов (., изображающих пункты теста-опросника в пространстве двух факторов: релевантного и иррелевантного. Выше и ниже штриховых линий - области низкой достоверности

Каждый вопрос представлен вектором, задаваемым проекцией на релевантный фактор - Склонность к риску и иррелевантные «Социаль­ное одобрение» и «Социальное порицание». Требование конвергент­ной валидности по отношению к измеряемому свойству формулирует­ся как требование к пунктам - иметь высокую проекцию (нагрузку) на горизонтальную ось. Дискриминативная валидность по отношению к социальной желательности - это требование иметь пренебрежимо ма­лую нагрузку на вертикальную ось. Очевидно, имеются два способа устранить эффект социальной желательности: либо выкинуть все пун­кты, нагруженные фактором социальной желательности (выше или ниже штриховых линий, либо уравновесить их количество на полюсах соци­альной желательности.

Понятно, что при таком способе освобождения от социальной же­лательности диагностическая шкала всегда оказывается так называе­мой «ß-шкалой», в отличие от «а-шкал», у которых максимум жела­тельности достигается на одном из полюсов, у «ß-шкал» максимум желательности достигается в «золотой середине», т. е. линия регрес­сии желательности по «бетта-шкале» оказывается криволинейной (рис. 14). Если применить такой метод к построению опросника «Склон­ность к риску - Осторожность», то в результате диагностический кон­структ автоматически становится «бета-шкалой»: и слишком высокая склонность к риску, и излишняя осторожность - одинаково нежелатель­ны, тогда как оптимум лежит посередине между крайностями.

Рис. 14. Схематическая иллюстрация «-шкалы, связанной с фактором социальной желательности монотонной зависимостью, и ß -шкалы, связанной с этим фактором криволинейно – с максимумом в области «золотой середины»

Из трех перечисленных выше методов первый относится к отсеву испытуемых и требует введения в перечень вопросов для шкалы «лжи». Второй и третий методы позволяют отобрать только такие пункты, ко­торые обеспечивают устранение социальной желательности. Но они, как правило, трансформируют сам конструкт, который обязательно ста­новятся ортогональным к социальной желательности. При необходи­мости диагностирования свойств, обязательно коррелированных с же­лательностью, единственный метод состоит в применении шкал кор­рекции и корректирующих поправок, но и этот метод нельзя считать вполне надежным. Так что диагностика свойств, сопряженных с соци­альной желательностью, в ситуациях экспертизы всегда рискованна.

С другой стороны, в ситуации, когда сам испытуемый заинтере­сован в точных результатах («ситуация клиента»), психодиагност мо­жет пользоваться тестами-опросниками, не опасаясь артефакта соци­альной желательности.

Обычно в ходе практической проверки достоверности опросника психологу при обработке результатов пилотажного исследования при­ходится иметь дело с матрицей данных, подобной таблице, представ­ленной на рис.15.

Ключ по шкале лжи L изображен на рис. 15 в виде второго столб­ца — справа от столбца, содержащего ключ по основной диагности­ческой шкале С. Если в строке k+1 зафиксированы баллы, подсчитан­ные по основному ключу, то в строке k+2 - баллы, подсчитанные по ключу для шкалы лжи. Баллы Хk +2 отражают величину тенденции диссимуляции (социальной желательности) у данного испытуемого (низкие значения Хk +2 отражают тенденцию симуляции асоциальности или агравации - отягощения психической дезадаптации).

Рис. 15 Схематическое представление таблицы «пункты ( t ) - испытуемые ( S )», вектора суммарных баллов Х k +1 , вектора с баллами по шкале лжи Х k +2 , вектора С со значениями ключа по основной шкале, вектора L с ключом по шкале лжи

Для успешного использо­вания шкалы лжи пункты, от­носящиеся к этой шкале (име­ющие ненулевые значения L), должны быть перемешаны в тестовом буклете с пунктами-вопросами, тестирующими основное психическое свой­ство (в противном случае -если все они собраны вмес­те - достоверность искусст­венно возрастает).

Оценка достоверности пунктов достигается с помо­щью статистической проце­дуры, аналогичной процеду­ре измерения внутренней валидности пунктов (надежно­сти-согласованности - см. раздел 3.2): если при измере­нии внутренней валидности следует прокоррелировать каждую строку 1, 2,..., k со строкой k+l, то при измерении достоверности следует прокоррелировать каждую строку 1, 2,..., k со строкой k+2 (подходят точечно-бисериальный или четырехклеточный коэффициенты корреляции). Наиболее высокие по модулю значе­ния корреляции должны быть получены в этом случае для пунктов, из которых составлена сама шкала лжи (это подтверждает ее консистентность, дифференцирующую силу для данной выборки). Положитель­ная значимая корреляция для г (ti ., Хk +2 ) пункта из основной шкалы Сi О указывает на то, что данный пункт оказывается «прямым» по шкале социальной желательности; отрицательная значимая корреляция ука­зывает на то, что данный пункт является «обратным» по этой шкале.

При подготовке особенно значимого психодиагностического обсле­дования, в котором надо принципиально исключить всякую возмож­ность преднамеренной фальсификации результатов, следует дополнить критерий оценки достоверности с помощью особой шкалы лжи еще одним критерием, основанным на использовании «фальсифицирующей инструкции», Для этого после обычной инструкции той же самой пи­лотажной выборке психолог дает инструкцию: «А теперь снова выпол­ните задание, но старайтесь описать себя так, чтобы выглядеть макси­мально благоприятно в глазах большинства других людей». В резуль­тате применения такой инструкции психолог получает дополнитель­ную таблицу, аналогичную таблице на рис. 15, только содержащую фаль­сифицированные данные. В таком случае кроме подсчета очень грубого индекса «желательности» по формуле (3.3.2) у психолога возникает возможность поэлементного сравнения ответов испытуемых на один и тот же вопрос в обычной и фальсифицированной диагностических си­туациях. Очевидно, что недостоверным следует считать вопрос, отве­ты на который будут изменены в фальсифицированной ситуации в оп­ределенном систематическом направлении. Здесь пригодится простей­ший критерий значимости изменений, основанный на распределении «хи-квадрат» (Рунион Р., 1982, с. 57-61). Для каждого пункта строится четырехклеточная матрица сопряженности:

«После»

+ -

А=40

В=36

С=22

D=48

«До» +

Здесь в клеточке А указана частота сохранения ответа «верно» на некоторый /-и вопрос (из 76 ответивших «верно» таких оказалось толь­ко 40 испытуемых), в клеточке В - частота изменения ответа «верно» на ответ «неверно» и т. д. Как видим, смена инструкции привела к значительным изменениям. Но для оценки значимого направления этих изменений автор критерия Макнимар предложил сравнивать между собой по критерию «хи-квадрат» только элементы В и С этой матрицы:

(3.3.3)

где - вычисленное эмпирическое значение статистики хи-квадрат

с одной степенью свободы. Для нашего примера =2,91, что ниже, чем граничное значение =3,84, и, следовательно, нулевая гипоте­за об отсутствии значимых направленных изменений не может быть отвергнута - пункт не является значимо нагруженным артефактным фактором социальной желательности и может быть включен в диаг­ностический вариант теста-опросника без изменений.

По результатам такого исследования удобно составить табличку К 2: в первом столбце -показатели корреляции пунктов со шкалой лжи, во втором - показатели значимости изменений при переходе к фальсификации. Безусловно достоверными можно считать только те пункты, которые не получили значимых : коэффициентов ни в первом, ни во втором столбце. Если таких пунктов оказывается слишком мало для составления надежной шкалы и если среди недостоверных пунктов достаточно много таких, которые обладают существенной внут­ренней (корреляция с суммарным баллом по основной шкале) или внешней (корреляция с критерием) валидностью, то следует прибегнуть к тактике балансирования: ввести в основную шкалу одинако­вое количество «прямых» и «обратных» пунктов по шкале социаль­ной желательности так, чтобы все четыре квадранта на рис. 13 были заполнены пунктами равномерно (среди «прямых» по основной шка­ле было бы поровну «прямых» и «обратных» по желательности, и среди «обратных» по основной - также поровну).

Без указанных предосторожностей тест-опросник неизбежно бу­дет давать систематическое искажение результатов (в сторону по­вышения или понижения баллов по основной шкале) всякий раз, ког­да испытуемый будет квалифицировать диагностическую ситуацию как ситуацию экспертизы.

Указанные проблемы и приемы обеспечения достоверности от­носятся не только к тест-опросникам, но и к другим техникам стан­дартизованного самоотчета, подверженным мотивационным искаже­ниям. Существует теоретическая возможность преодолеть все эти проблемы. Но на практике это оборачивается огромной эмпирико-методической работой.

Другой путь - управление процессами категоризации в ходе са­мой диагностики. В так называемой «репертуарной модификации» тест-опросника испытуемому специально предлагают выполнять тест не только от своего имени, но и от имени определенного репертуара ролей: «большинство людей», «моральный человек», «преуспевающий человек» и т. п. (Шмелев А. Г. и др., 1984). Извлечение практических выгод из подобной модификации обусловлено возможностью компь­ютерной обработки результатов либо сразу же после тестирования, либо даже в ходе самого тестирования (см. раздел 3.6).

Порядок действий психолога при проверке валидности. Очень трудно выделить универсальный алгоритм работы психолога по про­верке валидности, ибо существуют различные подходы к обеспече­нию валидности, обусловленные теоретико-методологическими раз­личиями определенных психологических школ. Для прагматически ориентированных тестологов (каковыми традиционно являлись до не­давнего времени почти все англо-американские специалисты) глав­ный момент - поиск операционально строго заданного социально-прагматического критерия валидности, по отношению к которому ди­агностические тесты и их составные части (пункты) подбираются как бы автоматически -в ходе эмпирико-статистических процедур сбора и корреляционного анализа результатов. Но, конечно, неверно было бы приписывать этому подходу «бездумность в опоре на статистику»: ведь статистика только тогда позволяет выявить валидное подмноже­ство пунктов, когда исходное множество подобрано не случайно - с использованием априорных корректных содержательно-психологичес­ких представлений.

Современные методологи психологического тестирования факти­чески единодушно приходят к признанию (как наиболее оптималь­ной) рационально-эмпирической стратегии конструирования теста и проверки валидности. Перечислим этапы этой стратегии.

1. Теоретический анализ диагностического конструкта, разработка теоретической концепции тестируемого психического свойства. Вы­явление (с использованием литературы) системы взаимосвязанных ди­агностических конструктов, внутри которой новый диагностический конструкт характеризуется определенными структурно-функциональ­ными связями и отношениями. Прогнозирование результатов корре­ляционных экспериментов по проверке конструктной валидности.

2. Выделение составных частей теоретического конструкта, фор­мулирование системы «эмпирических индикаторов» - операциональ­но однозначных показателей, фиксирующих проявление конструкта в различных поведенческих ситуациях. Конструирование пунктов теста.

3. Формулирование релевантного социально-прагматического критерия для проверки валидности.

4. Планирование и проведение корреляционного исследования (или квазиэксперимента) на специально подобранной выборке испы­туемых, для которых известно значение критериального показателя, а также результаты по родственным психологическим тестам. При необходимости на этих испытуемых проводятся дополнительные те­сты с целью получить возможность корреляционной проверки конст­руктной валидности теста (экспертные оценки в данном случае рас­сматриваются в статусе одной из возможных параллельных процедур получения критериальной или психологической информации). Оцен­ка валидности эмпирических индикаторов.

5. Исследование достоверности результатов (если используется самоотчет и диагностическая ситуация может быть воспринята ис­пытуемыми с настороженностью). Оценка достоверности эмпиричес­ких индикаторов.

6. Отсев пунктов, не удовлетворяющих критериям валидности и достоверности. Измерение надежности для сокращенной шкалы, со­стоящей только из валидных пунктов. Если надежность оказывает­ся невысокой, то психолог снова возвращается к этапу 1 - уточняет теоретические представления.

3.4. ТЕХНОЛОГИЯ СОЗДАНИЯ И АДАПТАЦИИ МЕТОДИК

Рассматривая в предыдущем разделе вопрос о порядке проверки валидности, мы вплотную подошли к вопросу о целостной стратегии создания, эмпирической апробации и внедрения методики в практику.

Создание оригинальной методики или адаптация зарубежной ме­тодики не могут сводиться только к проверке (или перепроверке) от­дельных психометрических свойств - репрезентативности, надежно­сти, валидности, достоверности - в произвольной последовательнос­ти. В одних случаях целесообразно начинать с одного этапа работы, в других - с другого.

В действительности любая реальная ситуация использования те­ста не является ситуацией только «конструирования» или только «применения». Можно без преувеличения сказать, что существует конти­нуум между крайними полюсами:

«конструирование» __________________ «применение»

и каждая ситуация до определенной ступени удалена от обоих полю­сов. Трудно назвать такой случай, когда бы конструирование совер­шенно нового теста начиналось с нуля, «на пустом месте». Также труд­но найти и такие случаи, когда все аспекты тестирования были бы полностью неизменными и воспроизводили бы уже совершенно ис­следованную нормативную ситуацию применения готового теста.

Но все это многообразие ситуаций, всю комбинаторику независи­мых параметров психологи-практики, как правило, пытаются свести к двум-трем типовым ситуациям.

1. Ситуация применения. Тест кем-то разработан (возможно, В: других социокультурных условиях), известны тестовые нормы, полу­ченные на представителях данной языковой культуры (несоответствие выборки стандартизации и выборки применения по половозрастной структуре и профессионально-культурным признакам признается не­существенным).

2. Ситуация адаптации. Тест кем-то разработан – проверены на­дежность и валидность, но отсутствуют тестовые нормы (как правило, отсутствуют вообще для любых представителей данной языковой культуры). Задача адаптации сводится, таким образом, к построению тестовых норм.

3. Ситуация конструирования. Есть концепция психического свой­ства, но нет процедуры его измерения, удовлетворяющей требованиям места, времени, возможностям количественного анализа и ограничениям прочих ресурсов. Надо придумать измерительную процедуру, проверить ее надежности валидность, построить тестовые нормы.

Остановимся прежде всего на вопросах адаптации так называе­мых переводных тестов. Путь быстрого пополнения репертуара ме­тодик за счет множества готовых зарубежных методик кажется мно­гим психологам наиболее экономичным, кратчайшим путем к надеж­ной и валидной психодиагностике. Но ведь если при этом адаптация сводится только к построению нормативного распределения тесто­вых баллов, то это означает, что валидность и надежность адаптированной методики в новых условиях принимаются на веру, а теорети­ческая концепция автора теста и содержание использованных им критериев валидности просто переносятся в наши условия без измене­ний (ведь для любой, в том числе и для невалидной и ненадежной методики, можно получить распределение).

Подобный перенос дает пренебрежимые погрешности только для тестирования относительно элементарных психических свойств (та­ких, как свойства нервной системы, функциональные состояния, сенсомоторные параметры, элементарные когнитивные функции, при­чем с использованием объективных процедур (психофизиологичес­кая регистрация, тесты с «физическими» критериями успеха и т. п.). При тестировании интегральных психических свойств личности и индивидуального сознания (черты, мотивы, установки, самооценка, общие способности, стиль общения, ценностные ориентации, инте­ресы и т. п.), а также при употреблении любых лингвистических средств в самой процедуре тестирования (включая не только форму­лировки задач, вопросов; но и исходную формулировку инструкции к тесту) и использовании культурно-специфических критериев оценки правильности .результата (определения шкального ключа) ограничи­ваться только сбором тестовых норм при адаптации - недопустимо!

Требуется серьезная эмпирическая работа по проверке надежно­сти и валидности в новых социокультурных условиях, работа, факти­чески соответствующая по своему объему созданию оригинальной методики. С этой точки зрения, заимствование зарубежных общедиаг­ностических тестов способностей, черт характера, интересов и т. п. вовсе не оказывается кратчайшим путем к психодиагностике. Этот путь кажется короче только тем, кто сознательно или по неведению пренебрегает принципами психометрики.

Перечислим необходимые этапы эмпирико-статиетической рабо­ты при адаптации многомерного переводного тест-опросника.

1. Анализ внутренней валидности, внутренней согласованности пунктов, из которых состоит тест-опросник. Этот анализ совершенно необходим, если в зарубежной методике он применялся в качестве средства самого конструирования методики. Этот-анализ призван по­казать, что существует некое (еще неясно, какое именно) общее диаг­ностическое свойство, лежащее на пересечении всех эмпирических индикаторов (в центре «пучка» скоррелированных пунктов-векторов). Такой анализ обязателен по отношению ко всем тестовым шкалам, полученным с помощью факторного анализа, например к тест-опросникам EPI Айзенка и 16PF Кеттелла. А вот к опроснику «локус конт­роля» или ко многим основным клиническим шкалам MMPI требова­ние внутренней согласованности применять не обязательно, так как пункты в эти шкалы подбирались по внешнему критерию и не связа­ны в один «пучок». Анализ внутренней согласованности может быть применен и к одномерным, и к многомерным тестам. В первом слу­чае достаточно иметь настольный калькулятор. Для многомерных те­стов необходимо использование специальной компьютерной програм­мы «Анализ пунктов».

По отношению к негомогенным шкалам анализ внутренней со­гласованности позволяет осуществить в снятом виде необходимую проверку информативности пунктов (процент правильных или под­тверждающих ответов должен соответствовать оригинальной автор­ской версии).

2. Проверка устойчивости к перетестированию. Эта проверка со­вершенно необходима при диагностике свойств, по отношению к ко­торым теоретически ожидается инвариантность во времени. Анализ ретестовой надежности может быть (так же как анализ надежности -согласованности) совмещен с исследованием информативности от­дельных пунктов теста, а также, возможно, и устойчивости отдель­ных пунктов. Без сведений о ретестовой надежности психолог не имеет права использовать тест для построения любого элементарного ста­тического экстраполирующего прогноза (см. раздел 3.5).

3. Анализ корреляций с релевантным внешним критерием. Этот этап адаптации совершенно необходим, если тест разрабатывался из­начально как критериально-ориентированный, т. е. отбор пунктов производился на основании их корреляций с каким-то критерием валидности. Например, подобная работа проделана коллективом Ф. Б. Березина для сокращенной модифицированной версии MMPI (Березин Ф. Б. и др., 1976).

4. Проверка или ре стандартизация тестовых норм. Об этом этапе уже говорилось выше. К сожалению, только этот этап работы по адап­тации тестов до недавнего ывремени признавался всеми психолога­ми как необходимый. Но и в этом случае далеко не всегда воспроиз­водилась необходимая статистическая работа по проверке устойчи­вости полученного распределения тестовых баллов к расщеплению выборки (см. раздел 3.1).

5. Специфичный этап для многомерных тестов - проверка вос­производимости структуры отношений между шкалами. Например, для теста Айзенка принципиальна ортогональность, статистическая независимость факторов «экстраверсия - интроверсия» и «нейротизм - стабильность». На воспроизводимости структуры связей шкал между факторами 16PF основывается корректность подсчета вторич­ных факторов (Ямпольский Л. Г., 1981; Мельников В. М., Ямпольский Л. Г., 1985).

Даже беглый взгляд на пять перечисленных этапов позволяет убе­диться в том, что адаптация зарубежных тестов мало чем уступает по объему эмпирико-статистической работы созданию оригинальных ме­тодик. Здесь было бы даже более адекватным использование не тер­мина «адаптация», а выражения «исследование зарубежной методики на отечественной выборке».

Тем не менее не следует понимать сказанное как призыв к пол­ному отказу от работы с зарубежными методиками. Нет, конечно же, такая работа должна проводится интенсивно и планомерно. Особен­но по отношению к тем методикам, которые уже получили между­народное распространение, доказали свою кросскультурную универ­сальность, адаптированы и успешно применяются во многих стра­нах. Создание отечественных эквивалентов международных тестов позволяет использовать международный опыт валидизации, теоре­тического осмысления и практического использования этих тестов. Сравнение результатов, структурно-функциональных характеристик адаптированных зарубежных и отечественных тестов позволит рос­сийским психологам глубже понять, установить на конкретно-эмпи­рическом уровне специфику влияния образа жизни на психологи­ческий склад личности россиян, раскрыть разнообразие историчес­ких и актуальных детерминант, обусловливающих социально полез­ные и социально вредные тенденции в психологической диф­ференциации индивидов в современных условиях, что совершенно необходимо для научного управления процессами воспитания и фор­мирования человека.

Особые задачи ставит перед психологом ситуация «внутрикуль-турного переноса» теста на новую популяцию, отличающуюся от вы­борки стандартизации половозрастными или профессионально-куль­турными особенностями. В этом случае необходимо:

1. Проверить валидность методики в тмо случае, если методи­ка чувствительна по своему содержанию к профессиональной или региональной специфике (могут ли отвечать пенсионеры, или школьники, или жители отдаленных регионов на вопросы, подра­зумевающие типичные ситуации из жизни студента, обучающего­ся в крупном городе европейской части России?). Для этого надо выбрать по возможности максимально экономичную процедуру проверки валидности. Размеры выборки в эксперименте по про­верке валидности должны быть такими, чтобы можно было наде­яться на получение статистических значимых связей между тестовым показателем и критерием валидности (это, как правило, не менее 30 испытуемых).

Если результаты проверки валидности оказываются неудовлетво­рительными (коэффициент корреляции явно ниже 0,5, и дальнейшее наращивание выборки все равно не оправдает применение .теста со столь низким показателем валидности), то по собранным результатам следует произвести простейший анализ пунктов: посмотреть, не ока­зались ли некоторые пункты явно неинформативными (все испытуе­мые отвечают одинаково), не оказались ли некоторые вопросы явно бессмысленными или слишком «прямыми», социально значимыми в данной ситуации. Не исключено, что при исключении неудачных пун­ктов из подсчета тестового балла (после приравнивания С=0).,искомая валидность будет обнаружена.

В отсутствие доступного внешнего критерия необходимо прибегнуть к проверке внутренней валидности, консистентности методики.

2. Проверить соответствия тестовых норм. Только после получения позитивного результата при проверке валидности целесооб­разно расширять выборку и реконструировать эмпирическое распределение тестовых баллов (см. раздел 3.1). Квантили этого распреде­ления необходимо сравнить с квантилями нормативного распреде­ления; если расхождения оказываются пренебрежимыми (не превышают ошибку измерения), то, можно принять вывод о приложимости к данной популяции универсальных тестовых норм. Но на к практике чаще возникают значимые отличия (оценка близости двух распределений производится по формуле (3.1.15) на с. 9.6). В этом случае психолог должен построить так называемые частные тесто­вые нормы, причем не только для использования в собственной диагностической практике, но и для пополнения информационно-ме­тодического банка данных отечественной психодиагностики (копию таблицы распределения тестовых баллов психолог должен послать в тот диагностический методический центр, с которым он поддер­живает методические связи - получает методические материалы, проходит переподготовку и т. п.).

Подчеркнем, что абсолютное большинство ситуаций, которые обычно расцениваются как ситуации «применения», на самом деле являются ситуациями более или менее серьезного «внутрикультурного переноса». Именно эти обстоятельства предопределяют высокий уровень требований к психометрической подготовке психологов-психодиагностов (см. раздел 3.6).

При создании методики, как это уже было сказано в предыдущем разделе, решающее значение имеют методологическая ориентация и статус психолога.

Под статусом в данном случае понимаются существенные раз­личия в нормативных (закрепленных в должностных инструкциях) требованиях к продукту деятельности психолога, работающего в ис­следовательском учреждении, и психолога, работающего в практи­ческом учреждении. Если в первом случае психолог имеет право считать своим «конечным продуктом» внутрипсихологическую валидизацию сконструированной методики, то во втором случае он, как правило, обязан обеспечить практическую эффективность сво­ей психодиагностической программы - указать на статистически значимую связь результатов диагностики с величиной какого-то со­циально ценного показателя - критерия, а затем построить на осно­ве этой связи психологическую концепцию «вмешательства» (адми­нистративного или психологического воздействия на ситуацию с целью ее изменения в желаемом направлении – в сторону максими­зации данного показателя).

Указанные изначальные различия в статусах психолога-иссле­дователя и психолога-практика предопределяют оправданные раз­личия в стратегии конструирования тестов и тестовых батарей. Для психолога-исследователя главная ценность - это теоретическая обо­снованность и эмпирическая однозначность диагностического кон­структа, которой он достигает с помощью оправданной ориентации на конструктную валидизацию. У исследователя хватает ресурсов для того, чтобы обеспечить множественность разнообразных по сво­ему статусу критериев валидности - от субъективных оценок валидности включенных наблюдателей (L-данные по Кеттеллу) до экспе­риментального моделирования реальных ситуаций проявления из­меряемого свойства (Г-данные по Кеттеллу, см. также: Мельников В. М., Ямпольский Л. Г., 1985). Для психолога-практика главная ценность - это эффективность, пусть даже она будет достигнута с помощью теоретически эклектичного инструмента - эмпирическо­го средства, не имеющего соответствующего научно строгого кон­структа.

Появление и размножение прагматических тестов, очевидно, обус­ловлено действием объективного социально-исторического механиз­ма, который можно было бы кратко назвать «опережающим запросом практики». Этого феномена не было бы, если бы все запросы практи­ки можно было заранее предвидеть и рационально спланировать, под­готавливая релевантные научно обоснованные диагностические про­цедуры. Но такое предвидение всегда удается осуществить лишь в определенной мере - реальная практика тем и отличается от дедук­тивного движения в плоскости абстракций, что всегда приводит к стол­кновению с новыми и неожиданными явлениями, что обусловливает и появление неожиданных запросов.

Большинство ценных прагматических тестов с исторической не­избежностью становятся предметом для изучения со стороны психо­логов-исследователей, апостериорно реконструирующих научную концепцию валидности этих тестов, что значительно улучшает их ха­рактеристики и адекватизирует сферу применения.

Психодиагностика как специфический институт, реализованный в форме управляющего кольца «наука - практика - наука - практи­ка...», достигнет оптимальных режимов в своем функционировании, если любые попытки конструирования и применения любых тестов будут тщательно документироваться, будут доступны для повторения в любом звене (исследовательском или практическом) психологичес­кой службы. При обеспечении эффективной информационной базы, оперативных форм информационной связи между звеньями этой сис­темы (как методологическими, так и практическими) всякое практи­ческое применение тестов станет одновременно и работой по созда­нию новых методик.

3.5. ПРОГНОЗИРОВАНИЕ И РАСПОЗНАВАНИЕ ОБРАЗОВ

Кардинальное значение для психодиагностики имеет проблема прогнозирования. Существует точка зрения, разделяющая психоди­агностику и так называемую психопрогностику (Забродин Ю. М., 1984). Это указывает на самостоятельное значение проблемы прогно­зирования.

В действительности, любая психодиагностика служит прогнози­рованию - на больших или меньших отрезках времени. То, что назы­вается диагностикой текущего состояния объекта, имеет следующий смысл. В технике сконструированный агрегат подвергают стендовым испытаниям. Полученные результаты приписывают текущему состо­янию объекта, имея в виду, что выключенный агрегат до его эксплуа­тации в реальных условиях уже не будет изменяться сколь-нибудь су­щественным образом. При этом подразумевается, что именно при работе включенного агрегата может измениться его состояние, в ча­стности, выход из допустимого режима.

В психологии дело, конечно же, обстоит по-другому. И перенос подразумеваемых, имплицитных представлений из технической ди­агностики в психодиагностику неправомерен, как, впрочем, непра­вомерен такой перенос уже и по отношению к медико-биологичес­кой диагностике человеческого организма. Организм человека, его психика - это не агрегат, который произвольно можно выключить на период от тестирования до реального испытания. Все это время человек продолжает жить, активно взаимодействовать со средой. Даже в изоляции, даже во сне мозг человека проделывает большую работу, переводя полученную информацию из одних отделов памя­ти в другие (Касаткин В. Н., 1967). Все это означает, что принцип статистической экстраполяции результатов психодиагностического измерения нельзя считать оправданным без проведения специаль­ных проверок.

Когда психолог по результатам тестирования регистрирует у не­которого индивида А показатель Ха , а у некоторого индивида В пока­затель Хb , так что Хa > Хb , то из этого вовсе не следует автоматичес­ки, что соотношение Хa > Хb сохранится в течение следующей недели, месяца, года. Для принятия стратегии экстраполяционного статистического прогноза требуется предварительно произвести эмпиричес­кое измерение надежности - устойчивости (ретестовой надежности) на заданном промежутке времени.

При этом важна не только длина отрезка времени между двумя изме­рениями, но и его заполненность теми или иными значимыми для инди­вида событиями. Приведем простой пример. Организовано психологи­ческое обследование абитуриентов вуза. Психологи пытаются измерить уровень интереса поступающих к избранной специальности Однако они применяют «лобовые» методики опроса, не защищенные от преднаме­ренной фальсификации (абитуриенты сознательно, или даже бессозна­тельно, будут искажать результаты в сторону повышенного интереса - чтобы произвести благоприятное впечатление). Фальсификация здесь - только один из возможных источников некорректности статистического прогноза. Для эмпирического измерения силы этого артефакта не обяза­тельно проводить повторное измерение через несколько лет. Имеет смысл провести повторное обследование по той же методике всех студентов, сразу же после их зачисления на первый курс. Если возникнет слишком много перестановок типа Ха < Хb , то ранговая корреляция «тест -ретест» окажется слишком слабой, и это доказывает неправомерность использо­вания «лобовой» методики для статического прогноза. Другой возмож­ный источник нестабильности ранговой шкалы (порядковой шкалы тес­та) обусловлен в данном примере зависимостью уровня интереса к пред­метной области от уровня знаний о предмете. В ходе обучения в вузе студенты приобретают более детальные знания о предмете, о своей ус­пешности в освоении специальности, и от этого уровень интереса может существенно изменяться. Конечно, этот фактор - в отличие от фактора фальсификации - действует на более длительных промежутках време­ни. И здесь опять же требуются специальные измерения ретестовой ус­тойчивости для применения статического прогноза.

Приведенный выше пример показывает, что в некоторых случаях целесообразно начинать решать проблемы психопрогностики без вся­кого привлечения внешней по отношению к тесту критериальной ин­формации, т. е. средствами проверки надежности, но не средствами проверки валидности. Если уже таким способом будет получен отри­цательный результат, то заведомо будет получен и для измерения ва­лидности статического прогноза (вспомним основной принцип: валидность методики не превышает ее надежность).

Однако надежность лишь необходимое, но, естественно, недоста­точное условие прогностической валидности. Можно убедиться в высо­кой устойчивости тестового показателя на длительных промежутках вре­мени, но из этого вовсе не следует, что будут получены значимые линей­ные корреляции этого показателя с требуемым критерием валидности -эффективности.- корреляции, оправдывающие статический прогноз.

Как правило, на основе диагностики принимаются решения, кото­рые соотносятся между собой как события на шкале наименований или на шкале порядка. Каким образом учитываются сегодня при приеме в вуз показатели школьной успеваемости абитуриентов? Существуют три варианта, три градации, соотносимые друг с другом по шкале порядка: выпускникам школы - медалистам предоставляются льготные условия (при успехе на первом экзамене от остальных вступительных экзаме­нов медалист освобождается), лица с удовлетворительным средним баллом допускаются к конкурсным вступительным экзаменам и сдают все экзамены; наконец, лица с неудовлетворительным средним баллом могут вообще не допускаться к вступительным экзаменам. На этом при­мере видно, что средний балл аттестата используется как некоторый показатель «теста», в соответствии с которым абитуриентов разделяют на три категории, по отношению к которым неявно применяется «по­рядковый» прогноз: предполагается, что медалисты будут успешнее обычных выпускников школ, а обычные выпускники - успешнее тех, кто учился в школе очень слабо.

«Порядковый» прогноз сохраняет свою эффективность не только в статических условиях, но и в условиях таких динамических измене­ний объектов прогнозирования, при которых порядковая структура оказывается неизменной. Предположим, что в: ходе обучения в вузе все студенты по мере более глубокого ознакомления с предметом ис­пытывают нарастающий интерес к своей специальности, но если по­рядковая структура сохраняется (Ха продолжает превышать Xb , несмот­ря на то что Xb приближается к Ха ), то «порядковый» прогноз все рав­но остается корректным.

Линейные и порядковые прогностические стратегии на практике применяются не к одномерным, а к многомерным данным. Среди математических моделей прогнозирования до сих пор наибольшей популярностью пользуются относительно простые (а иногда и нео­правданно упрощенные) регрессионные модели.

При этом для многомерного случая задача психометриста сводится к построению уравнения множественной регрессии:

Y= ß1 X1 + ß2 X2 …..+ ßi Xi + ßk Xk (3.5.1)

где Y- прогнозируемая переменная (критерий прогностической ва-лидности);

Xi - значение i -го тестового показателя из рассматриваемой бата­реи тестовых показателей;

ßi , - значение весового коэффициента, указывающего, на сколько (в единицах стандартных отклонений) изменяется прогнозируемая переменная при изменении тестового показателя Xi .

Для составления указанного уравнения требуется произвести «уп­реждающее» измерение тестовых показателей по отношению к критериальному показателю Y, измерение которого производится по ис­течении некоторого отрезка времени T, называемого в прогнозиро­вании периодом упреждения.

Общая эффективность прогноза на основе регрессионного урав­нения оценивается с помощью подсчета коэффициента множествен­ной корреляции R2 (Суходольский Г. В., 1972) и последующей оценки его значимости по критерию Фишера:

(3.5.2)

где - эмпирическое значение статистики Фишера со степенями сво­боды V1 = k и У2 = N-k;

N— количество индивидов;

k - количество тестовых показателей.

Не следует забывать, что основой применения этой модели про­гноза является экстраполяция - предположение о том, что на новом отрезке времени T’ будут действовать те же тенденции связи пере­менных, что и на отрезке T, на котором прежде измерялись весовые коэффициенты ßi . Не следует также забывать, что корректность про­гноза обусловлена периодом упреждения: для больших (или меньших) T использование уравнения (3.5.1) может оказаться некорректным.

Прогностические возможности указанного метода ограничены однократностью измерения тестовых показателей .X1 , Х2 ..., Xk . В силу однократности измерения этот метод оказывается эффективным опять-таки только по отношению к самым универсальным и статическим показателям (таким, например, как интегральные свойства темпера­мента или нервной системы), обеспечивающим очень грубый, веро­ятностный, приближенный прогноз.

В некоторых случаях эффективность этого метода может суще­ственно повыситься, если использовать хотя бы двукратное (с неболь­шим интервалом в две-три недели) измерение системы показателей Х1 Х2 ,..., Xk . Уже таким способом можно, например, учесть вклад фак­тора «усвоение знаний» в прогнозирование мотивационной вовлечен­ности (уровня интереса) студента в свою специальность. Повторное измерение (например, через месяц после начала обучения в вузе) по­зволяет выявить, в каком направлении действует фактор «усвоение знаний» в своем влиянии на уровень интереса данного студента: мо­жет оказаться, что в результате разнонаправленного действия этого фактора немало пар студентов уже через месяц поменяются местами в ранговом ряду по уровню интереса (Ха < Хb ). В этом случае в урав­нение (3.5.1) целесообразно ввести не статический показатель Xi a простейший динамический показатель Хi , = . Кроме того, не исключена возможность одновременного использования в уравнении (3.5.1) и статических Xi . и динамических Хi . показателей; тогда разра­ботанная модель прогноза будет учитывать как достигнутый уровень (экстраполировать статику), так и намечающиеся тенденции (экстра­полировать тенденции).

Приведем еще один содержательный пример. Многочисленные эмпирические исследования по прогнозированию супружеской со­вместимости (Обозов Н. Н., 1979) показали неудовлетворительно низкий уровень надежности прогноза на основе таких показателей, как однократно измеренный уровень сходства (темперамента, моти­вов, интересов, ценностных ориентации) или взаимодополнитель­ности психических свойств будущих супругов. Но эту надежность можно существенно повысить, если ввести в уравнение (3.5.1) по­казатели типа Х.. В данном случае содержательно-психологичес­кий смысл этих показателей будет заключаться в следующем: они указывают на то, в каком направлении действует на уровень сход­ства (совместимости) опыт взаимодействия будущих супругов. По­тенциально несовместимые супруги в ходе взаимодействия (за период помолвки), как правило, дивергируют в своих показателях (на­пример, имеющиеся незначительные акцентуации характера взаим­но усиливаются). И наоборот, потенциально совместимые супруги могут очень быстро конвергировать: оказывается достаточным про­ведение одного-двух обсуждений с участием психолога по спорным вопросам, чтобы сблизиться в представлениях о желаемом семей­ном укладе и образе жизни.

Более сложные математические методы прогнозирования (напри­мер, учитывающие циклическую динамику объектов) пока еще редко используются в психодиагностике, так как требуют частых многократ­ных измерений системы тестовых показателей, что оказывается не­возможным по чисто практическим причинам. Тем не менее уже се­годня можно твердо констатировать недостаточность линейных мо­делей прогнозирования. Для ознакомления с рядом других подходов к прогнозированию мы рекомендуем психологам обратиться к руко­водству «Рабочая книга по прогнозированию» (М., 1982).

Остановимся теперь более подробно на подходе, который ныне представляет собой реальную альтернативу ограниченным линей­ным статистическим моделям и позволяет строить эффективный прогноз для более сложных зависимостей между прогнозируемыми (зависимыми) и прогнозирующими (независимыми) переменными. Этот подход, по традиции, принято называть распознаванием обра­зов, так как разработка его математического аппарата была во мно­гом стимулирована инженерными задачами конструирования искус­ственных систем зрения, слуха, других органов чувств (Распознава­ние образов. М., 1970).

В психодиагностике роль «элементарных сенсорных данных» выполняют первичные тестовые показатели X1 Х2 ,..., Xk , а роль «об­раза» (выходного сигнала системы) - соответствующая диагностичес­кая категория. Таким образом, по существу, распознавание образов[19] и есть диагностика в широком смысле.

Поясним специфику подхода на простейшем схематическом при­мере. Пусть Ру -вероятность такого типового критерия оценки студен­тов, как успеваемость, Х1 - уровень интереса к специальности, выяв­ленный у абитуриента, Х2 - уровень его знаний о специальности.

На рис. 16 точки X1 = 0 и Х2 = 0 - медианные значения соответ­ствующих тестовых показателей. В данном упрощенном примере в статусе «образа» выступает каждый из четырех квадрантов диагнос­тического пространства. Для предсказания Ру мы не можем постро­ить линейной комбинации Х1 и Х2 , какие бы коэффициенты ß1 , и ß2 мы ни взяли. Для предсказания Рy мы должны зафиксировать попадание индивида в заданную область пространства параметров. «Образ», или диагностическая категория, и есть на геометрическом языке опреде­ленная область в пространстве параметров.

Рис. 16. Зависимость вероятности критериального события р и диагностических параметров X 1 и Х2

С точки зрения распознавания образов, предварительная задача диагностики (предваряющая практические задачи) – определить границы диагностических категорий - областей в пространстве парамет­ров, которым эмпирически корректно могут быть приписаны некоторые пороговые (качественно специфичные) значения прогнозируемого критериального показателя. Это задача построения «разделяющего правила» (или «решающего правила»). Точность такого разделения и предопределяет прогностическую валидность методики на данной совокупности испытуемых в данной диагностической ситуации.

Репрезентативность выборки при этом определяется степенью изменения точности разделения при увеличении совокупности обсле­дованных. Влияние того или иного параметра на точность разделе­ния определяет «вес», с которым входит данный параметр в задачу диагностики.

Построение формальной процедуры разделения может произво­диться по-разному. В простейшем случае - это сравнение тестового показателя с некоторым порогом. В более сложных случаях применя­ются методы дискриминантного анализа, позволяющие описывать «разделяющие правила» (границы диагностических областей в про­странстве параметров) в виде сложных функций сразу от нескольких параметров.

Применение определенного метода для решения задачи построе­ния системы диагностических категорий определяется несколькими факторами: во-первых, это соответствие допущений, положенных в основу алгоритма, содержательным представлениям о психологичес­кой типологии индивидов в рамках рассматриваемой системы психо­диагностических параметров; во-вторых, это степень полноты имею­щейся информации для эффективной «остановки» алгоритма, обес­печивающей оптимальное решение задачи за приемлемое время.

Под полнотой информации здесь, имеется в виду наличие доста­точно многочисленных групп индивидов, четко и однозначно класси­фицированных по заданной системе критериев. В этом случае пост­роение решающего правила сводится к применению какого-либо ал­горитма автоматической классификации, приспособленного к работе с заданными классами. Если же критериальные классы представлены неполно - всего несколькими представителями, для которых при этом не всегда известны все значения необходимых параметров, - то воз­никает ситуация, требующая применения так называемых эвристи­ческих алгоритмов (более подробно о применяемых алгоритмах клас­сификации см. кн.: Типология и классификация в социологических исследованиях. М., 1982).

Остановимся на одном из методов распознавания, получившем применение в психодиагностике, — на семействе алгоритмов вычис­ления оценок (АВО), предложенном Ю. И. Журавлевым и его учени­ками (1978).

Основную задачу распознавания образов можно сформулировать как задачу отнесения объекта 5 к одному или нескольким классам К1 К2 ,..., Кi на основе информации о классах I (K1 ), (К2 ),..., Ii ), ин­формации об объекте I (S) и предположения о близости объекта к клас­су. Другими словами, задачу распознавания можно сформулировать как задачу определения того, обладает ли объект определенными свой­ствами.

В основе АВО лежит принцип частичной прецедентности: бли­зость объекта к классу тем больше, чем больше частей в его описании «похожи» на соответствующие части в описаниях' объектов, чья принадлежность классу известна. Например, в одном из вариантов АВО (Зеличенко А. И., 1982) функция близости объекта S к классу К опре­деляется так:

(3.5.3)

где - i -й объект, принадлежность которого к классу К уже известна;

ai (S) - i -й элемент (параметр) в описании объекта;

P1 - его вес;

εj - i -й порог.

После того как вычислены Г(S1 K1 ,), ... , Г(S1 K1 ,) на основании некоторого решающего правила (зависящего от вектора параметров , принимается решение о принадлежности объекта к одному или нескольким классам К1 , ..., К1 В задачах психодиагностики S- это испытуемый.

Таким образом, каждый вариант АВО определяется набором зна­чений параметров. В нашем случае- это векторы , . Если информация об объекте S представлена в виде I(S) = (а1, ..., а2 ), то элемент вектора опорных множеств ωj (S) = аi , a εj -j -й порог.

В качестве примера решающего правила можно привести следу­ющее (линейное пороговое решающее правило):

объект S принадлежит к классу Kt если

(3.5.4)

объект S не принадлежит к классу Kt если

(3.5.5)

в остальных случаях -отказ от распознавания принадлежности объек­та S к классу Kt .

В работе алгоритмов распознавания вообще и АВО в частности мож­но выделить два этапа: обучение и собственно распознавание. На этапе обучения, как уже говорилось, происходит настройка алгоритма, т. е. выбор таких его параметров, которые обеспечивают оптимальное в нег котором смысле распознавание объектов обучающей выборки (объек­тов, принадлежность которых к классам К1 , ... ,Ki , известна). На этапе собственно распознавания происходит отнесение к классам K1 ,..., Кi , тех объектов, принадлежность которых к классам априорно неизвестна.

Точность распознавания на этапе обучения измеряется полнотой и адекватностью распознавания эталонных объектов. Наряду с понятием «точность» (абсолютная отделимость) иногда удобно использовать по­нятие относительной отделимости объектов обучающей выборки, при­надлежащих к различным классам. В случае, когда распознавание ведется для двух классов (например, в профориентации - для дифференци­ального прогноза успешности оптанта в одной из двух профессиональ­ных областей), относительную отделимость можно определить как

(3.5.6)

где X - точность при обучении (выраженная в процентах), a -минимальная возможная точность обучения (совпадает с долей объек­тов в наибольшем классе от общего объема обучающей выборки). На этапе собственно распознавания точность характеризует главным об­разом репрезентативность обучающей выборки (выборки валидизации). Чем выше репрезентативность, тем больше совпадают показа­теле точности на этапах обучения и собственно распознавания.

Использование АВО кроме решения задачи распознавания позволяет получить следующую информацию:

1. Информационные веса отдельных элементов (параметров) опи­сания объектов. Эти веса измеряются через изменение точности рас­познавания при исключении соответствующих параметров из описа­ния эталонных объектов:

(3.5.7)

где X - точность распознавания при Рj = 1; X ( ) - точность распозна­вания при Р. = 0, а а - нормирующий множитель. Информационные веса интерпретируются как мера прогностической важности параметров.

2. Оптимальные значения порогов , т. е. значения , обеспечи­вающие наивысшую точность распознавания. Эти значения порогов в нашем случае можно .интерпретировать как чувствительность мето­дики; εj - своего рода дифференциальный порог на шкале тестового показателя a j определяющий переход индивида из одной диагности­ческой категории в другую. Пусть на этапе разработки теста (тесто­вой батареи) была обследована группа из К человек, про которых из­вестно, что k1 из них относится к одному классу, а К2 - к другому, К = К1 + К2 . Выбрав случайным образом из этой группы М (М<<К) многомерных описаний, проводим на них процедуру обучения алго­ритма. Точность обучения характеризует валидность теста. После это­го применяем процедуру собственно распознавания (по выработан­ному решающему правилу) для остальных К-М описаний. В резуль­тате этой процедуры мы определяем принадлежность респондентов (испытуемых) к этим классам. Сравнивая полученные результаты с эталонными данными о принадлежности испытуемых к классам, мы определяем точность самого распознавания. Если эта точность близ­ка к точности обучения, то наша пилотажная выборка объемом М может быть признана репрезентативной для обучения. Теперь можно переходить к задаче определения информационных весов.

* * *

Для эффективного использования алгоритмов распознавания по отношению к многомерным тестовым системам (при K >3), как пра­вило, требуется использование компьютера.

При решении задач небольших размерностей (по количеству па­раметров) иногда психолог может быстрее найти решающее прави­ло, применяя собственные способности зрительной системы (очень мощные) к визуально-геометрической группировке объектов. В про­странстве параметров диагностические, классы выглядят как «сгуще­ния», некие «облака» из точек, изображающих испытуемых. В этом случае при наличии априорной информации о принадлежности ин­дивидов к классам удобно изображать точки из различных классов разными цветами (хуже - квадратиками, кружками, треугольниками). В этом случае «решающее правило» легко «увидеть» как некую вооб­ражаемую линию (прямую или кривую), разделяющую точки разного цвета (рис. 17). Точность диагностики в данном случае можно оценить по количеству точек, попавших при данном решающем правиле в «чужую» половину пространства параметров.

Рис.17. Разделение двух классов объектов (изображены кружками и треугольниками) в пространстве двух параметров X 1 , и Х2

Точность правила, изображенного на рис. 17, равна:

 

 

 

10

2

3