- Что такое валидность теста
- Валидность теста конструктная
- Валидность теста по содержанию
- Валидность теста прогностическая
- Валидность эксперимента внутренняя
- Способы оценки надежности теста
- Краткая характеристика валидности тестов
- Основные требования к критериям
- Сущность понятия «валидность»
- Детали
- Что такое валидность в психологии
- Что такое валидность: методики
- Внешние критерии
- Что такое валидный код на сайте?
- Понятный код — меньше хлопот
- Как проверить валидность кода?
- Валидный код и Google:
- Валидный код и поисковое продвижение
- Соотношение надежности и валидности психологических тестов
- Пример нарушения внутренней валидности
- Способы установления валидности методики
- Внутренняя валидность психологического исследования
- Общие сведения
- Психометрические свойства методик психодиагностики
- Какие значения может принимать валидность, примеры
- Виды валидности методов исследования
- Виды валидности
- Валидность «по содержанию»
- Конвергентная и дискриминантная валидность
- Типы валидности
- Другие типы валидности
- Уровни проверки валидности
- Создание инструментов
- Соблюдение внешней валидности
- Связанные понятия
- Упоминания в литературе
- Связанные понятия (продолжение)
- Тестовые нормы. Корреляция качественных признаков
- Угрожающие факторы
- Характерные особенности эмпирической валидности
- Определение прагматической валидизации
- Понятие проспективной, конструктивной и истинной валидности теста
- Специфика и задачи психологического эксперимента
- Итог
- Валидация и верификация — что это простыми словами?
- Чем отличается валидация от верификации?
- Что такое валидация простыми словами
- Зачем нужна валидация данных?
- Когда требуется валидация
- Что может быть объектом валидации
- Валидация оборудования
- Валидация процесса
- Валидация продукта
- Валидация в системе менеджмента качества (соответствие ISO)
- Валидация пользователя
- Другие объекты валидации
- Виды валидации
- Перспективная валидация
- Сопутствующая валидация
- Ретроспективная валидация (ревалидация)
- Повторная валидация
- Примеры валидации и верификации в разных сферах.
- Пример из области медицины
- Пример из области производства
- Пример из области IT
- Пример из сферы интернета
- Пример из законодательной области
- Кто проводит валидацию
- Где и когда выполнять валидацию данных?
- Как выполнять валидацию данных?
- Тестирование валидаторов
- Этапы валидации
- Практический совет
- Часто задаваемые вопросы
Что такое валидность теста
Психологический тест – разновидность психодиагностических методик. Тест пользуется наибольшей популярностью среди экспериментаторов из-за простоты применения. В комплектацию исследователя входит стимульный материал, бланки ответов и инструкции.
Тест-опросники могут исследовать такие психические характеристики испытуемого, как стрессоустойчивость, интеллект, мотивация и толерантность. Вопросы формулируются с учетом специфики целевых выборок и цели исследования.
Они могут быть закрытыми – испытуемому предлагается выбрать одно из утверждений; открытыми – испытуемый должен сам ответить на вопрос или прокомментировать утверждение; косвенными – являющимися общеизвестными фактами или мнением; прямыми – которые непосредственно оппонируют мнению индивида.
Валидность теста обеспечивает достоверность полученных с его помощью данных о психических явлениях. Без экспериментально доказанной высокой валидности тест нельзя считать эффективным. Если выполнение отдельного задания или самого теста фиксирует измеряемое психическое явление, то валидность принимает высокие значение.
Это значит, что тест валиден и надежен, так как исключены воздействия на испытуемого. Валидность теста можно подтвердить, не обладая глубочайшими познаниями в психологии.
Например, студенты 1 курса могут проверить тест с помощью испытуемых. Экспертам предлагается оценить понятность формулировок вопросов или утверждений, исходя из личного жизненного опыта. На основе полученных данных можно говорить о валидности опросника.
Валидность теста конструктная
критерий качества теста, используемый при измерении какого-либо сложного психического феномена, имеющего иерархическую структуру, измерить который из-за этого одним актом тестирования невозможно. Так, психодиагностика интеллекта невозможна без предварительного определения понятия “интеллект”, его структуры. Степень соответсвия нашего предварительного понимания и определения интеллекта реальной возможности конкретного теста, степень соответствия структуры интеллеткта структуре теста и есть в.т.к. Она нацелена на определение точности измерения сложных, устойчивых типов поведения, качеств личности, психических явлений.
Валидность теста по содержанию
критерий качества теста, используемый при вывяснении соответствия его области измеряемых психических явлений. В.т.к. показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров. Если, например, нужно проверить с помощью теста математическую подготовку абитуриента вуза, то в предлагаемый тест должны быть включены математические задания, для решения которых необходимы знания по всем разделам математики, изучаемым в средней школе. Таким образом, степень соответствия структуры данного теста структуре программы математических дисциплин, изучаемых в школе, и является валидностью данного теста по содержанию. Естественно, что для обследования лиц, окончивших вузы, предназначаются тесты с иной вялидностью по содержанию.
Валидность теста прогностическая
критерий качества теста, используемый при предсказании характера развития измеряемого параметра в будущем. Одним из самых существенных недостатков подобных тестов является то, что они не учитывают неравномерность развития измеряемого параметра у различных людей в будущем. Данный вид валидности является особо ценным с практической точки зрения.
Валидность эксперимента внутренняя
критерий качества эксперимента, используемый при выяснении степени достоверности выявленной в результате эксперимента тенденции, закономерности, характерной для данной единицы множества или для всего подмножества элементов генеральной совокупности. Допустим, исследуя степень влияния освещенности на эффективность производственной деятельности ткачих, психологи обнаружили статистическую зависимость их эффективности работы от частоты смены освещения. Что является основным фактором повышения эффективности деятельности: смена освещения, внимание экспериментаторов, особое поведение руководителей в период эксперимента или другие факторы? В данном случае психологи пришли к выводу: появление молодых мужчин-исследователй в цехе, где работали женщины, и послужило причиной повышения производительности их труда. Но ведь могла быть и принята гипотеза о росте производительности ткацкого труда в зависимости от смены освещенности. В.э.в. показывает в какой степени независимая переменная (производительность труда) связана с зависимой (освещенность). Строго научное проведение психологического эксперимента предполагает определение его валидности.
Способы оценки надежности теста
При определении надежности теста могут быть использованы следующие методики.
Метод повторного тестирования является одним из самых распространенных. Он позволяет установить степень корреляции между результатами исследований, а также временем, в которое они были проведены. Данная методика отличается простотой и эффективностью. Тем не менее у испытуемых, как правило, повторные исследования вызывают раздражение и негативные реакции.
Метод проверки внутренней согласованности не берет во внимание постоянство получаемых при повторном исследовании результатов. Он устанавливает взаимосвязь ответов, которые были даны в рамках одного эксперимента. Вопросы теста делятся на два перечня (по определенному принципу), после чего рассчитывается коэффициент корреляции между результатами.
Метод эквивалентных форм заключается в использовании двух или более тестов с разными формулировками заданий, но с одинаковой сутью, формой и степенью сложности выполнения. О надежности теста свидетельствуют одинаковые или приближенные результаты, которые были получены с использованием одного и того же измерительного прибора или вычислительной формулы. Если же итоги сильно расходятся, то, скорее всего, они были искажены намеренно или же испытуемый не очень ответственно подошел к процессу опроса.
Краткая характеристика валидности тестов
Валидность результата теста является соответствием измеряемому признаку.
Валидность теста не применяется в статистических процедурах. Их (процедуры) можно использовать для доказательства, что разрабатываемая процедура психологических измерений имеет достаточную валидность. Они оценивают эмпирическую валидность.
Взаимосвязь между эмпирической и содержательной валидностью схожа с взаимосвязью статистической и экспериментальной гипотезами. Так как первые описывают причинно-следственные связи между фактом и явлением в эксперименте, а вторые – вероятную оценку результата, которая является базой для решения реальности. То содержательная валидность устанавливает связь между результатом теста и реальностью, а статистическая – содержит оценку валидизации эксперимента, которая считается инструментом для принятия решения.
Отсюда следует, что содержательная сторона валидизации отличается от понятия надежность, а эмпирическая сторона совпадает. Но сама по себе валидизация тестирования предполагает надежность психодиагностических методов. Высокая степень надежности не гарантия такой же валидизации. Но при этом снижение надежности тестирование ведет к снижению валидизации.
Основные требования к критериям
Внешние критерии, которые влияют на показатель валидности теста, должны отвечать следующим основным требованиям:
- соответствие именно той сфере, в которой проводится исследование, релевантность, а также смысловая связь с диагностической моделью;
- отсутствие каких-либо помех или резких разрывов в выборке (суть состоит в том, что все участники эксперимента должны соответствовать заранее установленным параметрам и находиться в схожих условиях);
- исследуемый параметр должен быть надежным, постоянным и не подвергаться резким перепадам.
Сущность понятия «валидность»
Валидность – это комплексная характеристика методики, которая включает сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.
Данное понятие относится к тому, что эта методика измеряет и как хорошо она это делает. Те тесты, которые не обладают валидностью, для практического использования не годятся.
Уровень валидности – это её коэффициент.
На валидность теста оказывают влияние систематические факторы, привносящие в результаты искажения. К ним относятся другие психические свойства, мешающие в результатах теста проявиться тому свойству, на которое направлен тест.
Например, необходимо измерить потенциал обученности, но время исполнения строго ограничено, и допущенную ошибку исправить невозможно. Таким образом, искомое психическое свойство смешается с другим – «стрессоустойчивостью». Те, у кого стрессоустойчивость высокая, выполнять тест будут лучше. Здесь проявляется эффект систематического искажения. Отсюда, единого и универсального подхода к определению валидности не существует.
Исходя из того, какая сторона валидности будет рассматриваться, будут использоваться и соответствующие способы доказательства.
Методика имеет столько валидностей, сколько существует критериев.
В первом понимании валидность относится к самой методике – это валидность измерительного инструмента, а проверка получила название теоретической валидизации. Второе понимание относится уже не столько к методике, сколько к цели её использования – это прагматическая валидизация.
Детали
Говорят, что выводы обладают внутренней достоверностью, если причинно-следственная связь между двумя переменными правильно продемонстрирована. Обоснованный причинно-следственный вывод может быть сделан при соблюдении трех критериев:
- «причина» предшествует «следствию» во времени (приоритет во времени),
- “причина” и “следствие” имеют тенденцию происходить вместе (ковариация), и
- нет никаких правдоподобных альтернативных объяснений наблюдаемой ковариации (непредсказуемости).
В условиях научных экспериментов исследователи часто изменяют состояние одной переменной ( независимой переменной ), чтобы увидеть, какое влияние она оказывает на вторую переменную ( зависимую переменную ). Например, исследователь может манипулировать дозировкой определенного лекарства между разными группами людей, чтобы увидеть, какое влияние он оказывает на здоровье. В этом примере исследователь хочет сделать причинно-следственный вывод, а именно, что различные дозы препарата могут быть ответственны за наблюдаемые изменения или различия. Когда исследователь может уверенно отнести наблюдаемые изменения или различия в зависимой переменной к независимой переменной (то есть, когда исследователь наблюдает связь между этими переменными и может исключить другие объяснения или конкурирующие гипотезы ), тогда говорят, что причинный вывод быть внутренне действительным.
Однако во многих случаях размер эффектов, обнаруженных в зависимой переменной, может зависеть не только от
- вариации независимой переменной,
- мощность инструментов и статистические процедуры , используемые для измерения и обнаружения эффектов, и
- выбор статистических методов
Скорее, ряд неконтролируемых (или неконтролируемых) переменных или обстоятельств может привести к дополнительным или альтернативным объяснениям (а) обнаруженных эффектов и / или (b) величины обнаруженных эффектов. Следовательно, внутренняя валидность больше зависит от степени, чем от «либо-либо», и именно поэтому исследовательские планы, отличные от истинных экспериментов, также могут давать результаты с высокой степенью внутренней достоверности.
Чтобы сделать выводы с высокой степенью внутренней достоверности, при разработке исследования могут быть приняты меры предосторожности. Как показывает опыт, выводы, основанные на прямом манипулировании независимой переменной, допускают большую внутреннюю валидность, чем выводы, основанные на ассоциации, наблюдаемой без манипуляций
Если рассматривать только внутреннюю валидность, строго контролируемые истинные экспериментальные планы (то есть со случайным выбором, случайным распределением в контрольную или экспериментальную группы, надежные инструменты, надежные процессы манипуляции и гарантии против мешающих факторов) могут быть «золотым стандартом» научных исследований . Однако сами методы, используемые для повышения внутренней достоверности, могут также ограничивать обобщаемость или внешнюю достоверность результатов. Например, изучение поведения животных в зоопарке может облегчить получение достоверных причинно-следственных выводов в этом контексте, но эти выводы могут не распространяться на поведение животных в дикой природе. В общем, типичный эксперимент в лаборатории, изучающий конкретный процесс, может не учитывать многие переменные, которые обычно сильно влияют на этот процесс в природе.
Что такое валидность в психологии
Валидность – важная характеристика психологических тестов и методик. Она должна проверяться экспериментаторами наравне с надежностью методики. Критерий валидности чаще всего используется в психодиагностике. В нем раскрывается проблема соответствия полученных в ходе исследования данных «идеальным». То есть тем, которые не искажены какими-либо внутренними или внешними факторами.
В психологии ярко выражена проблема субъективности. Какими бы точными, по мнению экспериментатора, не были полученные данные – они искажены. Для проверки уровня достоверности полученного знания используется критерий валидности. Валидность не используется в точных науках: физике, химии, математике.
Это уникальный критерий психологии, позволяющий сгладить трудности получения объективных знаний. Первой причиной появления этого инструмента служит проблема точного определения изучаемой характеристики или свойства. Так, исследуя тревожность, невозможно однозначно установить диагностируемое явление. Тревожность – это и страх, и беспокойство, и волнение.
Второй причиной является субъективность исследуемого параметра психодиагностической методикой. Разработчик вкладывает в формулировки собственное значение и смысл, но это не значит, что испытуемый думает по такому же шаблону. Интерпретации одних и тех же вопросов или утверждений могут сильно отличаться.
В точных науках нет проблемы определения исследуемого объекта. Трудность составляют способы изучения. Например, ученый-физик, исследующий параметры железного шара, точно видит и осязает его. Он поставил себе цель: изучить радиус шара. Параметр объективен и находится с помощью измерения и формул.
Что такое валидность: методики
Методика, в отличие от метода – это набор определенных действий специалиста, направленных на соответствующий результат. Метод исследования может включать в себя несколько методик. Например, метод анкетирования по классификации Б. Г. Ананьева может осуществляться с помощью разных тест-опросников.
Валидность в психологии — это соответствие целостности психодиагностической методики и отдельных её частей исследуемой психической характеристике.
ПДМ может включать несколько шкал. Например, тест-опросник, определяющий уровень невротизации-психопатизации, состоит из следующих шкал: психопатизация, невротизация и шкала «лжи». Третья измерительная шкала используется для проверки искренности испытуемого. Самая распространенная причина лжи – мотивация одобрения. Этот фактор сильно искажает статистические и индивидуальные данные.
Валидная ПДМ – это методика, диагностирующая только заданный экспериментатором узкий спектр характеристик. Она пользуется большим доверием специалистов и применяется в научных исследованиях. Чем выше коэффициент валидности, тем достовернее полученные в ходе эксперимента данные.
Внешние критерии
Для исполнения прагматической валидизации методики, то есть для оценки ее практической значимости, действенности, эффективности, обычно применяют внешний независимый критерий – показатель выказывания изучаемого качества в будничной жизни. Таким критерием могут быть и производственные достижения (для технологий профессиональной направленности), и успеваемость (для тестов интеллекта, достижений или способностей к обучению), и эффективность фактической деятельности – моделирование, рисование и так далее (для тестов особых умений), персональные оценки (для проверки личности).
Типы внешних критериев валидизации существуют следующие:
- мерки выполнения (в их число входить могут такие как, количество реализованной работы, затраченное на обучение время, успеваемость, темп роста квалификации и тому подобное);
- физиологические признаки (применяются при изучении воздействия окружающей среды и иных ситуационных переменных на психику и организм человека);
- замеряются давление крови, частота пульса, симптомы утомления, электросопротивление кожи и так далее;
- субъективные мерки (включают разнообразные виды ответов, отражающих отношение человека к кому-либо или чему-либо, его взгляды, мнение, предпочтения; как правило, такие мерки получают с помощью анкет, опросников, интервью);
- признаки случайностей (используются, когда цель изучения касается, к примеру, проблемы селекции для работы таких людей, которые несчастным случаям меньше подвержены).
Что такое валидный код на сайте?
Само слово «valid» переводится с английского как «действительный, имеющий силу», ну а «invalid» — ему противоположное. Отсюда и русский аналог валидный/невалидный.
Также для справки можно глянуть заметку из Википедии.
В сайтостроении есть разнообразные стандарты, по которым пишутся HTML и CSS коды. Что-то вроде ГОСТа. Например:
- какой тег можно поместить в другой тег, а какой — нельзя;
- какие атрибуты ссылок допустимы, а какие — нет;
- и т.д.
Но всё дело в том, что нормальные красивые сайты можно делать без соблюдения всех этих стандартов. Более того, современный сайт практически невозможно сделать с полностью валидным кодом.
К примеру, установив какие-нибудь кнопки социальных сетей для сайта или виджет Facebook’а, мы уже (как правило) «теряем» эту валидность.
Поэтому и не стоит добиваться полной валидности (разве что из-за перфекционизма..).
Конечно, по-возможности, ошибки следует исправить. Но, например, правка CSS-файлов из-за того, что валидатор «ругается» не даст преимуществ при поисковом продвижении.
Понятный код — меньше хлопот
Для чего это нужно? Иногда нам кажется, что другие думают как мы. Что не надо стараться объяснять. Но вот нет. Чтобы другие поняли вас быстрее, надо учитывать правила передачи информации. Под другими можно иметь в виду коллегу по команде, а также браузер или компилятор — любое ПО, которое будет работать с вашей разметкой.
Валидность кода определяет то, как будет выглядеть страница или веб-приложение в разных браузерах и на различных операционных платформах. Валидный код по большей части во многих браузерах отображается предсказуемо. Он загружается быстрее невалидного. Валидность влияет на восприятие страниц и сайтов поисковыми системами.
Спецификации кода могут быть разными. Нет универсальной в такой же степени, как и нет абсолютно правильного кода, который работает на всех устройствах и программах правильно. Хотя, сферический вакуумный конь поспорил бы с этим.
Как проверить валидность кода?
Самый известный способ — зайти на главные сервисы для этого:
- Проверка HTML-кода: validator.w3.org/
- Проверка CSS: jigsaw.w3.org/css-validator/
— нужно просто ввести URL-адрес страницы своего сайта, нажать Enter и узнать об ошибках (они, скорей всего, есть):
Также есть неплохие плагины для браузеров. Например, «HTML VALIDATOR» для Firefox.
Валидный код и Google:
В видео разбирается вопрос
Does the crawler really care about valid HTML? (Действительно ли роботу Гугла важна валидность HTML кода?)
На что получен однозначный ответ: валидный код — это хорошо, но если б стали учитывать его при ранжировании сайтов, то начали бы выходить в ТОП те сайты, у которых код чище, а не контент полезнее.
В общем, как обычно: главное — полезный контент.
С Яндексом ситуация аналогичная — здесь можно просто проанализировать его выдачу.
Кроме того, внедрение в сайты, например, семантической разметки (которая у Яндекса немного своя) сделает большинство документов неправильными с точки зрения валидаторов. В таком случае совсем не логичным бы было ухудшать их ранжирование из-за невалидного кода.
Валидный код и поисковое продвижение
Ну и наконец о том, ради чего начиналась эта статья. Если нет грубых ошибок в коде — то и не о чем беспокоиться. На продвижение в ПС это не повлияет.
Тем более, нет смысла делать абсолютно валидным CSS (отвечающий за внешний вид сайта): какая разница, что «внутри», если «снаружи» посетителю всё нравится — ведь в конце концов в ранжировании всё решают поведенческие факторы.
Соотношение надежности и валидности психологических тестов
Надежность теста отражает его качество как метода диагностики, с точки зрения формальных показателей. Без учета содержательного анализа результатов.
Валидность оценивает именно содержательные результаты теста. Насколько они соответствуют реальным психологическим феноменам.
Надежный тест может не быть валидным. Например, тест инициативности может показывать высокую ретестовую надежность и согласованность частей. Однако, с содержательной точки зрения, результаты теста отражают не столько инициативность, сколько силу воли. То есть, надежность данного теста высокая, а валидность низкая.
В практике психологического тестирования надежность тестов с помощью ретеста. Валидность психологических тестов, как правило, проверяется с помощью анализа взаимосвязей с показателями других тестов, измеряющих аналогичные или схожие психологические показатели.
Пример нарушения внутренней валидности
Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае — очевидных) факторов, тогда как надо было их учитывать.
Способы установления валидности методики
Зачастую понятие “валидность” обсуждают в контексте конкретных экспериментов или методик. Может быть при этом поставлен вопрос и о валидности в целом определенного метода (к примеру, ассессмент центра или метода тестирования). Подобные исследования проводят при помощи мета-анализа.
Существуют три главных метода установления валидности методики.
I. Оценка содержательной валидности
Содержательная валидность – степень соответствия содержания заданий методики реальной деятельности, в которой проявляют свойство, измеряемое в методике. Частным случаем содержательной валидности является так называемая очевидная (фейс или лицевая) валидность – степень соответствия методики ожиданиям оцениваемых. Для большей части методик считают важным, чтобы для участника оценки очевидна связь меж содержанием процедуры оценки и реальной деятельностью, которая является объектом оценки (семейная, профессиональная, учебная и так далее.).
II. Оценка конструктной валидности
Конструктная валидность – степень обоснованности того, что методика измеряет действительно заданные и при этом обоснованные научно конструкты. Есть, как минимум, две стратегии установления конструктной валидности.
Подход первый — «конвергентная валидизация» — проверка ожидаемой связи итогов конкретной методики с показателями прочих методик, которые измеряют сходные характеристики. К примеру, если для измерения какой-нибудь черты есть несколько методик, было бы целесообразным провести эксперименты по хотя бы двум, и тогда при выявлении высокой позитивной корреляции их итогов меж собой можно говорить о валидности. Главная цель конвергентной валидизации — определение того, будут ли оценки теста варьироваться соответственно с ожиданиями.
Подход второй — «дивергентная валидизация». Проверка валидности тут заключается в том, что тест не может измерять никакой черты, с которой он и не должен быть связан теоретически.
III. Оценка критериальной валидности
Критериальная валидность – степень соответствия внешних критериев, определенных заранее, и результатов методики, определенная статистическими методами. Подобными критериями могут быть:
- непосредственные меры исследуемого качества (такие как выраженность определенного свойства личности, степень развития способности, уровень достижения в какой-нибудь деятельности и так далее), независимые от результатов методики,
- показатели оргазизационно или социально-значимых результатов деятельности (ключевые показатели эффективности (KPI или КПЭ), устойчивость семейных отношений, успеваемость и так далее)
Одним из типов критериальной валидности является так называемая “прогностическая” валидность. Этот тип валидности применяется, когда методика призывается давать определенный прогноз поведения человека. Соответственно, когда прогноз с течением времени оправдывается, это говорит о том, что методика является валидной прогностически.
Профессиональные разработчики методик должны обосновывать все перечисленные типы валидности и проводить постоянный сбор свидетельств в пользу валидности их инструментов.
Внутренняя валидность психологического исследования
Внутренняя валидность (англ. internal validity) — вид валидности, степень влияния независимой переменной на зависимую переменную. Внутренняя валидность тем выше, чем больше вероятность того, что изменение зависимой переменной вызвано изменением именно независимой переменной (а не чего-либо ещё). Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Исследование, обладающее внутренней валидностью, дает основания утверждать: результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором.
Теоретически такое возможно, а практически, особенно в психологии — нет. Похоже, что психологические исследования требованию внутренней валидности соответствовать не могут. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. При любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.
Какие факторы чаще других снижают внутреннюю валидность при проведении психологических экспериментов?
В первую очередь это изменение во времени (зависимость субъектов и окружающей среды от времени суток, времён года, изменений в самом человеке — старение, усталость и рассеивание внимания при длительных исследованиях, изменение мотивированности испытуемых и экспериментатора и т. д., сюда же естественное развитие живых существ.
Сюда же относят ряд типовых эффектов:
- Эффект последовательности — влияние одного из условий эксперимента на следующее за ним. Например, это послевкусие при дегустации; обучение испытуемого в ходе эксперимента; адаптация испытуемого к условиям эксперимента и др.
- Эффект Розенталя (эффект Пигмалиона) — ожидания личностью реализации пророчества во многом определяют характер её действий и интерпретацию реакций окружающих, что и провоцирует самоосуществление пророчества. В опытах по проверке паранормальных явлений, как правило, положительные результаты получают сторонники парапсихологии, а отрицательные — противники.
- Эффект Хоторна — условия, в которых новизна, интерес к эксперименту или повышенное внимание к данному вопросу приводят к искажённому, зачастую слишком благоприятному результату. Участники эксперимента действуют иначе, более усердно, чем обычно, только благодаря осознанию того, что они причастны к эксперименту.
- Эффект плацебо — действия внушения: под влиянием внушения человек будет верить в силу таблетки, хотя таблетка не содержит ничего…
- Эффект аудитории (эффект Зайонца, эффект фасилитации) — влияние постороннего присутствия на поведение человека. Примеры этого эффекта: мужчина пытается показать себя в лучшем свете перед женщиной (и наоборот); в присутствии посторонних человек может переживать сильные эмоции, волноваться, смущаться и т. д.; поведение и мысли человека наедине с собой и в компании зачастую разительно отличаются…
- Эффект первого впечатления — влияние мнения о человеке, которое сформировалось у субъекта в первые минуты при первой встрече, на дальнейшую оценку деятельности и личности этого человека.
- Эффект Барнума — люди склонны принимать на свой счет общие, расплывчатые, банальные утверждения, если ему говорят, что они получены в результате изучения каких-то непонятных ему факторов.
- Сопутствующее смешение — на зависимую переменную обычно влияют различные нерелевантные стимулы, от которых принципиально невозможно избавиться. Например, при исследовании влияния на поведение животных различных участков головного мозга сам факт перенесения операции по удалению соответствующего участка может изменить поведение подопытного животного.
На внутреннюю валидность влияют и факторы выборки, в том числе:
- Неправильная селекция (неэквивалентность групп по составу, вызывающая систематическую ошибку в результатах)
- Статистическая регрессия
- Экспериментальный отсев (неравномерное выбывание испытуемых из сравниваемых групп, приводящее к неэквивалентности групп по составу)
- Естественное развитие (общее свойство живых существ к изменению; ср. онтогенез) и др.
Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае — очевидных) факторов, тогда как надо было их учитывать.
Общие сведения
При обладающем внутренней валидностью исследовании исследователь уверен, что результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором.
Однако, фактически, в науке (особенно в психологии) невозможно со стопроцентной уверенностью утверждать, что внутренняя валидность соблюдена. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. Поэтому всегда при любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.
Психометрические свойства методик психодиагностики
Психометрической основой любой методики являются шкалы. Понятие «шкала» трактуется в широком и узком значении: в первом случае шкала – это конкретная методика, во втором случае – это измерительная шкала, фиксирующая исследуемые признаки. Каждому элементу методики соответствует определенный балл или индекс, который формирует выраженность того или иного психического явления.
Измерительные шкалы разделяют на:
- Метрические: интервальные, шкалы отношений.
- Неметрические: номинативные, порядковые.
Название шкалы | Пояснение, примеры |
Номинативная (шкала наименований) | На основе общего свойства или символа относит наблюдаемое явление к соответствующему классу.
Шкала наименований самая распространенная в исследовательских психодиагностических методиках. Эта шкала используется, например, в тест-опросниках. Отрицание или утверждение испытуемого сравнивается с ответами в ключе. Также номинативная шкала может предполагать выбор одного или нескольких признаков из предложенных. |
Порядковая | Разделяет сумму признаков на элементы, исходя из принципа «больше – меньше». Таким образом, она расставляет результаты в порядке возрастания или убывания.
Порядковая шкала используется в тесте цветового выбора. Испытуемому предлагается выбрать один из квадратов на белом фоне, после чего выбранная фигура откладывается в сторону, и процедура повторяется. Результат: расставленные по степени привлекательности для испытуемого цвета. Каждой фигуре присваивается свой порядковый номер. |
Интервальная | Элементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе распределения признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака.
Интервальные шкалы часто используются при стандартизации первичных тестовых показателей. |
Отношений | Упорядочивает элементы по числовому значению, соблюдая между ними пропорциональность. Объекты разделены согласно измеряемому свойству. Числа, которые приравниваются к классам объектов, пропорциональны степени выраженности исследуемых свойств.
Используется, например, при определении порогов чувствительности анализаторов. Часто применяется в психофизике. |
После определения используемой шкалы для формирования теста, нужно определить коэффициент психометрических свойств методики.
К ним относятся:
- Репрезентативность.
- Стандартность.
- Надежность.
- Валидность.
Репрезентативность – это свойство, которое распространяется на выборку испытуемых. Оно может характеризовать как популяцию, так и генеральную совокупность. Репрезентативность имеет два параметра: качественный и количественный. Качественный параметр характеризует выбор испытуемых и способы построения выборки.
Количественный параметр – это объем выборки, выраженный в числах.
В психологических исследованиях это свойство определяет, насколько возможно обобщение результатов. Например, изучаются отношения мужчин и женщин. Если взять испытуемых разного возраста (школьников, студентов, взрослых, пенсионеров), то репрезентативность такой выборки будет низкой.
Однако, если испытуемые будут примерно одного возраста и сферы деятельности (только школьники, студенты, взрослые, пенсионеры обоих полов), то репрезентативность будет высокой. В психодиагностике репрезентативность используется для того, чтобы обозначить возможность применения методики на всю генеральную совокупность.
Стандартность – это упрощение методики, приведение частей ПДМ и процедуры применения к единым нормам. ПДМ должны быть универсальны и применимы разными специалистами в различных ситуациях. При отклонении структуры ПДМ от стандартов, её результаты будет невозможно сравнить с результатами других исследований. Нестандартизованные методики используются в основном для научных исследований.
С их помощью изучаются новые психические явления. Но такой методикой нельзя пользоваться в психодиагностических целях. Ещё один важный параметр ПДМ – надежность. Она характеризует точность, устойчивость и стабильность результатов, полученных с помощью конкретной методики.
Высокая надежность методики исключает действие посторонних факторов и существенно приближает эксперимент к «чистому». Критерий надежности и валидности – это разные понятия. Причем надежность трактуется шире, чем валидность: надежность > валидность.
Например, в выходной день человек получает возможность провести время либо на рыбалке, либо на охоте. Если он решает идти на охоту, но берёт с собой удочку, то его выбор не будет валиден. Однако, если человек пошел на охоту с ружьем, и оно дало осечку, значит, выбранный метод ненадежен.
Какие значения может принимать валидность, примеры
Валидность может принимать значение от -1 до 1. Высокий коэффициент валидности позволяет сделать вывод, что полученные результаты достоверны. Если же валидность равна 0, то данные содержат ошибки. Коэффициент, равный -1, означает недостоверность результатов. Чаще всего оценка будет противоположной, отрицательной.
Виды валидности методов исследования
Выбор методов научного исследования зависит от ряда фактов: области наук (гуманитарные или прикладные), необходимость проведения анализа с расчетной частью или простое сопоставление фактов, наличие конкретных данных для анализа и пр.
Следует отметить, что в одном исследовании выбранный метод может быть валидным, а в ином – вовсе неэффективен. Поэтому валидность выбранной методики следует оценивать в рамках конкретной научной работы, а не в сравнении с иными исследованиями.
В науке выделяют несколько разновидностей валидности методов исследования:
Виды валидности
- Теоретическая валидность.
Данный вид определяется сопоставлением показателей, рассчитанных с помощью выбранной методики, с аналогичными показателями, рассчитанными по другому методу. Важно, чтобы рассчитанные параметры были теоретически зависимы, то есть оценивали один и тот же предмет, учитывали одни и те же факторы или схожие факторы влияния, демонстрировали теоретическую зависимость (то есть имели принадлежность к конкретному объекту или суждению).
Этот показатель определяют с помощью корреляции одно и того же показателя или свойства, рассчитываемого с помощью разных методов исследования. При этом важно соблюдение: обе методики должны быть связаны с одной и той же гипотезой или теорией.
- Эмпирическая валидность.
Данный критерий рассчитывается или проявляется благодаря действию опытно-логического метода исследования. В частности, он находит отражение на реакции, мышлении, эмоциях, поведении испытуемых объектов. Данный способ применим больше в психологической отрасли, когда требуется оценить реакцию или психологическое состояние человека в конкретной ситуации.
Эмпирическая валидность методов исследования будет выше тогда, когда выбранная методика продемонстрирует тот факт, что полученные данные соответствуют реальным данным испытуемого, то есть во время проведения «чистого» или «естественного» эксперимента: когда поведение объекта в рамках исследования будет полностью совпадать с поведением в реальной жизни.
- Внешняя валидность.
Данный критерий имеет сходства с эмпирической валидность. Его особенностью является то, что здесь важно установить связь между конкретными параметрами выбранного метода исследования с внешними проявлениями испытуемого (поведением) в реальной жизни.
- Внутренняя валидность.
Этот показатель проявляется в том, что выбранная методика позволяет достичь поставленной цели исследования, доказывает или опровергает эффективность выдвинутой гипотезы. Фактически, внутренняя валидность демонстрирует соответствие методики исследования его содержанию. Валидность выбранного метода выше тогда, когда он показывает, что все коэффициенты и действия измеряют именно то, что требуется, связывая эти проявления с внешними признаками проблемы (ее симптомами).
Виды валидности
Существует много видов валидности.
Валидность в психологии делится на несколько видов.
Перечень:
- Внутренняя валидность. Характеризует соответствие полученных результатов стимульному материалу психодиагностической методики. Она определяет, действительно ли реакции испытуемых обусловлены только заданиями и фиксируют изучаемые психические свойства.
- Внешняя валидность. Высокая внешняя валидность определяет репрезентативность выборки. То есть соответствие методики выбранным категориям населения и условиям, в которых применяется.
- Концептуальная валидность. Валидность в психологии – это логичность построенной экспериментатором теории. Определяется на этапе разработки концепции изучаемого психического свойства. В проверке концептуальной валидности участвует группа экспертов-психологов, которые контролируют создание концепции и методики.
- Очевидная валидность. Высокая очевидная валидность означает применимость тестовых заданий целевой выборке. Так, если экспериментатор хочет исследовать определенные качества школьников, то и задания в методике должны быть сформулированы в расчете на уровень знаний среднестистического школьника. Помимо этого, очевидная валидность фиксирует понятность формулировок, исходя из социально-демографических характеристик, представлений и жизненного опыта испытуемых. Утверждения в опросниках бывают неоднозначны. Например, утверждение «я завожусь с пол-оборота» можно интерпретировать по-разному. Есть утверждения и вопросы, которые не соответствуют жизненному опыту испытуемых. Вопрос о какой-либо ситуации во время вождения автомобиля будет неизвестен людям, которые не умеют водить.
- Конструктная валидность. Характеризует соответствие используемых формулировок методики фиксируемым явлениям. Высокая конструктная валидность означает, что выбранные для методики понятия (например, вопросы или утверждения в тесте) фиксируют те свойства, которые хочет исследовать экспериментатор.
- Прогностическая валидность. Обозначает достоверность прогноза, сделанного на основе результатов исследования с помощью ПДМ. Этот вид валидности важен для профотбора и постановки диагноза в психиатрических клиниках. Высокая прогностическая валидность позволяет эксперту быть уверенным в назначенном курсе лечения или выборе кандидата на должность. Измеряет задатки и предпосылки испытуемого к тем или иным качествам, свойствам. Например, если сформулировать прогностическую валидность в виде вопроса, то он может прозвучать так: «Сможет ли Иванов стать квалифицированным эндокринологом?».
- Текущая валидность. Фиксирует текущее положение дел. Определяет те свойства и качества, которые есть у испытуемого на данный момент. Если сформулировать текущую валидность в виде вопроса, как в примере выше, то он будет звучать так: «Иванов – квалифицированный эндокринолог?» Часто в тестах используется прогностическая валидность. Текущая используется как замена.
- Конвергентная валидность. Определяет силу связи между частями одной ПДМ или методиками, фиксируемыми одно и то же свойства. Если конвергентная валидность двух методик высока, то, вероятно, они диагностируют общее качество. Сильная связь должна устанавливаться между утверждениями или вопросами в психодиагностической методике, которые относятся к одной шкале и фиксируют одну характеристику.
- Содержательная валидность. Валидность в психологии – это соответствие тестовых заданий диагностируемому психическому качеству. Тест не должен содержать пункты, относящиеся к диагностике других свойств. Однако, он может включать в себя шкалы «лжи» для высокой достоверности результатов.
- Дискрименантная валидность. Высокая дискрименантная валидность выявляет отсутствие связи между заданиями одной психодиагностической методики или разными ПДМ. Используется для проверки вопросов и утверждений, методик, которые должны изучать не связанные психические свойства.
Валидность «по содержанию»
Содержательная валидность требует того, чтобы каждое задание, задача или вопрос, принадлежащие к определенной области, имели равные шансы стать заданиями теста.
Валидность по содержанию оценивает соответствие содержания теста (заданий, вопросов) измеряемой области поведения. Тесты, составленные двумя командами разработчиков, проводятся на выборке испытуемых.
Надежность тестов подсчитывается путем расщепления заданий на две части, в результате чего получают индекс содержательной валидности.
Конвергентная и дискриминантная валидность
От того, как психолог определяет диагностический конструкт, зависит стратегия включения в тест определенных пунктов. Если Айзенк определяет свойство «нейротизм» как независимое от экстраверсии-интроверсии, то это означает, что в его опроснике примерно поровну должны быть представлены пункты, с которыми будут соглашаться невротичные интроверты и невротичные экстраверты.
Если же на практике окажется, что в тесте будут преобладать пункты из квадранта «Нейротизм-Интроверсия», то, с точки зрения теории Айзенка, это означает, что фактор «нейротизм» оказывается нагруженным иррелевантным фактором — «интроверсией».
(Точно такой же эффект возникает, если появится перекос в выборке — если в ней будет больше невротичных интровертов, чем невротичных экстравертов.)
Для того чтобы не сталкиваться с такими сложностями, психологи хотели бы иметь дело с такими эмпирическими показателями (пунктами), которые однозначно информируют только об одном факторе. Но это требование реально никогда не выполняется: всякий эмпирический показатель оказывается детерминированным не только тем фактором, который нам нужен, но и другими — иррелевантными задаче измерения.
Таким образом, по отношению к факторам, которые концептуально определяются как ортогональные к измеряемому (встречающиеся с ним во всех комбинациях), составитель теста должен при отборе пунктов применить стратегию искусственного балансирования.
Соответствие пунктов измеряемому фактору обеспечивает конвергентную валидность теста. Сбалансированность пунктов относительно иррелевантных факторов обеспечивает дискриминантную валидностъ. Эмпирически она выражается в отсутствии значимой корреляции с тестом, измеряющим концептуально независимое свойство.
Типы валидности
В разных источниках упоминают различные названия, что может создать определенную путаницу. В экспериментальной психологии ключевые понятия:
- Внешняя валидность
- Конструктная валидность
- Операциональная валидность
- Дифференциальная валидность
- Внутренняя валидность
- Экологическая валидность
- Инкрементная валидность
Для организационной психологии и психодиагностики более традиционной является классификация из трех главных типов валидности:
- Конструктная валидность
- Дивергентная валидность
- Конвергентная валидность
- Эмпирическая валидность (Критериальная валидность)
- Прогностическая валидность
- Ретроспективная валидность
- Текущая валидность
- Содержательная валидность
- Очевидная валидность
Другие типы валидности
Помимо основных, выделяют и иные виды, которые соответствуют другим стадиям экспериментального исследования. Выделяют более десятка видов валидности, которые во многом, в том числе и угрозами, сходны с основными. Меняется только характер их нарушения. Рассмотрим кратко некоторые из них.
Экологическая – показывает, насколько условия эксперимента соответствуют исследуемой реальности. Высокую степень экологической валидности достаточно трудно соблюсти в лабораторных исследованиях, да и не всегда это нужно. А в полевых экспериментах она естественным образом достигает максимума.
Диагностическая (конкурентная) – отражает соответствие показателей теста состоянию психологических особенностей испытуемого на момент исследования.
Прогностическая – характеризует степень статистической надежности и обоснованности развития психологической особенности, которая исследуется, в будущем.
Эмпирическая – это понятие объединяет в себе 2 предыдущих. Подчеркивается общий подход к их определению, осуществляемый путем статистического коррелирования баллов по тесту (оценок) и показателю по внешнему критерию.
Уровни проверки валидности
Если вы используете инструмент оценки, у вас есть три уровня проверкиего валидности:
Во-вторых, вы можете узнать валидность инструмента — тех конкретных тестов способностей, которые вы покупаете. Эти данные вам должен предоставить провайдер.
Наконец, вы можете посмотреть, насколько конкретный инструмент валидендля ваших задач. Чтобы посчитать валидность инструмента на ваших данных:
1. Оцените при помощи инструмента не менее 200 сотрудников одной группы должностей — это минимальная выборка. Чем больше человек вы оцените,тем более надёжные цифры получите.
2. Выберите критерий, относительно которого будете проверять валидность. Например, оценка результативности руководителем.
Создание инструментов
И все-таки, валидизация – это что такое? Изысканные инструменты валидизации первыми начали создавать психологи. Еще в 1959 году была разработана особая методика Д. Фиске и Д. Кампбеллом (США). Она получила вполне природное для английского, но непереводимое на наш язык, наименование: мультиметодная-мультичертовая матрица (МТММ). Эта матрица представляла собой таблицу корреляций. Она состояла из двух весьма привлекательных изобретений, одно из которых предназначалось для выявления конвергентной истинности, а другое – для дискриминантной.
Ее авторы утверждали, что каждый сможет доказать внутреннюю приемлемость, если:
- величины, между которыми предположен высокий уровень теоретической связи, обнаружат идентичный уровень в эмпирии (конвергенция);
- величины, теоретически не связанные между собой, окажутся не связанными и эмпирически после исполнения испытания (дискриминация).
Грубо говоря, валидность конвергентная должна изъявить, что между двумя командами наемных специалистов, к примеру, строительными и конвейерными рабочими, в отношении шансов на рынке труда намного больше сходства, чем между собственниками и наемными работниками. Если теоретически намеченная связь выявлена эмпирически, ваш образец валиден.
Валидность дискриминантная выказывает степень идентификации различных явлений. Если взять тот же пример с рынком труда, то нужно ожидать, что отлично построенная теория может заложенными в нее средствами отличить возможности владельцев и наемных работников на рынке труда. Путать их нельзя, и ваша теория их различить способна.
Если вы создали шкалу, вымеривающую математические способности, то в случае валидности конвергентной индексы математических дарований должны хорошо коррелировать с общими умениями человека, если на теоретическом уровне такая связь имеется, и плохо — со способностями эстетическими, требующими от человека совсем иных талантов, нежели навыки счета, если, конечно же, низкая корреляция провозглашается вашей теорией.
Соблюдение внешней валидности
Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.
При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.
Связанные понятия
Вали́дность (англ. validity, от лат. validus — «сильный, здоровый, достойный») — обоснованность и пригодность применения методик и результатов исследования в конкретных условиях. Более прикладное определение понятия «валидность» — мера соответствия методик и результатов исследования поставленным задачам. Валидность считается фундаментальным понятием экспериментальной психологии, организационной психологии и психодиагностики.
Вну́тренняя вали́дность (англ. internal validity) — вид валидности, степень влияния независимой переменной на зависимую переменную. Внутренняя валидность тем выше, чем больше вероятность того, что изменение зависимой переменной вызвано изменением именно независимой переменной (а не чего-либо ещё). Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.
Психометри́я (психометрика) — дисциплина психологии, изучающая теорию и методику психологических измерений, включая измерение знаний, способностей, взглядов и качеств личности. Психометрия является разделом психодиагностики. В первую очередь, эта область касается создания и валидации измерительных инструментов, таких как опросники, тесты и методики описания (оценки) личности. Она включает в себя две основные исследовательские задачи, а именно…
Проблема Гальтона, названная в честь сэра Фрэнсиса Гальтона, представляет собой проблему выведения заключений из кросс-культурных данных на основании статистического феномена, известного на сегодняшний день как сетевая автокорреляция. В настоящее время проблема признается проблемой общего характера, которая применяется ко всем неэкспериментальным исследованиям, а также к экспериментальному проектированию. Ее можно наиболее просто описать как проблему внешних зависимостей при проведении статистических…
Больша́я пятёрка — диспозициональная (от англ. disposition — предрасположенность) модель личности человека.
Упоминания в литературе
Вариативность использования стратегий преодоления частично зависит и от индивидуальных склонностей. Однако в большинстве случаев требования ситуации изменяют стратегии. Существуют групповые (культурные, классовые, профессиональные и др.) различия в понимании реакций «стремление к успеху», не говоря уже о различиях в их оценки. Таким образом, подходы, исследующие исключительно личностное влияние, методологически более чисты, так как их шкалы имеют большую внутреннюю надежность, но их внешняя валидность ниже. Коллектив авторов, Стресс, выгорание, совладание в современном контексте, 2011 4. Валидность внешняя – это приблизительно то же самое, что и эмпирическая валидность, но здесь речь должна идти о связи между показателями методики и наиболее значимыми внешними признаками, относящимися к поведению испытуемого. Наталья Сидорова, Диагностика соискателя Специальное исследование подтвердило соответствие инструмента современным требованиям, предъявляемым к психометрическим качествам разрабатываемых тестов. Тестирование опросника показало его достаточно высокую надежность (коэффициент α Кронбаха по субшкалам: удовлетворенность результатом лечения – 0,79; удовлетворенность отношениями врач – больной – 0,84; удовлетворенность бытовыми условиями и окружающей обстановкой – 0,66). Высокие показатели получены также по параметрам внутренней и внешней валидности. Виктор Давыдович Вид, Психотерапия шизофрении, 2008
Связанные понятия (продолжение)
Вопрос научного обоснования нейролингвистического программирования (НЛП), соотношения НЛП и науки, а также критического научного рассмотрения феномена НЛП стоит со времени создания НЛП в начале 1970-х.
Подробнее: НЛП и наука Типология Майерс — Бриггс — типология личности, возникшая на базе типологии Юнга в 1940-х годах и получившая широкое распространение в США и Европе. На основе этой типологии была создана система психологического тестирования — Myers–Briggs Type Indicator (MBTI). Академическая психология настороженно относится к этому подходу, принимая его с многочисленными оговорками, так как не все исходные предположения теории были затем подтверждены после накопления эмпирических данных. Психологический эксперимент — проводимый в специальных условиях опыт для получения новых научных знаний о психологии посредством целенаправленного вмешательства исследователя в жизнедеятельность испытуемого. Прикладные исследования — научные исследования, направленные на практическое решение технических и социальных проблем. Теория социального сравнения – теория согласно которой люди воспринимают и осознают себя, сравнивая себя с другими. Теоретическая выборка (англ. theoretical sampling), или теоретический отбор — процесс сбора данных для теории, когда аналитик одновременно собирает, кодирует, анализирует и сравнивает свои данные между собой. Он также решает, какие данные собирать дальше и где их искать, чтобы развивать свою теорию по мере ее возникновения . Исследователь выбирает какую-либо общую проблемную область и начинает с определения некоторых ключевых понятий и особенностей, которые будут им анализироваться. При этом важно… Методика Роджерса-Даймонд — личностный опросник, направленный на выявление особенностей личности тестируемого и степени социально-психологической адаптации, часто к новой среде, условиям и правилам поведения. Неопределённость — отсутствие или недостаток определения или информации о чём-либо. Планирование эксперимента — один из важнейших этапов организации психологического исследования, на котором исследователь пытается сконструировать наиболее оптимальную для воплощения на практике модель (то есть план) эксперимента. Метод индивидуального случая в психологии (англ. case study) — один из методов клинической психологии, в частности, психотерапии, относящийся к классу исследовательских приемов, которые включают в себя описание и анализ конкретных особенностей личности или феномена, сопоставление результатов с нормативными данными. Контент-ана́лиз (от англ.: англ. contents — содержание, содержимое) или ана́лиз содержа́ния — стандартная методика исследования в области общественных наук, предметом анализа которой является содержание текстовых массивов и продуктов коммуникативной корреспонденции. Дескриптивные методы принятия решений — это оценочно-описательный метод исследования, направленный на эмпирическое исследование и описание поведения отдельных лиц и групп людей в процессе принятия решений. Она носит ярко выраженный объясняющий, а не предписывающий характер. Шкала (измерительная шкала) — это знаковая система, для которой задано отображение (операция измерения), ставящее в соответствие реальным объектам (событиям) тот или иной элемент (значение) шкалы. Формально шкалой называют кортеж, , где X — множество реальных объектов (событий), φ — отображение, Y — множество элементов (значений) знаковой системы. Конструктная валидность (концептуальная, понятийная валидность) — частный случай операциональной валидности, степень адекватности метода интерпретации экспериментальных данных теории, которая определяется правильностью употребления терминов той или иной теории. Когнити́вное искаже́ние — понятие когнитивной науки, означающее систематические отклонения в поведении, восприятии и мышлении, обусловленные субъективными убеждениями (предубеждениями) и стереотипами, социальными, моральными и эмоциональными причинами, сбоями в обработке и анализе информации, а также физическими ограничениями и особенностями строения человеческого мозга. Когнитивные искажения возникают на основе дисфункциональных убеждений, внедрённых в когнитивные схемы, и легко обнаруживаются при… Тематический апперцептивный тест (англ. Thematic apperception test (TAT)) — проективная психодиагностическая методика, разработанная в 1930-х в Гарварде Генри Мюрреем и Кристианой Морган. Целью методики являлось исследование движущих сил личности — внутренних конфликтов, влечений, интересов и мотивов. После второй мировой войны тест стал широко применяться психоаналитиками и клиницистами для работы с нарушениями в эмоциональной сфере пациентов. Эффект сверхуверенности (англ. overconfidence effect) — когнитивное искажение, при котором уверенность человека в своих действиях и решениях значительно выше, чем объективная точность этих суждений. Также выражается в льстивом представлении о себе. Иерархия доказательств отражает относительное качество (надежность получаемых данных при их проведении) различных видов биомедицинских исследований экспериментальной медицины, которое выражается в уровнях доказательств. Фармакоэкономика — новая самостоятельная наука, которая изучает в сравнительном плане соотношение между затратами и эффективностью, безопасностью, качеством жизни при альтернативных схемах лечения (профилактики) заболевания. Нейролингвистическое программирование (также нейро-лингвистическое программирование, НЛП, от англ. Neuro-linguistic programming) — направление в психотерапии и практической психологии, не признаваемое академическим сообществом, основанное на технике моделирования (копирования) вербального и невербального поведения людей, добившихся успеха в какой-либо области, и наборе связей между формами речи, движением глаз, тела и памятью. Конверсацио́нный ана́лиз – это эмпирический метод научного познания, который основывается на установлении взаимосвязей между структурами разговора, социальными практиками и ожиданиями коммуникантов, на основании которых последние выбирают определенную модель поведения и интерпретируют поведение других . Некоторые модели человеческого поведения в общественных науках предполагают, что поведение людей может быть описано в предположении, что люди ведут себя как «рациональные» существа (смотри, например, теорию рационального выбора). Во многих экономических моделях полагается, что люди гиперрациональны и никогда не делают чего бы то ни было, что противоречит их интересам. Концепция ограниченной рациональности подвергает эти положения сомнению с целью учесть, что в действительности совершенно рациональные…
Подробнее: Ограниченная рациональность Приня́тие жела́емого за действи́тельное — формирование убеждений и принятие решений в соответствии с тем, что является приятным человеку, вместо апелляции к имеющимся доказательствам, рациональности или реальности. Социо́ника — концепция типов личности и взаимоотношений между ними. Создана в 1970-х годах Аушрой Аугустинавичюте на основе типологии Юнга и теории информационного метаболизма А. Кемпинского. Из восьмитипной типологии Юнга соционика выводит существование 16 соционических типов. Эксперимента́льная психоло́гия — общее обозначение всех видов научно-психологических исследований, осуществляемых посредством различных экспериментальных методов. Кросскульту́рные иссле́дования — это научный метод из области антропологии и смежных наук (социология, психология, экономика, политология), который использует данные о различных обществах, собранные в полевых исследованиях, чтобы изучить социальное поведение и проверить гипотезы о культурных различиях. В отличие от сравнительных исследований, в которых рассматриваются схожие характеристики нескольких обществ, в кросс-культурных исследованиях используется более широкая выборка, которая позволяет провести… В психологии теория запланированного поведения (ТЗП) представляет теорию, которая связывает убеждения с поведением. Алекситимия (от др.-греч. ἀ- — приставка с отрицательным значением, λέξις — слово, θυμός — чувство, буквально «без слов для чувств») — затруднения в передаче, словесном описании своего состояния. Методика исследования самоотношения (МИС) — личностный опросник, разработанный в 1989 году С. Р. Пантилеевым и В. В. Столиным. Используется в таких практических сферах психологии, как консультирование, психотерапия, а также индивидуальная и групповая коррекция, так как они имеют наиболее тесное отношение к воздействию на самооценку клиента или пациента. Обучение без учителя (самообучение, спонтанное обучение, англ. Unsupervised learning) — один из способов машинного обучения, при котором испытуемая система спонтанно обучается выполнять поставленную задачу без вмешательства со стороны экспериментатора. С точки зрения кибернетики, это является одним из видов кибернетического эксперимента. Как правило, это пригодно только для задач, в которых известны описания множества объектов (обучающей выборки), и требуется обнаружить внутренние взаимосвязи, зависимости… Фактор общего интеллекта (англ. general factor, g factor) является распространённым, но противоречивым конструктом, используемым в психологии (см. также психометрию) для выявления общего в различных тестах интеллекта. Словосочетание «теория g» имеет дело с гипотезой и полученными из неё результатами о биологической природе g, постоянством/податливостью, уместностью его применения в реальной жизни и другими исследованиями. Модулярность сознания — это идея сознания, включающая в себя, по крайней мере частично, врожденные нейронные структуры или модули, каждый из которых имеет особенные функции, установленные эволюцией. Благодаря инакомыслию авторов, существуют множество определений понятия «модуль». Систе́ма це́нностей — понятие теории ценностей, обозначающее совокупность сложившихся у людей мнений о значении в их жизни вещей и явлений, встречаемых в природе и обществе («социальных установок»). Копинг, копинговые стратегии (англ. coping, coping strategy) — это то, что делает человек, чтобы справиться (англ. to cope with) со стрессом. Понятие объединяет когнитивные, эмоциональные и поведенческие стратегии, которые используются, чтобы совладать со стрессами, и в общем случае, с психологическими трудными ситуациями обыденной жизни. Близкое понятие, широко используемое и глубоко разработанное в русской психологической школе, — переживание (преодоление неблагоприятных последствий стресса) (см… Эконометрика — наука, изучающая количественные и качественные экономические взаимосвязи с помощью математических и статистических методов и моделей. Современное определение предмета эконометрики было выработано в уставе Эконометрического общества, которое главными целями назвало использование статистики и математики для развития экономической теории. Теоретическая эконометрика рассматривает статистические свойства оценок и испытаний, в то время как прикладная эконометрика занимается применением эконометрических… Тéория двойнóй наслéдственности (англ. dual inheritance theory, также известная как теория генно-культурной коэволюции или биокультурная эволюция) — теория, разработанная в 1960—1980-х годах с целью объяснить человеческое поведение с точки зрения двух различных, но взаимодействующих процессов: генетической эволюции и культурной эволюции. В рамках теории двойной наследственности культура определяется как информация или поведение, приобретенное посредством социального научения. Одно из центральных…
Подробнее: Теория двойной наследственности Систе́ма (др.-греч. σύστημα «целое, составленное из частей; соединение») — множество элементов, находящихся в отношениях и связях друг с другом, которое образует определённую целостность, единство. Шкала Гуттмана (названа в честь Луиса Гуттмана, eng.Guttman scale/scalp gram) — измерительная шкала, принимающая за основу одномерность и то, что, суждения в анкете иерархически связаны между собой. Психологическая типология — система индивидуальных установок и поведенческих стереотипов, образованная с целью объяснения разницы между людьми. Проблема удачного, то есть определяющего более широкий спектр производных характеристик, основания для классификации психологических типов всегда была краеугольной для дифференциальной психологии.
Подробнее: Психологические типологии Суперве́нтность (англ. Supervenience) — отношение детерминированности состояния любой системы состоянием другой системы. Набор свойств одной системы супервентен относительно набора свойств другой системы в том случае, если существование различия между двумя фактами в свойствах первой системы невозможно без существования такого же различия между двумя фактами в свойствах второй системы. Понятие супервентности является центральным понятием современной аналитической философии и часто используется в… Моде́ль (фр. modèle от лат. modulus «мера, аналог, образец») — это система, исследование которой служит средством для получения информации о другой системе; представление некоторого реального процесса, устройства или концепции. Психологическая резилентность (от англ. resilience — упругость, эластичность) — Резильентность — это врожденное динамическое свойство личности, лежащие в основе способности преодолевать стрессы и трудные периоды конструктивным путем. Несмотря на то, что это свойство врожденное, его можно развивать. Модели́рование — исследование объектов познания на их моделях; построение и изучение моделей реально существующих объектов, процессов или явлений с целью получения объяснений этих явлений, а также для предсказания явлений, интересующих исследователя. В когнитивной науке под когнити́вными искаже́ниями понимаются систематические ошибки в мышлении или шаблонные отклонения, которые возникают на основе дисфункциональных убеждений, внедрённых в когнитивные схемы, и легко обнаруживаются при анализе автоматических мыслей. Существование большинства когнитивных искажений было описано учёными, а многие были доказаны в психологических экспериментах.
Подробнее: Список когнитивных искажений Ключ для определения в биологии — это описанный или реализованный в CAE-системе алгоритм, служащий для помощи в идентификации биологических сущностей, таких как растения, животные, фоссилии, микроорганизмы, зёрна пыльцы. Такие ключи, кроме того, нашли широкое применение в различных областях науки и техники для идентификации разного вида сущностей, например заболеваний, почв, минералов, археологических и антропологических артефактов.
Тестовые нормы. Корреляция качественных признаков
Что, несомненно, должен знать и уметь делать каждый грамотный пользователь теста – это понимать, что такое тестовые нормы и как ими пользоваться.
Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Его называют в те-стологии «сырым тестовым баллом». Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в «стандартную». Эта процедура называется «стандартизацией тестового балла».
Допустим, мы провели тест из 20 заданий и испытуемый дал 12 правильных ответов. Можно ли при этом сказать, что способность у испытуемого выражена лучше или хуже, чем в среднем? Нет. Для такого вывода нужно сравнить балл 12 со средним баллом по представительной выборке испытуемых.
Выборка, на которой определяются статистические тестовые нормы, называется выборкой стандартизации. Ее численность, как правило, не меньше 200 человек. Такое количество человек должно принять участие в психометрическом эксперименте по определению тестовых норм – в эксперименте по стандартизации теста.
Корреляция качественных признаков – метод анализа связи переменных, измеряемых в порядковых шкалах и шкалах наименований (см. шкалы измерительные). Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов ранговой корреляции, используемых в случаях, когда обе переменные измеряются в шкалах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых переменных в шкалах наименований широко применяются коэффициенты сопряженности, в которых в качестве промежуточной расчетной величины используется критерий согласия Пирсона (см. критерий X2). Наиболее часто в таких расчетах пользуются коэффициентом сопряженности Пирсона:
Значение P всегда положительно и измеряется от нуля до единицы. Особенностью коэффициента сопряженности Пирсона является то, что максимальное его значение всегда меньше + 1 и в значительной степени зависит от количества наблюдений (размера таблицы). В случае квадратной таблицы (k x k):
Так, в таблице размером (5 x 5) Pmax = 0,894; в таблице (10 x 10) Рmax = 0,949. Поэтому окончательной формой выражения связи между переменными с помощью коэффициента Пирсона является его отношение к величине Рmax для данного случая (P/Pmax).
При расчете сопряженности находит применение также коэффициент Чупрова:
где t – число столбцов таблицы;
k – число строк таблицы.
В психологической диагностике описанные коэффициенты используются относительно редко
Угрожающие факторы
Валидность в психологии – это свойство качественной методики, но могут возникнуть факторы, искажающие теоретически правильно построенную ПДМ. Побочные факторы сильнее проявляются в работе с плохо организованными стимулами или новыми, неясными ранее для испытуемого задачами.
Трудность составляет изучение неуравновешенных и неуверенных в себе индивидов. Главными угрозами высокой валидности являются особые характеристики тестируемого и ситуационные явления.
Достоверность результатов снижают:
- ошибки испытуемого;
- ошибки специалиста;
- ошибки, вызванные условиями или неправильного проведения диагностики.
Если диагностика не предполагает обязательного нахождения специалиста в помещении, то его присутствие может исказить результаты исследования. Комментарии и интерпретация тестовых задания тоже снижают достоверность полученных данных.
Испытуемый, заинтересованный в намеренных погрешностях тестирования или представлении себя в выгодном свете перед руководством, искажает результаты диагностики. Не меньшую опасность представляет психофизиологическое состояние тестируемого. Например, индивид сильно голоден, утомлен или страдает от мигрени.
Посторонний шум, голос, возможность обсуждать тестовые задания с другими испытуемыми, снижают точность результатов. Это относится к ошибкам условий и процедуры диагностики.
Характерные особенности эмпирической валидности
Она устанавливается внешним критерием, определяющий предметную область. Например, интеллектуальная шкала Д. Векслера WAIS, или тест Векслера включает в себя шесть заданий на вербальный интеллект, 5 – на невербальный, сенсомоторный интеллект. Задания называются субтестами, на базе результатов которых анализируют показатели интеллекта. Для оценивания шкалы вербального интеллекта используют уровень академической успеваемости, для невербальной – успешность канцелярской работы. Валидизация оценивается, с точки зрения соотношения между результатами тестирования и успеха в определенных видах деятельности. Такая валидность называется прагматической.
Определение прагматической валидизации
Считает, что валидность теста дает прогноз:
- личностных свойств человека;
- влияния на поведение индивида.
Она может не предполагать организацию соотношения. Оценивание валидизации тестирования основывается на:
- принципах квазиэксперимент;
- выделение контрастных групп.
Разработка теста по оцениванию мотивации достижения школьников. Для этого есть все необходимые документы по успеваемости учеников. Класс делят на две группы:
- с низким уровнем успеваемости;
- с высоким уровнем успеваемости.
Самый грубый метод разделения – деление по медиане, надежный – исследования каждого ребенка и правильное соотнесение в ту или иную группу.
Например, для валидизации теста применяют только результаты успеваемости учеников, входящие в первый и четвертый квартили. В конечном итоге появляется квазиэкспериментальный план. Тогда значениями ковариаты будут результаты теста.
Данный ход в вылидной прагматике определяют ретроспективным.
Понятие проспективной, конструктивной и истинной валидности теста
Первый метод используют, когда только предполагается получить критерий валидности. Здесь испытуемые выбираются по принципу вероятностного прогноза проявления измеряемого признака в популяции. Это дает больше возможности оценить причинно-следственные связи между измеряемыми свойствами и формами поведения человека.
Конструктивная валидность используется, когда нет сомнений в валидизации тестирования.
Один из способов получения валидности является применение экспертных оценок. Их получает во время наблюдения за тестированием. Полученные результаты вносятся в таблицу, где в столбцах указывают оценки экспертов (k ), а в строках – оценки испытуемых (п). Главный фактор – согласованность полученных оценок, которую определяют при помощи критерия Кронбаха (α) или формулы Спирменаа-Брауна.
Истинная валидность тестирования определяется формулой:
где ryy – соотношение с «истинным критерием», rхх – эмпирическое соотношение с критерием, αс – надежность критерия, найденная по формуле Кронбаха.
Специфика и задачи психологического эксперимента
Эксперимент направлен на доказательство или опровержение гипотезы, всегда проводится в особых экспериментальных условиях, искусственно созданных исследователем. Специфика психологического эксперимента заключается в некоторой его субъективности. Психология сталкивается с проблемами субъективности в теории и на практике.
Все знания, полученные в ходе психологических исследований, в той или иной мере субъективны, искажены сознанием испытуемого и экспериментатора. Поэтому получить полностью достоверные знания – это крайне сложная задача. Эксперимент должен соответствовать цели, задачам, исключать внешние воздействия и искажения результатов исследователем.
Задача психологического эксперимента – сделать доступными для наблюдения исследуемые психологические явления, свойства, состояния испытуемого. Для этого используется построение условий, в которых окажется тестируемый. Эти условия должны раскрывать исследуемое психическое свойство и исключать проявление других.
Психологический эксперимент отличается зависимостью от условий и уровня развития исследуемых явлений, требует строгого контроля, постоянства процесса, изоляции ненужных аспектов психики от изучаемых.
Высокая валидность применяемой методики позволяет снизить погрешность полученных результатов. Это важный фактор в психологических исследованиях, поскольку недостоверные результаты не несут никакой практической пользы.
Итог
Психология использует такое качество, как валидность, поскольку то, чем пользуется специалист, должно выдавать однозначные и конкретные результаты, которым он может доверять. Валидность – это соответствие, пригодность, достойность, достоверность, то есть качество, которое присутствует в объекте ради достижения конкретной цели, для которого он предназначен.
Валидация и верификация — что это простыми словами?
Справедливости ради надо сказать, что в разных областях деятельности (в банках, в платежных системах, в интернете), в разных отраслях производства эти термины используются по-разному. Я решила привести здесь определение валидации и верификации из стандарта ISO 9000.
Мы видим, что определения совпадают в значительной части, но не полностью. Однако, несмотря на такое большое совпадение валидация и верификация — это разные действия.
Чтобы проще было понять, что такое валидация, давайте сначала разберемся, чем валидация отличается от верификации.
Чем отличается валидация от верификации?
Итак, что такое верификация? Более детально можете узнать из этой статьи, но здесь скажем коротко, что слово «верификация» происходит от английского слова «verification» — проверка. А слово «валидация» происходит от английского «validation» — придание законной силы.
Верификация (verification) — проверкаВалидация (validation) — придание, подтверждение законной силы
Что такое валидация простыми словами
Валидация – это проверка продукта, процесса или системы на соответствие требованиям клиента. Если человек покупает смартфон, он ожидает как минимум возможности звонить, выходить в интернет и снимать на встроенную камеру. Всё это может быть прописано в инструкции по эксплуатации, но если при первом включении телефон не видит сим-карту, а снимки не сохраняются в памяти, считается, что валидация не пройдена.
В более сложных случаях данный термин обозначает соответствие того или иного процесса системе менеджмента качества. Как видим, речь идет о внешних требованиях, и этим валидация отличается от верификации, когда мерилом являются внутренние требования организации и формальное соответствие собственным нормативам и документам (камера у телефона есть, место под сим-карту есть – значит, продукт соответствует инструкции, а уж работает ли всё это с нужным качеством – выяснять покупателю). Валидация важна в первую очередь для потребителя – он убеждается, что получает именно то, что ему нужно.
Термин «валидация» произошел от английского понятия «validation» (в вольном переводе – «придание законной силы»).
Зачем нужна валидация данных?
Казалось бы, «невалидные» данные, не удовлетворяющие определённым ограничениям, могут вызвать сбой в работе программы. Но что это означает? Предположим, в каком-то месте программы возникает исключение при попытке преобразовать строку в число, если строка имеет некорректный формат. Разумеется, если исключение не будет нигде перехвачено, это может привести к аварийному завершению программы. Но это маловероятный сценарий развития событий. Скорее всего в каком-то месте сработает перехватчик, который либо выдаст пользователю какое-то сообщение об ошибке в программе, либо сделает запись в журнал ошибок, после чего программа постарается восстановиться от сбоя и продолжить работу. То есть даже если валидацию не выполнять, вполне вероятно, что ничего страшного не случится.
Но определённые негативные последствия у отсутствия валидации всё таки могут быть, давайте чуть подробнее рассмотрим, какие проблемы при этом могут возникнуть.
- Невозможность восстановиться после сбоя. Не всегда программа способна «вернуть всё назад». Возможно, в процессе работы программа выполнила какие-то необратимые действия — удалила файл, отправила данные по сети, напечатала что-то на принтер, запустила резец станка и он частично произвёл обработку заготовки детали. Но даже если восстановление в принципе возможно, алгоритм восстановления может тоже содержать ошибки, и это иногда приводит к совсем печальным последствиям.
- Дополнительная нагрузка на систему. Восстановление после сбоя — это лишняя работа. Вся работа, которая была выполнена до момента сбоя — тоже лишняя. А это означает дополнительную нагрузку на систему, которой можно избежать, если заранее проверить данные. С другой стороны, валидация — это тоже дополнительная нагрузка, причём восстановление приходится делать лишь изредка, а проверку надо выполнять каждый раз, так что ещё неизвестно, что выгоднее.
- Инъекции не вызывают сбоев. Один из основных способов эксплуатации уязвимостей в программах заключается в том, чтобы «обмануть» валидаторы, то есть передать данные, которые валидатор признаёт корректными, но при этом они интерпретируются непредусмотренным образом, так что злоумышленник может получить несанкционированный доступ к данным или некоторым возможностям программы, либо способен разрушить данные или программу. Если валидации нет вообще, задача злоумышленника максимально упрощается.
- Сложность идентификации причины проблемы. Если исключение вылетело откуда-то из глубины программы, определить причины его возникновения не так-то просто. И даже если это возможно, может оказаться нелегко объяснить пользователю, что сбой вызван данными, которые он ввёл некоторое время назад в каком-то совершенно другом месте программы. А если проверка выполнена немедленно после ввода данных, никаких сложностей с идентификацией источника проблемы не возникает.
- Короче говоря, отсутствие валидации может приводить к вышеописанным (а может быть и ещё каким-то другим) проблемам. Соответственно, наличие валидации позволяет предотвратить серьёзные сбои, упрощает идентификацию проблем, но за это приходится расплачиваться производительностью, поскольку дополнительные проверки увеличивают нагрузку на систему. И тут мы переходим ко второму вопросу — как уменьшить эту дополнительную нагрузку.
Когда требуется валидация
Валидация проводится тогда, когда невозможно оценить соответствие продукта, процесса или системы требованиям клиента до того, как клиент начнет этим продуктом пользоваться. Например, если речь идет о программном обеспечении, в него встраивается валидационный код. Этот код клиент вводит, если продукт полностью соответствует его ожиданиям и выполняет нужные задачи. В противном случае доступ к продукту прекращается и проводятся его доработки либо исполнитель возвращает деньги.
Что может быть объектом валидации
Есть несколько вариантов объектов валидации:
- Валидация оборудования;
- Валидация процесса;
- Валидация продукта
- Валидация в системе менеджмента качества (соответствие ISO);
- Валидация пользователя;
- Валидация навыков (аттестация);
- Валидация методик;
- Валидация уровня чистоты оборудования;
- и др.
Валидация оборудования
Одно дело – технические характеристики, указанные в техпаспорте продукции, а другое – как оборудование будет работать в реальных условиях. На заводе-изготовителе продукция проходит верификацию – проверку на соответствие заявленным характеристикам: габаритам, мощности, параметрам питания и так далее. А валидация проводится уже после установки оборудования на площадях клиента.
Проверка в реальных условиях может проводиться как самим производителем по заданию покупателя, так и покупателем по согласованию с производителем. Частота прохождения валидации определяется параметрами использования оборудования. Если его часто перемещают или надолго выводят из эксплуатации, а также после проведения крупных обслуживающих работ, проверка проводится после каждой манипуляции. Более подробно о способах валидации читайте в главе «Виды валидации».
Валидация процесса
Обычно речь идет о производственном процессе. Например, в фармацевтике при запуске в производство нового медикамента необходимо подтвердить, что последовательность технологических операций действительно позволит производить таблетки необходимой формы и наполнения. Валидация проводится для новых процессов, а также при внесении изменений в их структуру – план проверки оговаривается между организацией, разработавшей процесс, и компанией, использующей его. Часто валидацию проводят для процессов, которые не поддаются верификации. Например, если состояние железобетонных конструкций легко проверить на соответствие нормативам производства, то выпеченный хлеб быстро утрачивает свои первоначальные качества, и уже через неделю готовый продукт невозможно оценить, например, на уровень пропеченности. Требуется выпечь новую партию в тех же условиях, что и исследуемая.
Валидация продукта
Валидация продукции – это логическое продолжение валидации процесса. Если взять тот же пример с выпуском таблеток, то произведенное лекарство должно оказывать именно то действие, которое ожидает клиент, и которое записано в прилагаемой инструкции по применению. При валидации продукта при необходимости проводится проверка и оборудования, и производственного процесса, хотя и с несколько другими целями: выявить недостатки, мешающие производить продукт, в полной мере соответствующий ожиданиям клиента. Валидация продукта проводится при начале его производства, а также после внесения изменений в конструкцию или состав.
Валидация в системе менеджмента качества (соответствие ISO)
Стандарт ISO 9000 – это «готовая валидация» для поставщика продуктов. Если он соответствует этому стандарту, значит, его товары подходят для использования в заявленных в сопроводительных документах условиях. Валидация проводится путем экспертизы продукции, производственных процессов и документов компании. Проверка на соответствие ISO может начинаться на этапе разработки проектной документации и заканчиваться валидационными испытаниями конечного продукта.
Валидация пользователя
Это понятие, очень близкое к верификации, используется в интернет-технологиях и платежных системах. Зарегистрированный в системе или на сайте пользователь периодически подтверждает свою личность введением кода. Если код не введен или нажаты неправильные цифры, пользователь считается не прошедшим валидацию и доступ к аккаунту прекращается. Интерфейсом валидации часто пользуются мошенники, которые предлагают владельцу аккаунта ввести во всплывающем окне пароль от него. Далее аккаунт перехватывается. То же самое происходит с данными банковской карты. Нужно помнить, что банки никогда не используют для валидации пользователя секретную информацию.
Валидация пользователя применяется, например, на транспорте – там, где используются электронные устройства для проверки билетов (валидаторы). Приложил билет – это значит валидировал себя как пассажира.
Другие объекты валидации
Валидация навыков (аттестация) – знакомая многим работникам различных организаций проверка на соответствие занимаемой должности. Оценивается количество и качество знаний сотрудника применительно к выполняемым им функциям.
Валидация методик – подтверждение того, что избранная для использования на производстве или в других сферах методика контроля за результатом действительно приносит эффект. Например, есть методика обнаружения примесей в лекарственных средствах. Валидация позволяет установить, действительно ли с ее помощью фармпроизводитель может точно выявить процент тех или иных веществ в таблетках. К слову, такого рода валидация в медицине используется очень широко.
Валидация очистки – оценка уровня чистоты оборудования, необходимого для выпуска продукции с высокой точностью параметров (габаритов, однородности состава и так далее). Валидация оценивает, насколько процедура очистки позволяет добиться нужного результата в производстве конечного продукта.
Валидация данных – определение, являются ли данные допустимыми в каком-либо исследовании, дискуссии, доказательстве. Валидныеданные можно использовать в качестве исходных, невалидные – нет. Это имеет большое значение для статистических ведомств, проектных работ, исторических исследований и так далее.
Читайте также: Что такое CVC/CVV-код на карте и зачем он нужен + советы когда лучше не указывать код безопасности при оплате в интернете
Виды валидации
Всего выделяют четыре вида валидации.
Перспективная валидация
Выполняется до начала серийного производства продукции. Проверяется, насколько оборудование способно выпускать именно тот продукт, который ожидает заказчик. Также оценивается возможность бесперебойного производства большого количества продукта. Для перспективной валидации выпускают одну или несколько пробных серий продукции при тех же условиях, которые будут впоследствии обычными.
Сопутствующая валидация
Не всегда получается протестировать продукцию до начала серийного производства (например, выпуск пробных партий эксклюзивных товаров – очень дорогое удовольствие). Поэтому валидацию проводят прямо во время обычного производственного процесса.
Ретроспективная валидация (ревалидация)
Это проверка процесса серийного выпуска продукта уже после получения информации о том, как он ведет себя в реальных условиях. Наглядный пример – автомобильная промышленность. В случае получения информации, к примеру, о некачественной работе тормозной системы в тех или иных погодных условиях, отзываются отдельные модели либо вся серия автомобилей с одинаковыми характеристиками. В результате выявляются технологические производственные недоработки либо определяется, что дефекты носят случайный характер и необходимости в корректировке процесса нет.
Повторная валидация
Проводится в том случае, когда в технологический процесс внесены изменения, и нужно доказать, что они не повлияли на качество и потребительские свойства конечного продукта. Все перемены в процессах происходят обычно в соответствии с регламентом контроля изменений. При валидации проверяются и сами технологии, и документы, и конечный продукт.
Примеры валидации и верификации в разных сферах.
Без примеров трудно понять отличия валидации и верификации. Приведем несколько примеров из разных областей.
Пример из области медицины
Скажем, разработали новое лекарство. Провели многочисленные тесты для ПРОВЕРКИ, что лекарство лечит такую-то болезнь. Здесь речь идет о ВЕРИФИКАЦИИ (о проверке соответствия лекарства его предназначению). Но Вы знаете, что на самом деле лекарство подходит не всем. Чтобы начать лечение Вам нужна ВАЛИДАЦИЯ врача. Только врач может ПОДТВЕРДИТЬ, что это лекарство подойдет КОНКРЕТНО Вам..
Пример из области производства
Предположим завод по производству велосипедов принял заказ на партию велосипедов. Так вот, ВЕРИФИКАЦИЮ (ПРОВЕРКУ) на соответствие требованиям заказчика выполняет сам завод-производитель. А вот ВАЛИДАЦИЮ (ТЕСТИРОВАНИЕ, ПРОВЕРКУ) на соответствие своим требованиям будут выполнять представители самого заказчика.
Пример из области IT
Аналогичный пример можно привести из области IT. Компания — разработчик программного обеспечения получила заказ на разработку какого-то софта. Программа, которая была создана, прошла тестирование. Результатом тестирования является ВЕРИФИКАЦИЯ на стороне компании, выполняющей заказ, что программа полностью соответствует тех заданию заказчика. А вот ВАЛИДАЦИЮ будет выполнять сам заказчик, когда установит программное обеспечение и протестирует его.
Пример из сферы интернета
Социальная сеть Твиттер проводит ВЕРИФИКАЦИЮ аккаунтов знаменитостей, чтобы участники сети точно знали, что посты публикуются действительно этой знаменитостью. В результате верификации в аккаунте знаменитости появляется синий значок с галочкой.
Еще пример. Для того, чтобы стать продавцом на Амазоне, Вам необходимо пройти ВЕРИФИКАЦИЮ личности. Также необходимо пройти верификацию при регистрации аккаунтов во всех платежных системах (Вебмани, Яндекс.Деньги, Киви и т.д.)
Пример из законодательной области
Инициативный депутат решил улучшить жизнь и придумал прогрессивный Закон. Законотворческие органы выполнят ПРОВЕРКУ нового Закона на соответствие другим Законам и международному праву и ВЕРИФИЦИРУЮТ его. Но Закон вступит в силу не сразу, а только через месяц — после его ВАЛИДАЦИИ (придания законной силы) высшим органом законодательной власти. За этот месяц можно отозвать Закон, выявив вред для каких-то КОНКРЕТНЫХ слоев населения.
Например, соц сеть Твиттер верифицирует аккаунты знаменитостей для того, чтобы пользователи были уверены, что сообщения действительно публикует эта знаменитость или её официальный представитель. В аккаунте пользователя Твиттере, который прошел такую верификацию, ставится синий значок с галочкой.
Кто проводит валидацию
Если компания крупная, в ее структуре чаще всего существует специальный отдел менеджмента качества, который и организует процесс валидации. Второй вариант – привлечение сторонних специалистов из профильных фирм. В обоих случаях обратим внимание на то, что задача сотрудников СМК (кто это – инженеры по валидации или должность имеет другое название, – не так важно) – именно организация, непосредственное проведение валидационных процедур может возлагаться на любых сотрудников.
Работа в целом возглавляется либо руководителем организации, либо директором по направлению. Он ставит цели и выделяет материальные и финансовые ресурсы, а также контролирует результат.
Далее специалисты по менеджменту качества (собственные или привлеченные) выявляют процессы и продукты, нуждающиеся в валидации. Соответственно, на должностях таких специалистов должны быть люди, отлично разбирающиеся в процессах производства, имеющие опыт аудита и финансового анализа. Также им требуются навыки управления персоналом и мотивации, поскольку часто приходится убеждать производственников выполнять операции, не входящие в их непосредственные обязанности. Да и вообще необходим авторитет, чтобы задачи отдела менеджмента качества или тем более сторонней фирмы выполнялись не в последнюю очередь.
В некоторых организациях ответственность за валидацию несет коммерческий директор, который владеет всей информацией по продукту и процессам.
Где и когда выполнять валидацию данных?
Как уже было сказано выше, с точки зрения уменьшения нагрузки лучше всего вообще не выполнять валидацию данных.
Но если всё-таки проверка нужна, логика подсказывает, что удобно проверять данные в том месте, где они попадают в программу из внешнего мира. После такой проверки можно быть уверенным, что в программу попадают правильные данные и в дальнейшем они могут использоваться без дополнительных проверок.Это может быть пользовательский интерфейс, через который человек вводит данные. Это может быть файл, содержащий настройки программы или данные, которые программа должна обработать. Это может быть база данных, в которую информация может попадать из других программ. Это может быть сетевой протокол обмена данными с другими программами. Наконец, это может быть программный интерфейс, который использует другая программа, вызывая некоторые функции/процедуры и передавая в них параметры.
Увы, здравый смысл иногда вынужден отступить перед натиском действительности. «Фейс-контроль» данных на входе иногда не просто нецелесообразен, но вообще невозможен. Ниже приведены некоторые причины этого.
- Для валидации требуется доступ к недоступной части состояния системы. Это особенно характерно для проверки данных, вводимых человеком через графический интерфейс пользователя. Современные приложения часто построены с использованием многоуровневой архитектуры, которая предполагает, что реализация пользовательского интерфейса выделена в презентационный слой, а для проверки требуется доступ к другим слоям, вплоть до слоя базы данных.
Особенно хорошо это заметно для веб-приложений, где пользовательский интерфейс реализуется в браузере и выполняется на стороне клиента, а для проверки ввода требуется сравнение с тем, что хранится в базе данных. В этой ситуации проверку приходится выполнять уже после отправки данных на сервер. (Впрочем, сейчас с появлением AJAX-технологии эта проблема частично решена). - Валидация требует полностью повторить логику обработки. Как уже отмечено двумя абзацами выше, при многослойной архитектуре приложения пользовательский интерфейс обычно выделяется в специальный презентационный слой, а логика обработки данных находится на другом слое. И бывают такие ситуации, когда для валидации нужно практически полностью выполнить эту обработку, потому не существует более короткого способа понять, завершится она успехом или нет.
Как выполнять валидацию данных?
Впрочем, где бы ни выполнялась валидация, можно это делать несколькими различными способами, в зависимости от того, какие ограничения накладываются на данные.
- Посимвольная проверка. Как правило такие проверки выполняются в пользовательском интерфейсе, по мере ввода данных. Но не только. Например, лексический анализатор компилятора тоже выявляет недопустимые символы непосредственно в процессе чтения компилируемого файла. Поэтому такие проверки можно условно назвать «лексическими».
- Проверка отдельных значений. Для пользовательского интерфейса это проверка значения в отдельном поле, причём выполняться она может как по мере ввода (проверяется то неполное значение, которое введено к настоящему моменту), так и после завершения ввода, когда поле теряет фокус. Для программного интерфейса (API) это проверка одного из параметров, переданных в вызываемую процедуру. Для данных, получаемых из файла, это проверка какого-то прочитанного фрагмента файла. Такие проверки, опять-таки по аналогии с компиляторной терминологией, можно назвать «синтаксическими».
- Совокупность входных значений. Можно предположить, что в программу сначала передаются какие-то данные, после чего подаётся некоторый сигнал, который инициирует их обработку. Например, пользователь ввёл данные в форму или в несколько форм (в так называемом «визарде») и наконец нажал кнопку «OK». В этот момент можно выполнить так называемые «семантические» проверки, нацеленные на валидацию не только отдельных значений, но и взаимосвязей между ними, взаимных ограничений.
Вполне возможна ситуация, когда каждое отдельное значение «синтаксически» корректно, но вместе они образуют несогласованный набор. Для программного интерфейса эта разновидность валидации предполагает проверку набора входных параметров вызываемой процедуры, для случая получения данных из файла это проверка всех прочитанных данных. - Проверка состояния системы после обработки данных. Наконец, есть последний способ, к которому можно прибегнуть, если валидацию непосредственно входных данных выполнить не удаётся — можно попытаться их обработать, но оставить возможность вернуть всё к исходному состоянию. Такой механизм часто называется транзакционным.
Транзакция — это последовательность действий, которые либо все завершаются успешно, либо происходит какой то сбой при выполнении отдельного действия, и тогда отменяются результаты всех предыдущих действий этой цепочки. Так вот, валидацию можно выполнять в процессе выполнения транзакции, а последняя проверка может быть выполнена в самом конце транзакции по обработке данных. При этом мы валидируем уже не сами данные, а то состояние, которое получилось после их полной обработки, и если это состояние не удовлетворяет каким-то ограничениям, тогда мы признаём входные данные невалидными и возвращаем всё к исходному состоянию.
Какой способ валидации следует применять на практике в том или ином случае? Чаще всего одним способом ограничиться не удаётся, да и не нужно. Валидацию данных можно и нужно выполнять в несколько этапов, усложняя проверки.
Сначала, по мере ввода, следим за тем, чтобы данные не содержали недопустимых символов. Например, для числового поля пользователю может быть запрещён ввод нецифровых символов.
После того, как ввод завершён, можно проверить всё значение целиком. Для введённого числа могут быть какие-то ограничения, например, оно не должно превышать определённого максимального допустимого значения. Если наше числовое поле представляет собой возраст, оно должно находиться в пределах от 0 до, скажем, 120.
Когда заполнены все поля, можно проверить, согласованы ли введённые значения друг с другом. Например, если в форме кроме поля для указания возраста есть поле для ввода номера паспорта, приложение может проверить, что при заполнении номера паспорта возраст должен быть не менее 14 лет.
Наконец, если всё введено корректно, можно попытаться начать обработку, выполняя проверки по ходу дела, а также в самом конце, и если что-то пошло не так, выполнить откат к исходному состоянию.
Ну и, конечно же, проверки на следующем уровне могут подстраховывать проверки предыдущих уровней. Скажем, для веб-приложений обязательной является проверка данных, пришедших на сервер в HTTP-запросе, независимо от того, выполнялась ли перед этим предварительная валидация в браузере или нет. Причина этого в том, что проверку на клиентской стороне можно обойти. Для других видов приложений обойти проверки не так просто, но иногда тоже вполне возможно, как показано в примере чуть ниже.
Тестирование валидаторов
Завершим статью демонстрацией различных видов валидаторов, а также некоторыми рекомендациями относительно того, как при тестировании проверять правильность их работы.
Начнём с посимвольной проверки. Графический редактор Paint, диалог изменения размеров рисунка, ширина рисунка. В это поле допускается вводить только цифры, при попытке ввести другие символы выдаётся сообщение об ошибке:
Однако, проявив смекалку, можно обойти эту валидацию вводимых символов: через буфер обмена удаётся вставить в это поле отрицательное число, несмотря на то, что минус является недопустимым символом:
Впрочем, это не приводит к негативным последствиям, потому что на следующем уровне стоит ещё одна проверка, которая срабатывает при нажатии кнопки OK:
Есть и другие ограничения для этого поля, которые тоже проверяются после нажатия кнопки OK:
А вот находящееся совсем рядом в том же диалоге поле для ввода наклона рисунка не содержит валидации символов, несмотря на то, что это тоже числовое поле. Более того, при вводе недопустимых символов после нажатия OK можно увидеть вот такое странное сообщение, практически не поддающееся расшифровке:
Все вышеописанные примеры связаны с проверкой отдельно взятого поля. Пример валидации комбинации полей можно найти в том же приложении, но в другом месте — в диалоге настройки параметров страницы для печати. Если указать размеры полей страницы так, чтобы в сумме они превосходили ширину страницы, получим вот такое сообщение:
Ну и, наконец, в заметке «Почему не хватает памяти, чтобы уменьшить размеры рисунка?» описана ошибка, связанная с тем, что в этом графическом редакторе отсутствует корректная обработка сбоев и откат транзакции при слишком сильном увеличении размера рисунка.
Тестировщику необходимо все эти ситуации отрабатывать. Во-первых, нужно проверять валидацию на всех уровнях. Во-вторых, нужно проверять согласованность валидаторов на разных уровнях. В-третьих, надо искать пути обхода валидаторов, пытаясь добраться до следующего уровня без предварительных проверок.
Этапы валидации
Выделяют этапы валидации.
Название | Содержание |
Этап 1: Спецификация требований пользователей (международная аббревиатура URS) | Общее описание того, что ждут пользователи от системы, процесса или продукта. |
Этап 2: Специализация функций (FS) | Подробно расписывается, каким стандартам должны соответствовать система, процесс или продукт, чтобы удовлетворить требования пользователей. |
Этап 3: Спецификация (DS) | Полное описание проектных, технических и иных характеристик системы, процесса или продукта, параметров оборудования. |
Этап 4: Оценка (квалификация) монтажа (IQ) | Проверяются документы, подтверждающие, что система, процесс или продукт созданы в соответствии с необходимыми стандартами и требованиями. |
Этап 5: Проверка (квалификация) функционирования (OQ) | Оценивается, действуют ли система, процесс или продукт в заявленных в спецификации условиях. Если в спецификации к автомобилю указано, что он разгоняется до 100 км/ч за 10 секунд, эти данные проверяются на ровном полигоне без встречного и попутного потока. |
Этап 6: Проверка (квалификация) эксплуатации (PQ) | Оценивается, как действуют система, процесс или продукт в конкретных условиях. Применительно к примеру о разгоне автомобиля до 100 км/ч проверяется, может ли он сделать это за 10 секунд в обычных дорожных условиях. |
По каждому из этапов составляются протоколы, а затем итоговый документ, который подписывают все специалисты, проводившие валидацию, и руководитель. По результатам проверки могут разрабатываться рекомендации – это означает, что систему, процесс или продукт требуется доработать, и только после этого они будут считаться валидными.
Практический совет
Вы спросите, для чего нужно разбираться в этих терминах? Скажу, что есть и практическая польза. Главная цель верификации и валидации — безопасность, чтобы Ваши банковские карты и аккаунты были защищены. Однако, пользуясь тем, что многие не разбираются в этих терминах, злоумышленники для похищения личных данных часто применяют такой способ, как сообщение с просьбой верифицировать или валидировать вашу банковскую карту, аккаунт и т.д..
Практический совет: При появлении окна с просьбой верификации или валидации Ваших данных проверьте в адресной строке данные сайта, нет ли пропущенных или лишних символов. Либо попробуйте зайти в эту программу с другого устройства и если такого сообщения не появляется, значит Ваш компьютер надо лечить от опасных вирусов.
Часто задаваемые вопросы
Чем валидация отличается от верификации?
Верификация – это соответствие системы, процесса или продукта требованиям производителя (нормативам, инструкциям, техническим характеристикам и т.д.). Валидация – это соответствие требованиям пользователя. Также между ними следующие отличия:
- валидацию проводят тестировщики или пользователи, верификацию – производитель;
- задача верификации – проверить, соблюдены ли требования к производству; задача валидации – проверить, соблюдены ли требования потребителя к конечному продукту;
- верификация проводится в обязательном порядке, валидация – только если того требуют стандарты или потребители;
- верификация всегда объективна (продукт может либо соответствовать указываемым техническим характеристикам, либо нет); валидация субъективна (насколько успешно продукт можно использовать в конкретных условиях, определяют люди).
Что такое валидация аккаунта в соцсети? Для чего она нужна?
Процедура валидации аккаунта максимально приближена к верификации: пользователь документально подтверждает то, что он – реальный владелец аккаунта и производит все действия, которые с этого аккаунта совершаются. Физически подтверждение проводится через привязку вашей страницы в соцсети к номеру телефона (зайти в свой аккаунт вы можете только с использованием того номера, с которым связана страница). Без валидации аккаунта невозможно пользоваться соцсетью (доступен лишь просмотр ограниченного количества страниц). Любые же действия с вашего аккаунта автоматически считаются совершенными вами.
Конечно, валидация аккаунта не дает стопроцентной гарантии соответствия страницы владельцу телефонного номера. Существуют сервисы виртуальных номеров для валидации, сим-карту можно купить на чужой паспорт, но все это – уже не совсем разрешенные методы, за которые в некоторых случаях можно понести ответственность.
- https://healthperfect.ru/validnost-v-psihologii.html
- https://hr-portal.ru/article/validnost-testa
- https://FB.ru/article/259956/nadejnost-i-validnost-testa—eto-chto-takoe
- https://Zaochnik.com/spravochnik/psihologija/matematicheskie-metody-v-psihologii/validnost-testov/
- https://psy-files.ru/psychology/vnutrennaa-validnost-psihologiceskogo-issledovania.html
- https://gabysheva.ru/samorazvitie/validizaciya-eto.html
- https://web-ru.net/prodvizhenie-sajta/seo/ne-validnyj-kod-chto-eto-mnenie-google.html
- https://biznes-prost.ru/validnost.html
- https://miss-runet.ru/otnosheniya/vnutrennyaya-i-vneshnyaya-validnost.html
- https://gabysheva.ru/otnosheniya-m-zh/vnutrennyaya-validnost-2.html
- https://obu4ayka.ru/otnosheniya/vneshnyaya-validnost-psihologiya.html
- https://kartaslov.ru/%D0%BA%D0%B0%D1%80%D1%82%D0%B0-%D0%B7%D0%BD%D0%B0%D0%BD%D0%B8%D0%B9/%D0%92%D0%BD%D0%B5%D1%88%D0%BD%D1%8F%D1%8F%20%D0%B2%D0%B0%D0%BB%D0%B8%D0%B4%D0%BD%D0%BE%D1%81%D1%82%D1%8C
- https://psytheater.com/validnost-ponyatie-v-psihologii.html
- http://alenakraeva.com/new-digital-world/validaciya-chto-eto-prostymi-slovami/
- https://myrouble.ru/validation/
- https://habr.com/ru/post/72796/