Стандартные показатели это: Стандартный показатель — это… Что такое Стандартный показатель?

Содержание

Стандартный показатель — это… Что такое Стандартный показатель?


Стандартный показатель
IQ (deviation IQ). Показатель в стандартизованных тестах интеллекта, основанный на сравнении (в единицах стандартного отклонения) результата индивидуума со средним значением распределения результатов других лиц того же возраста.

Психология развития. — СПб.: Питер. Грэйс Крайг, Дон Бокум. 2005.

  • Стадии
  • Старение естественное

Смотреть что такое «Стандартный показатель» в других словарях:

  • Показатель отказов — (англ. bounce rate) термин в веб аналитике, обозначающий процентное соотношение количества посетителей, покинувших сайт прямо со страницы входа или просмотревших не более одной страницы сайта.[1] Содержание 1 Определение 2 Сре …   Википедия

  • показатель — 3.7 показатель (indicator): Мера измерения, дающая качественную или количественную оценку определенных атрибутов, выведенную на основе аналитической модели, разработанной для определенных информационных потребностей. Источник …   Словарь-справочник терминов нормативно-технической документации

  • показатель точности результатов измерений — 3.1.3 показатель точности результатов измерений: Установленная характеристика точности результатов измерений, полученных по методике измерений. Примечание Характеристики точности указывают: неопределенность в соответствии с рекомендациями [1];… …   Словарь-справочник терминов нормативно-технической документации

  • стандартный воздух — 2.51 стандартный воздух: Сухой воздух при 20 °C и стандартном барометрическом давлении 101,325 кПа, с массовой плотностью 1,204 кг/м3. Источник …   Словарь-справочник терминов нормативно-технической документации

  • стандартизованный показатель — (син. стандартизованный коэффициент) статистический показатель в форме, косвенно устраняющей влияние возрастных, половых и других особенностей состава исследуемой группы (совокупности) путем приведения его к составу, принятому за стандартный;… …   Большой медицинский словарь

  • цитирование в науке —         ЦИТИРОВАНИЕ В НАУКЕ факт бытия науки и объект науковедческого исследования, надежность которого определяется самой традицией науки как социального института. Феномен цитирования является неоспоримо важной этической нормой в науке,… …   Энциклопедия эпистемологии и философии науки

  • КОЭФФИЦИЕНТ ИНТЕЛЛЕКТА — (англ. intelligence quotient, IQ) отношение умственного возраста к хронологическому возрасту индивида, выраженное в процентах. К. и. сугубо относительный показатель: он отражает лишь уровень выполнения данного конкретного теста интеллекта и не… …   Большая психологическая энциклопедия

  • ВЕКСЛЕРА ШКАЛЫ — (англ. Wechsler scales) батареи тестов для измерения интеллекта, разработанные амер. психологом Дэвидом Векслером (1896 1981). В 1937 г. вышла 1 м, а в 1946 2 м изд. т. н. шкала Векслера Беллвью (Wechsler Bellevue scale; «Bellevue» название… …   Большая психологическая энциклопедия

  • Словарный тест в картинках Пибоди (Peabody picture vocabulary test) — Тест Пибоди представляет собой 175 страничный буклет, каждая страница к рого содержит 4 ил. широко распростр. объектов, таких как игрушки, кухонные принадлежности и животные. Тест проводится следующим образом: экзаменатор наз. стимульное слово… …   Психологическая энциклопедия

  • Топливо — для транспорта Здесь, на автозаправочной станции, утоляют вечную жажду двигателей, которые дарят человеку возможность с комфортом перемещаться на дальние расстояния. Самое распространенное топливо для транспорта – бензин. Более того, на… …   Нефтегазовая микроэнциклопедия

Высшее образование БГПУ

Лекция по учебной дисциплине «Основы психолого-педагогической диагностики», тема «Психометрические основы диагностики»

Тема «Психометричекие основы диагностики»

  1. Стадартизация.
  2. Нормы и нормативные показатели.
  3. Измерительные шкалы
  4. Психометрические критерии оценки психодиагностической методики: надежность, валидность репрезентативность.
  5. Технология создания и адаптации психодиагностических методик.

 

Стандартизация и стандартные показатели.

Диагностическая методика отличается от любой исследовательской тем, что она стандартизирована. Стандартизация — это единообразие процедуры проведения и оценки выполнения теста. Рассматривается она в двух планах:

♦ как выработка единых требований к процедуре эксперимента;

♦ как определение единого критерия оценки результатов диагностических испытаний.

Стандартизация процедуры эксперимента подразумевает унифика­цию инструкций, бланков обследования, способов регистрации резуль­татов, условий проведения обследования.

К числу требований, которые необходимо соблюдать при проведе­нии эксперимента, можно, например, отнести такие:

1) инструкции следует сообщать испытуемым одинаковым образом, как правило, письменно; в случае устных указаний они даются в разных группах одними и теми же словами, понятными для всех, в одинаковой манере;

2) ни одному испытуемому не следует давать никаких преимуществ перед другими;

3) в процессе эксперимента не следует давать отдельным испытуемым дополнительные пояснения;

4) эксперимент с разными группами следует проводить в одинако­вое, по возможности, время дня, в сходных условиях;

5) временные ограничения в выполнении заданий для всех испыту­емых должны быть одинаковыми и т. д.

Обычно авторы методики в руководстве приводят точные и подроб­ные указания по процедуре ее проведения. Формулирование таких указаний составляет основную часть стандартизации новой методи­ки, так как только строгое их соблюдение дает возможность сравнить между собой показатели, полученные разными испытуемыми.

Другим наиболее важным этапом в стандартизации методики явля­ется выбор критерия, по которому следует проводить сравнение ре­зультатов диагностических испытаний, поскольку диагностические методики не имеют заранее определенных стандартов успешности или неудачи в их выполнении.

Так, например, ребенок шести лет, выполняя тест умственного развития, получил балл, равный 117. Хорошо это или плохо? Часто ли такой показатель встречается у детей данного возраста? Количественный результат как таковой ничего не означает. Полученный дошколь­ником балл нельзя интерпретировать как показатель относительно вы­сокого, среднего или низкого развития, так как это развитие выражено в мерах, присущих данной методике, и, таким образом, абсолютного значения полученные результаты иметь не могут. Очевидно, нужно располагать точкой отсчета и какими-то дозированными мерами, что­бы с их помощью оценивать полученные при диагностировании инди­видуальные и групповые данные. Возникает вопрос, что за эту точку отсчета брать?

В традиционном тестировании такая точка добывается статистическим путем — это так называемая

статистическая норма.

В общих чертах стандартизация диагностической методики, ориен­тированной на норму, осуществляется путем ее проведения на большой представительной выборке испытуемых, которая ничем не отли­чается от той, для которой данная методика предназначена. На этой группе испытуемых, называемой выборкой стандартизации, разрабатываются нормы, указывающие не только средний уровень выпол­нения, но и его относительную вариативность выше и ниже среднего уровня. В результате можно оценить разные степени успешности или неуспешности в выполнении диагностической пробы. Это позволяет определить положение конкретного испытуемого относительно выборки стандартизации.

Для вычисления статистической нормы психологи-диагносты об­ратились к приемам математической статистики.

Кроме статистической нормы, основой для сравнения, интерпретации результатов диагностических испытаний могут стать и такие показатели, как процентили.

Процентиль — это процентная доля индивидов из выборки стандар­тизации, первичный результат которых ниже данного первичного показателя.

 

Например, если 28 % людей правильно решат не более 15 задач в арифметическом тесте, то первичному показателю 15 соответствует 28-й про­центиль (Р28). Процентили указывают на относительное положение ин­дивида в выборке стандартизации. Их также можно рассматривать, как ранговые градации, общее число которых равно 100, с той лишь разницей, что при ранжировании принято начинать отсчет сверху, т. е. с луч­шего члена группы, получающего ранг 1. В случае же процентилей от­счет ведется снизу, поэтому чем ниже процентиль, тем хуже позиция индивида.

 

50-й процентиль (Р50) соответствует медиане — одному из показателей центральной тенденции. Процентили свыше 50 представляют показатели выше среднего, а те, которые лежат ниже 50, — сравнительно низкие показатели. 25-й и 75-й процентили известны также под названием 1-го и 3-го квартилей, поскольку они выделяют нижнюю и верхнюю четверти распределения. Как и медиана, они удобны для описания распределения показателей и сравнения с другими распреде­лениями.

Процентили не следует смешивать с обычными процентными пока­зателями. Последние являются первичными показателями и представляют собой процент правильно выполненных заданий, тогда как процентиль — это производный показатель, указывающий на долю от общего числа членов группы.

Процентильные показатели обладают рядом достоинств, в частности:

♦ их легко рассчитать и понять даже сравнительно неподготовленному человеку;

♦ их применение достаточно универсально и подходит к любому типу тестов.

Однако недостаток процентилей — это существенное неравенство единиц отсчета в том случае, когда анализируются крайние точки рас­пределения. При использовании процентилей (как уже отмечалось вы­ше) определяется только относительное положение индивидуальной оценки, но не величина различий между отдельными показателями.

Выборка стандартизации. При разработке и применении любой точки отсчета следует обращать особое внимание на выборку испыту­емых, на которой проводится стандартизация диагностической мето­дики. В математической статистике принято различать такие понятия, как генеральная совокупность (популяция) и выборка.

Всякая большая совокупность людей, которую хотели бы исследо­вать или относительно которых собираются делать выводы, называет­ся генеральной совокупностью.

Выборка это часть или подмножество совокупности. Проводить исследование всей популяции не принято. Обычно из нее выделяют группу людей — выборку стандартизации — которая реально подверга­ется тестированию, и с ее помощью оценивается генеральная совокуп­ность. Чтобы оценки носили достоверный характер, выборка должна быть репрезентативна, представительна рассматриваемой популя­ции, т. е. ее вероятностные свойства должны совпадать или быть близ­кими к свойствам генеральной совокупности.

 

А. Анастази [10, т. 1] приводится пример формирования репрезентативной выборки при стандартизации шкалы Векслера. Выборка вклю­чала 1700 человек с равным количеством мужчин и женщин. Испытуе­мые в возрасте от 16 до 64 лет были распределены по семи возрастным уровням. При формировании выборки исследователи опирались на дан­ные последней переписи населения США. Учитывалось пропорциональ­ное распределение населения по географическим районам, принадлеж­ность к городскому и сельскому населению, принадлежность к белой или цветной расе, учитывались также уровень образования и профес­сия. На каждом возрастном уровне в выборку были введены один муж­чина и одна женщина, находящиеся в учреждениях для умственно от­сталых.

 

По мнению А. Анастази, подавляющее большинство диагностиче­ских методик стандартизовано не для столь широких популяций, как многие полагают. Трудно рассчитывать, что по какому-либо тесту имеются адекватные нормы для таких обширных популяций, как, напри­мер, «взрослые американцы-мужчины» или «американские дети 14-лет­него возраста». Выборки, ориентированные на широкие популяции, не всегда репрезентативны и чаще всего бывают смещены в тех или иных отн

Стандартизация теста. Этапы стандартизации. Стандартные показатели. Статистические нормы.

Стандартизация теста – это процесс унификации, регламентации, приведения к единым нормативам процедуры психодиагностики и тестовых показателей. При применении стандартизации осуществляется сопоставление экспериментальных данных, полученных при помощи методик различной размерности. В результате обработки тестовых показателей получают сырые баллы, которые переводятся в соответствии с законом нормального распределения.

Процедура стандартизации включает в себя три этапа:

Первый этапстандартизации психологического теста состоит в создании единообразной процедуры тестирования. Она включает определение следующих моментов диагностической ситуации:

1. условия тестирования (помещение, освещение и др. внешние факторы). Очевидно, что объем кратковременной памяти лучше измерять (например, с помощью субтеста повторения цифровых рядов в тесте Векслера), когда нет внешних раздражителей, таких как посторонние звуки, голоса и т.д.

2. Содержание инструкции и особенности ее предъявления (тон голоса, паузы, скорость речи и т.д.). Например, в тесте «10 слов» каждое слово должно предъявляться через определенный интервал времени в секундах.

3. Наличие стандартного стимульного материала. Например, достоверность полученных результатов существенно зависит от того, предлагаются ли респонденту изготовленные самодельные карты Г.Роршаха или стандартные – с определенной цветовой гаммой и цветовыми оттенками.

4. Временные ограничения выполнения данного теста. Например, для выполнения теста Равена взрослому респонденту дается 20 минут.

5. Стандартный бланк для выполнения данного теста. Использование стандартного бланка облегчает процедуру обработки.

6. Учет влияния ситуационных переменных на процесс и результат тестирования. Под переменными подразумевается состояние испытуемого (усталость, перенапряжение и т.д.), нестандартные условия тестирования (плохое освещение, отсутствие вентиляции и др.), прерывание тестирования.

7. Учет влияния поведения диагноста на процесс и результат тестирования. Например, одобрительно-поощряющее поведение экспериментатора во время тестирования может восприниматься респондентом как подсказка «правильного ответа» и др.

8. Учет влияния опыта респондента в тестировании. Естественно, что респондент, который уже не в первый раз проходит процедуру тестирования, преодолел чувство неизвестности и выработал определенное отношение к тестовой ситуации. Например, если респондент уже выполнял тест Равена, то, скорее всего, не стоит предлагать ему его во второй раз.

Второй этапстандартизации психологического теста состоит в создании единообразной оценки выполнения теста: стандартной интерпретации полученных результатов и предварительной стандартной обработки. Этот этап предполагает также сравнение полученных показателей с нормой выполнения этого теста для данного возраста (например, в тестах интеллекта), пола и т.д. (см. ниже).

Третий этапстандартизации психологического теста состоит в определении норм выполнения теста.

 

Стандартные показатели:

1. Первичнные (показатели, полученные после обработки данных выполнения респондентом тестовых заданий; «сырые баллы»)

2. Производные (показатели, полученные путем математической обработки первичных данных)

· Наиболее распространенным преобразование первичных оценок являются центрирование и нормирование посредством среднеквадратических отклонений. Процедура нормирования заключается в переходе к другим единицам измерения. В качестве функции нормирования обычно выступает Z-показатель(стандартный показатель), который выражает отклонение индивидуального результата Х в единицах, пропрорциональных стандартному отклонению.

· Более широкое распространение в психодиагностике получили стандартные показатели, рассчитываемые на основе линейного и нелинейного преобразования первичных показателей, распределенных по нормальному или близкому к нормальному закону. При таком расчете проводится z-преобразование оценок. Чтобы определить z-стандартный показатель, определяют разность между индивидуальным первичным результатом средним значением для нормальной группы, а затем делят эту разность на δ нормативной выборки.

Статистические нормы:

Нормы необходимы при интерпретации тестовых результатов (первичных показателей) в качестве эталона, с которым сравниваются результаты тестирования.

Статистические нормы

А. Статистические нормы. Граничные значения на шкале тестовых баллов, образованные на основе частотного распределения тестовых баллов в выборке стандартизации. Как правило, эти граничные значения отделяют от выборки фиксированный процент испытуемых: (дециль), 25 (квартиль), 50 (медиана). При нормальном распределении статистическая норма описывается с помощью параметров (среднее плюс/минус сигма, или стандартное отклонение). Статистические нормы служат принятию «сравнительный решения» и не дают информации для принятии «нормативных решений»

Б. Возрастные нормы – частные варианты психодиагностических норм, собранные для детей разного возраста.

В. Критериальныенормы — диагностические нормы, в которых задано соответствие между тестовыми баллами по шкале измеряемого свойства и уровнем критериального показателя. В случае критериального поведения критериальныенормы указывают на вероятность появления критериального поведения при данном значении тестового балла.

Г. Школьные нормы разрабатываются на основе тесов школьных достижений или тестов школьных способностей.

Д. Профессиональный нормы. Устанавливаются на основе тестов для различных профессиональных групп.

Е. Локальные нормы. Устанавливаются для узких категорий людей, отличающихся наличием общего признака – возраста, пола, географического района, социоэкономического статуса.

Ж. Национальные нормы. Разрабатываются для представителей данной нации или страны в целом.

 


Читайте также:


Рекомендуемые страницы:

Поиск по сайту

Стандартные показатели — Студопедия

Наиболее показательные характеристики физического развития – масса и длина тела, окружность грудной клетки, окружность талии. Дело не только в том, что эти размеры проще всего определить. Эти признаки несут информацию о темпах и особенностях роста организма, позволяют оценить сбалансированность питания и специфику обменных процессов, а стало быть, и функциональные особенности организма.

Наряду с этим часто оценивают и другие факторы – окружности отдельных сегментов тела (бедра, голени, плеча), кожно-жировые складки, а также силу кисти, становую силу, жизненную емкость легких.

При оценке физического развития определяют сначала длину тела, а затем соответствие ей массы тела и длин окружностей сегментов тела. Их соотношение позволяет описать три важнейшие составляющие физического развития: скелет, мускулатуру и жироотложение.

При любой длине тела (кроме резко сниженной или чрезмерно высокой) физическое развитие считается средним (или гармоничным), если значения окружности грудной клетки и массы тела отличаются от среднего не более чем на 1 s (s – стандартное отклонение).

Детям и подросткам среднего и выше среднего уровней физического развития присущи соответствующие функциональные показатели сердечно-сосудистой и дыхательной систем, хорошее развитие мускулатуры.

Для оценки показателей физического развития используют специальные таблицы – нормативы, или стандарты, физического развития. Они неодинаковы для ровесников, проживающих в разных климатогеографических условиях, а также в городе и на селе. В качестве стандартов используются результаты антропометрических измерений больших (не менее 100–150 человек), однородных по полу, возрасту и другим признакам групп населения. Стандарты физического развития всегда имеют региональный характер, причем в пределах регионов, населенных разными этническими группами, должны использоваться стандарты, разработанные отдельно для представителей этих групп. Это особенно важно для районов Крайнего Севера, Дальнего Востока, Кавказа, Поволжья и других регионов, где вместе проживают представители разных этносов, имеющих между собой существенные генетически предопределенные антропологические различия. Так, масса тела детей большинства северных народностей, как и их рост, в большинстве случаев ниже нормативных средних показателей. При этом относительно малый рост детей и взрослых вовсе не является фактором риска для здоровья, их физическое развитие гармонично.


Свойственная индивидуальному развитию неравномерность увеличения размеров тела усиливается еще более в зависимости от сезонных факторов (естественных – продолжительности светового дня, интенсивности солнечного и ультрафиолетового облучения, а также микросоциальных, связанных с учебными нагрузками, питанием, отдыхом и т.п.). Поэтому оценку показателей физического развития обычно стараются проводить в одни и те же периоды календарного года. Так легче выявить тенденции к задержке или отрицательным сдвигам характеристик физического развития, которые могут свидетельствовать о нарушении здоровья. Стандарты необходимо обновлять не реже 1 раза в 5–10 лет.



стандартный показатель — это… Что такое стандартный показатель?


стандартный показатель
standard measure

Большой англо-русский и русско-английский словарь. 2001.

  • стандартный подсимплекс
  • стандартный пользовательский интерфейс

Смотреть что такое «стандартный показатель» в других словарях:

  • Стандартный показатель — IQ (deviation IQ). Показатель в стандартизованных тестах интеллекта, основанный на сравнении (в единицах стандартного отклонения) результата индивидуума со средним значением распределения результатов других лиц того же возраста …   Психология развития. Словарь по книге

  • Показатель отказов — (англ. bounce rate) термин в веб аналитике, обозначающий процентное соотношение количества посетителей, покинувших сайт прямо со страницы входа или просмотревших не более одной страницы сайта.[1] Содержание 1 Определение 2 Сре …   Википедия

  • показатель — 3.7 показатель (indicator): Мера измерения, дающая качественную или количественную оценку определенных атрибутов, выведенную на основе аналитической модели, разработанной для определенных информационных потребностей. Источник …   Словарь-справочник терминов нормативно-технической документации

  • показатель точности результатов измерений — 3.1.3 показатель точности результатов измерений: Установленная характеристика точности результатов измерений, полученных по методике измерений. Примечание Характеристики точности указывают: неопределенность в соответствии с рекомендациями [1];… …   Словарь-справочник терминов нормативно-технической документации

  • стандартный воздух — 2.51 стандартный воздух: Сухой воздух при 20 °C и стандартном барометрическом давлении 101,325 кПа, с массовой плотностью 1,204 кг/м3. Источник …   Словарь-справочник терминов нормативно-технической документации

  • стандартизованный показатель — (син. стандартизованный коэффициент) статистический показатель в форме, косвенно устраняющей влияние возрастных, половых и других особенностей состава исследуемой группы (совокупности) путем приведения его к составу, принятому за стандартный;… …   Большой медицинский словарь

  • цитирование в науке —         ЦИТИРОВАНИЕ В НАУКЕ факт бытия науки и объект науковедческого исследования, надежность которого определяется самой традицией науки как социального института. Феномен цитирования является неоспоримо важной этической нормой в науке,… …   Энциклопедия эпистемологии и философии науки

  • КОЭФФИЦИЕНТ ИНТЕЛЛЕКТА — (англ. intelligence quotient, IQ) отношение умственного возраста к хронологическому возрасту индивида, выраженное в процентах. К. и. сугубо относительный показатель: он отражает лишь уровень выполнения данного конкретного теста интеллекта и не… …   Большая психологическая энциклопедия

  • ВЕКСЛЕРА ШКАЛЫ — (англ. Wechsler scales) батареи тестов для измерения интеллекта, разработанные амер. психологом Дэвидом Векслером (1896 1981). В 1937 г. вышла 1 м, а в 1946 2 м изд. т. н. шкала Векслера Беллвью (Wechsler Bellevue scale; «Bellevue» название… …   Большая психологическая энциклопедия

  • Словарный тест в картинках Пибоди (Peabody picture vocabulary test) — Тест Пибоди представляет собой 175 страничный буклет, каждая страница к рого содержит 4 ил. широко распростр. объектов, таких как игрушки, кухонные принадлежности и животные. Тест проводится следующим образом: экзаменатор наз. стимульное слово… …   Психологическая энциклопедия

  • Топливо — для транспорта Здесь, на автозаправочной станции, утоляют вечную жажду двигателей, которые дарят человеку возможность с комфортом перемещаться на дальние расстояния. Самое распространенное топливо для транспорта – бензин. Более того, на… …   Нефтегазовая микроэнциклопедия

Первичные статистики в психологическом исследовании: среднее, стандартное отклонение

Первичные описательные статистики – это наиболее простые характеристики, которыми можно описать психологические данные, которые были получены в ходже тестирования испытуемых.

К наиболее часто используемым в курсовых и дипломных по психологии описательным статистикам можно отнести:

  • среднее значение;
  • стандартное отклонение.

 

Среднее значение

Простейшая математическая процедура, которую необходимо освоить студенту-психологу при написании диплома – расчет среднего значения.

Среднее значение или среднее арифметическое – это число, получаемое как сумма нескольких показателей, деланная на количество этих показателей. Например, в результате тестирования были получены показатели тревожности в группе из 10-ти человек. Чтобы получить среднее значение тревожности по группе нужно сложить показатели всех испытуемых, а затем получившуюся сумму разделить на 10.

Среднее значение характеризует группу целиком. Зная среднее можно оценить показатели каждого испытуемого относительно остальных. Например, измеряемая в приведённом выше примере тревожность могла быть от 1 до 5 баллов. Пусть средняя по группе тревожность оказалась 3,5 балла. Тогда, показатель испытуемого в 4 балла можно считать относительно высоким, а в 2 балла- относительно низким.

Среднее значение относится к показателям центральной тенденции и отражает степень выраженности показателя в группе. Стандартное отклонение отражает степень изменчивости признака в группе, но о нем речь впереди.

Среднее значение какого-либо показателя характеризует группу в целом и позволяет сравнивать ее с другими группами. Например, проведена диагностика уровня эмпатии в группе мужчин и женщин. Как узнать, влияет ли пол на способность к эмпатии. Один из способов – найти средний уровень этого показателя в группах мужчин и женщин. Например, в группе женщин средний уровень эмпатии равен 23,5 баллов, а в группе мужчин – 17,7 баллов. Как видно, в среднем у женщин эмпатия выше, чем у мужчин.

Важно отметить, среднее значение – это не просто число, а – статистическое – полученное в результате особой процедуры. Поэтому и сравнивать средние значения как обычные числа нельзя. Для сравнения средних значений используются дополнительные процедуры – расчет статистических критериев. Например, U-критерий Манна-Уитни или t-критерий Стъюдента.

Среднее – это не единственный статистический показатель, который отражает выраженность переменной в группе. Аналогичную функцию выполняют мода и медиана. Однако они редко используются в дипломах по психологии.

Средние значения выраженности психологических показателей в курсовой или дипломной по психологии представляются в виде таблиц и диаграмм. В таблицах среднее обозначается буквой «М».

 

Стандартное отклонение

Если среднее арифметическое отражает выраженность показателя в группе, то стандартное отклонение (среднеквадратичное отклонение) показывает его разброс данных или изменчивость. Чем больше величина стандартного отклонения, тем больше разброс показателей в группе испытуемых.

Например, группу мальчиков протестировали методикой на выявление уровня эгоцентризма, показатели которого изменяются от 1 до 10. Расчет среднего показал М=6,5, а стандартное отклонение σ=3 (стандартное отклонение обозначается буквой «сигма»). Эти данные позволяют нам говорить о том, что подавляющее большинство показателей эгоцентризма мальчиков укладываются в диапазон от 3,5 до 9,5 (среднее плюс/минус стандартное отклонение – М ± σ).

Если при тестировании группы девочек среднее значение М=5, а стандартное отклонение σ=1, то большинство испытуемых этой группы имеют эгоцентризм в диапазоне от 4 до 6 (5 ± 1).

Анализирую такие данные в дипломе по психологии можно указать, что средний уровень эгоцентризма у мальчиков больше, чем у девочек. При этом разброс показателей эгоцентризма у мальчиков также больше, чем у девочек, то есть, в группе мальчиков есть испытуемые с очень низкими и очень высокими показателями относительно среднего. У девочек показатели менее «разбросаны» относительно среднего.

 

Расчет среднего и стандартного отклонения

Формула расчета среднего очень проста и этот параметр можно рассчитать вручную.

Пример расчёта среднего

В таблице приведены показатели, полученные по тесту диагностики уровня одиночества у 64-х испытуемых.

№ исп.

Уровень одиночества

1

13

2

14

3

5

4

11

5

17

6

9

7

18

8

6

9

9

10

9

11

15

12

14

13

7

14

9

15

8

16

13

17

12

18

14

19

19

20

15

21

11

22

15

23

6

24

8

25

8

26

8

27

5

28

20

29

5

30

9

31

7

32

7

33

11

34

15

35

7

36

7

37

9

38

8

39

11

40

17

41

10

42

18

43

15

44

14

45

15

46

4

47

8

48

15

49

17

50

14

51

4

52

8

53

18

54

14

55

14

56

9

57

1

58

7

59

11

60

4

61

14

62

11

63

6

64

17

Найдем средний уровень переживания одиночества в группе.

М=(13 + 14+ 5+ 11+ 17+ 9+ 18+ 6+ 9+ 15+ 14+ 7+ 9+ 8+ 13+ 12+ 14+ 19+ 15+ 11+ 15+ 6+ 8+ 8+ 8+ 5+ 20+ 5+ 9+ 7+ 7+ 11+ 15+ 7+ 7+ 9+ 8+ 11+ 17+ 10+ 18+ 15+ 14+ 15+ 4+8+15+17+14+4+8+18+14+14+9+1+7+11+4+14+11+6+17)  / 64=10,92

Как видим, если испытуемых достаточно много, то рассчитывать среднее вручную задача трудоемкая.

Еще более трудоемкий процесс — расчёт стандартного отклонения. Не буду утомлять вас формулами, скажу лишь, что расчёт этого показателя сводится к тому, что суммируются квадраты разности показателей со средним значением. Затем эта сумма делится на число показателей и из полученного числа извлекается квадратный корень. Вручную такие вычисления делать хлопотно, и не нужно.

Чаще всего расчеты среднего и стандартного отклонения можно делать в статистических программах STATISTICA, SPSS и электронных таблицах Exсel.


Надеюсь, эта статья поможет вам написать работу по психологии самостоятельно. Если понадобится помощь, обращайтесь (все виды работ по психологии; статистические расчеты). Заказать

Понятие нормы. Проблемы стандартизации показателей.


⇐ ПредыдущаяСтр 5 из 11Следующая ⇒

Одним из основных понятий в психометрике является понятиенормативного оценивания,под которым понимается подходк оценке и интерпретации измеря­емых тестом показателей, отражающих какие-либо особенности личности, пу­тем сравнения индивидуальных результа­тов со статистическими значениями нор­мативной выборки. По срав­нению с альтернативным принципом ипсативного оценивания, нормативное оценивание более распространено. Здесь наиболее полно проявляется измерительный, характер психомет­рических техник.

Основным досто­инством нормативного оценивания является возможность строгого ранжирования испытуемых по результатам относительно выборочных данных, использования метрических шкал интервалов, относительная доступность интерпретации оценок пользователям психодиагностической информации.

Недостаток нормативного оценивания — эмпи­ричность рассчитываемых показателей, определенная условность перенесения выборочных данных на индивидуальное обследование [3].

Понятие нормы.Из основных понятий нормативного оценивания вытекает другое понятие – понятие нормы. Никакие результаты, полученные с помощью психологических тестов не имеют смысла до тех пор, пока они не будут сравнены с тестовыми нор­мами, которые возникают в процессе стандартизации нового теста, при прохождении через него большого количества испы­туемых, представляющих ту популяцию, для которой данный тест был разработан. Затем полученные данные используются как стандарт для оценки показателей индивидов. Нормы могут быть выражены по-разному, например: как интеллектуальный возраст, как проценты или как стандартные значения, — но все они по­зволяют психологу определить «по­ложение» испытуемого в выборке стандартизации.

Тестовые нормы — количествен­ные и качественные критерии оцен­ки результатов теста, позволяющие опре­делить уровень достижений или степень выраженности психологических свойств, которые являются объектами измерения. В качестве таких критериев могут выступать как статистические показатели выборки стан­дартизации, так и различные признаки-симптомы, свидетельствующие о том или ином уровне выраженности диагностиру­емых качеств.

В психодиагностике наи­большее распространение получили количественные тестовые нормы, рассчитанные на основе определе­ния средних величин х и дисперсии в вы­борке стандартизации. Количественные тестовые нормы, упорядочен­ные в шкалы на основе процедур z-преобразования (будут рассмотрены далее), содержатся в специальных таблицах, прилагаемых к ру­ководствам по проведению тестирования. В этом виде тестовые нормы позволяют установить относительное место каждого индивидуального результата по сравнению с выборочны­ми данными, выраженными в долях дис­персии. Такие количественные тестовые нормы наи­более типичны для тестов интеллекта, опросников личностных и др.

В проек­тивных техниках, в связи с зат­руднениями, возникающими при формализа­ции первичных оценок и вследствие слож­ности учитываемых диагностических по­казателей, количественные тестовые нормы мало распространены.

В виде качественных тестовые нормы могут выс­тупить, например, стандартизированные наборы ква­лификационных требований к испытуемо­му, аналогичные шкалам умственного развития, либо специально разработан­ные для конкретного теста комплексы диагно­стических признаков. Качественные критерии выступают как нормативы, позволяющие отнести индивида к той или иной диагнос­тической группе. Комплексы критериев тестовые нормы могут быть упорядочены в норматив­ные или порядковые шкалы. Одна и та же психодиагностическая методика может иметь количественные и качественные тестовые нормы, позволяющие взаимодополнить и обогатить интерпретацию результа­тов.

Для каждой возрастной группы тестовые нормы обычно рассчитываются раз­дельно (обя­зательное условие для тестов общих способностей, при этом закономерное изменение нормативных показателей здесь служит своеобразным критерием валидности те­ста). В клинической психодиагностике, иногда разрабатываются разные тестовые нормы для отдельных контингентов больных (напри­мер, для больных разных нозологий и нормальных). Реже встре­чается дифференциация норм в зависимо­сти от пола, профессиональных особенно­стей, уровня образования и т. д.

Рестандартизация и определение норм для новой социоэтнической популяции является одним из основных и обязатель­ных элементов адаптациитеста.

Наиболее сложной проблемой опреде­ления тестовых норм является отбор и комплекта­ция выборки нормирования. Выборка дол­жна соответствовать по своему объему назначению методики. В психодиагностике действует следующая закономерность: чем более генерализованной (широкой) является область применения теста, тем большим должно быть число ис­пытуемых в нормативной выборке. При этом центральное внимание должно уделять­ся обеспечению репрезентативностивыборки по отношению к обследуемой те­стом популяции. Поясним это положение.

Если ставится задача простого уменьшения погрешности измерения, то для этой цели вполне достаточна выборка стандартизации из 500 испытуемых. Однако, нельзя вынести никакого суждения относительно объема выборки не зная, для какой категории лиц предназначен тест. Если тест, например, рассчитан на общую популяцию старших школьников, то объем выборки стандартизации должен составлять как минимум около 10000 человек. Если тест рассчитан на какую-то специфическую выборку, например, спасателей или водолазов, то объем выборки стандартизации может быть значительно меньше. Можно утверждать, что репрезентативность выборки является более важной характеристикой, чем ее размер.

При одинаковых объе­мах стратифицированная выборка (выборка, разделенная на страты, классы) более эффективна, чем случайная (рандомизи­рованная). Наиболее частыми критерия­ми стратификации являются: социальное положение, регион проживания, возраст, пол, образовательный уровень и т.д. [3].

Итак, при формировании выборки стандартизации следует учитывать два ее важных фактора: репрезентативность и объем.

Рассмотрим несколько более подробно некоторые виды норм [1, 2].

а) Нормы развития.

Возрастные нормы. Независимо от способа выражения, показатели, основанные на возрастных нормах, довольно грубы и плохо поддаются точной статистической обработке. Тем не менее, они достаточно наглядны, особенно при клиническом обследовании, а также при решении ряда научных проблем.

Умственный возраст. Возрастные нормы используются и в тестах, не подразделенных на возрастные уровни (например, шкалы Бине-Симона). В этом случае нормы устанавливаются для значений первичного результата теста, такого, как общее число правильных ответов, время выполнения заданий, число ошибок или же некоторая комбинация таких показателей. Значения первичных результатов, полученных на выборке стандартизации для каждого возрастного уровня, и составляют возрастные нормы такого теста. Например, средний показатель 8-летних детей является нормой для возраста 8 лет. Если показатель обс­ледуемого равен среднему значению первичного результата для этого возраста, то его умственный возраст составляет 8 лет. Подобным образом могут быть выражены любые первичные показатели такого теста.

Эквивалентный класс. Показатели тестов достижений в обуче­нии часто интерпретируются с помощью понятия эквивалентный класс, введение которого объясняется тем, что все тесты этого типа приме­няются для обследования учащихся. Например, говорят, что ученик достиг уровня VII класса по орфографии, уровня VIII класса по технике чтения и уровня V класса по арифметике. Подобная характеристика оказывается такой же наглядной, как и умственный возраст в тестах интеллекта. Нормы классов определяются подсчетом среднего первичного ре­зультата, полученного детьми соответствующего класса. Так, если сред­нее количество правильно решенных задач арифметического теста в вы­борке стандартизации четвероклассников равно 23, то число 23 соответствует эквивалентному IV классу. Промежуточные эквивалентные классы, представляющие как бы доли класса, обычно определяются пу­тем интерполяции, хотя их можно получить и непосредственно, тестируя детей несколько раз в учебном году.

Несмотря на популярность, классные нормы имеют ряд недостат­ков. Во-первых, содержание обучения меняется от класса к классу. По­этому такие нормы применимы только к общеобразовательным предме­там, обучение которым ведется на всех уровнях, охватываемых данным тестом.Во-вторых, они неприменимы в старших классах, где мно­гие предметы изучаются только один или два года. Даже если предмет преподается на протяжении всего обучения в школе, его значение может меняться от класса к классу и, следовательно, скорость его изучения мо­жет быть различной. Иными словами, единицы шкал эквивалентных классов явно не равны друг другу, причем отсутствует определенная за­кономерность в их изменении для разных предметов.

Шкалы порядка. Другой подход к нормам развития связан с исследованиями по детской психологии. На­блюдения за развитием младенцев и дошкольников дали обширный материал, позволяющий описать типы поведения для различных актов по таким функциям, как моторика, сенсорика, речевое общение, формирование понятий. Например, можно отразить по месячный уровень развития ребенка (в каждой из четырех основных сфер его поведения: моторики, языка, адаптивного и личностно-социального поведения) в специально составленных таблицах развития.

Шкалы, разработанные по этим данным, являются шкалами порядка по тому, что этапы развития наступают в определенной последовательности, причем каждый новый этап предусматривает предварительное усвоение типов поведения, характерных для предыдущих этапов.

В целом, шкалы порядка предназначены для выяснения того, на какой стадии развития находится та или иная конкретная психическая функция. Слово «поря­док», входящее в название данного типа шкал, указывает на существова­ние единообразия в развитии, проходящем через последовательные стадии.

б) Внутригрупповые нормы.

Описания большинства современных стандартизованных тестов в той или иной форме содержат данные о внутригрупповых нормах. С их помощью индивидуальный результат оценивается в соответствии с выполнением наиболее сопоставимой нормативной группы. Например, первичный показатель ребенка сравнивается с показателями детей того же возраста или того же года обучения. В качестве примера таких показателей можно упомянуть z-показатели, станайны, процентили и пр. (их суть будет рассмотрена ниже). Внутригрупповые показатели имеют единый и четко определенный количественный смысл и могут быть использованы в рамках большинства мето­дов статистического анализа.

Выбор конкретного вида показателя определяется удобством, привычностью и легкостью разработки норм. Большинство типов внутригрупповых производных показателей в принципе подобны друг другу, если они корректно введены и интерпретируются надлежащим образом. При соблюдении определенных статистических условий каждый из этих показателей может быть легко переве­ден в любой другой.

в) Специфические нормы.

Специфические нормы. Один из подходов к решению проблемы сопоставимости тестов (согласованию норм) заключается в составлении таблиц эквивалентно­сти показателей разных тестов. Такие таблицы могут быть составлены эквипроцентильным методом, и тогда показатели считаются эквива­лентными, если они имеют равные процентили в данной группе. Другим возможным решением этой проблемы является стандартизация тестов для более узкой популяции, релевантной специфическим целям каждого теста. В таких случаях границы нормативной популяции должны быть четко определены и приведены вместе с нормами. Например, можно указать, что данные нормы относятся к управленческому персоналу крупных производственных фирм или к первокурсникам технических институтов.

Достаточно специализированные нормы желательно иметь для многих целей тестирования. Даже когда имеются репрезентативные нормы для широкой популяции, часто оказываются полезными так называемые подгрупповые нормы. Потребность в них возникает, когда показатели теста заметно меняются от одной подгруппы к другой. Сами подгруппы могут формироваться по признаку возраста, года обучения, типа школьной программы, пола, географического региона, проживания в городе или в сельской местности, социоэкономического уровня и т.д. Именно характер использования теста определяет и наиболее существенный признак формирования подгрупп, и предпочтительность общих или специфических норм.

Следует также упомянуть о локальных нормах, которые нередко раз­рабатываются пользователями тестов для конкретных социальных единиц. Группы, к которым относятся такие нормы, еще более специфичны, чем даже обсуждавшиеся выше подгруппы. Например, предприниматель может выработать нормы, лучше отвечающие специфике предлагаемой работы; администрация университета — нормы, рассчитанные на обучение в данном университете; школа может оценивать выполнение тестов своими учениками в соответствии с собственным распределением показателей. Локальные нормы такого типа в большей степени, чем какие-либо другие, отвечают таким задачам тестирования, как предсказание достижений в труде или учебе, сравнение относительного уровня знаний детей по различным предметам, исследование динамики их развития [1].

Относительность норм.Относительность норм становится очевидна при попытках осуществить сравнения между тестами. Хорошо известно, что независимо от вида показателей тестов, их всегда следует приводить вместе с названием теста, в котором они получены, поскольку тестовые показатели нельзя интерпретировать в отрыве от конкретного теста. Например, если в результате тестирования Иванов получил IQ = 90, а Сидоров — IQ =110, то без последующих разъяснений эти данные ни о чем не говорят. Взаимное положение результатов этих испытуемых может оказаться обратным, если им придется «поменяться» тестами, которые они проходили.

Точно так же относительная позиция индивида по различным психическим функциям может быть неверно истолкована из-за несопоставимости те­стовых норм. Допустим, учащемуся для определения уровня развития некоторых его навыков были даны тесты на понимание слов и пространственное восприятие. Если первый из этих двух тестов стандартизован на случайной выборке учеников старших классов, а второй на группе мальчиков из ремесленного училища, то можно ошибочно заключить, что индивид гораздо более развит в вербальном, чем пространственном отношении, тогда как на самом деле может иметь место обратное.

Существуют три основные причины систематических изменений результатов, полученных одним и тем же индивидом в различных тестах.

Во-первых, тесты, даже если они одинаково называются, могут различаться по содержанию. Примеры тому — тесты интеллекта, обычно фигурирующих под одним и тем же именем. И это, несмотря на то, что одни из них включают в себя только вербальные задания, другие связаны с пространственными навыками, а третьи могут содержать вер­бальные, пространственные и числовые задания.

Во-вторых, могут ока­заться несравнимыми единицы измерения. Например, если IQ одного теста построен при σ =12, а другого, при σ =18, то испы­туемый, который в первом тесте получит IQ= 112, во втором, скорее все­го, будет иметь IQ=118.

В-третьих, характер выборок стандартизации, ис­пользованных при определении норм для разных тестов, может оказаться различным. Очевидно, один и тот же индивид будет выглядеть лучше на фоне более слабой, чем более сильной группы.

Несопоставимость содержания тестов или единиц измерения обычно выявляется при рассмотрении самого теста или руководства по его ис­пользованию. Однако несоответствие нормативных выборок заметить гораздо труд­нее, по всей вероятности, оно и является причиной многих, не поддающихся ино­му объяснению, расхождений в результатах теста.

Обычно показатели конкретного испытуемого сравниваются с нормативными показателями посредством какого-либо преобразования, позволяющего определить место положения этого испытуемого в группе. Рассмотрим некоторые из них.

Процентиль.Прежде, чем рассматривать понятие «процентиля», напомним кратко некоторые свойства нормального распределения. Например, известно [1], что, используя показатель σ(стандартное отклонение)применительно к нормальной кривой распределения, можно представить прямое соответствие между σи относительным количеством случаев (допустим правильных ответов на тест):

Например, для Х = 40 и σ= 4,9 имеем интервал равный + 1σ= 44,9; +2 σ= 49,8. Процент случаев, приходящихся на интервал между Х и +1 σ,для нормального распределения равен 34,13. Так как кривая симметрична, 34,13% случаев приходится также и на интервал от Х до -1σ,таким образом, в диапазоне от -1σ до +1σ приходится 68,26% случаев. Почти все (99,72%) случаи лежат в пределах + 3σ относительно среднего значения.

 

Различают первичные или «сырые» показатели, которые получаются непосредственно после того, как проведен тест и подсчитаны суммарные баллы, и «производные» показатели – полученные из первичных, «сырых» показателей путем применения к ним каких-либо математических процедур.

В качестве универсальных производных показателей, пригодных для разных (по своей качественной направленности и количеству пунктов) тестов, используется «процентильная мера».

Процентильпроцент испытуемых из выборки стандартизации, которые получили равный или более низкий балл, чем балл данного испытуемого.

Например, если 30% людей правильно решают 5 задач в тесте на пространственное воображение, то первичному показателю 5 соответствует 30-й процентиль (Р30).

Процентили указывают на относительное положение индивида в выборке стандартизации. (Их еще можно рассматривать как ранговые градации, общее число которых равно 100, однако, при ранжировании принято начинать отсчет сверху, т.е. с лучшего члена группы, получающего ранг 1; в то время как, в случае процентилей отсчет ведется снизу, так что чем ниже процентиль, тем хуже позиция индивида).

50-й процентиль (Р50) соответствует медиане. Процентили свыше 50 представляют показатели выше среднего, а те, которые лежат ниже 50, — сравнительно низкие показатели.

25-й и 75-й процентилиизвестны также под названием1-го и 3-го квартилей (Q1 и Q3), поскольку они выделяют нижнюю и верхнюю четверти распределения. Как и медиана, они удобны для описания распределения показателей и сравнения с другими распределениями.

Процентили не следует смешивать с обычными процентными показателями,которые являются первичными показателями и представляют собой процент правильно выполненных заданий, тогда как процентиль — это производный показатель, указывающий на долю от общего числа членов группы.

Процентильные показатели обладают рядом достоинств. Их легко рассчитать и понять даже сравнительно неподготовленному человеку. Их применение достаточно универсально, они одинаково применимы как к детям, так и взрослым и подходят к любому типу теста, измеряет ли он способности или свойства личности.

Процентильные показатели имеют существенные недостатки.Первый — связан с неравенством их как единиц измерения, особенно на краях распределения. Если распределение первичных показателей приближается к нормальной кривой, (что справедливо для большинства тестовых показателей) то различия между первичными показателями вблизи медианы (или центра) распределения в процентильном выражении преувеличены, тогда как аналогичные различия вблизи краев распределения сильно занижены.

Напомним, что в нормальной кривой случаи тесно сгруппированы в центре и по мере приближения к краям рассеиваются. Следовательно, каждый данный процент случаев вблизи центра соответствует более короткому расстоянию по оси абсцисс, чем тот же процент ближе к краям распределения.

 

 
 

 

На графике 7 это расхождение в промежутках между рангами процентилей хорошо заметно, если, например, сравнить расстояние между Р40 и Р50 с расстоянием между Р10 и P20.

Еще более явно расхождение между этими расстояниями при Р10 и Р1. (В теоретической нормальной кривой нулевой процентиль достигается лишь в бесконечности и поэтому не может быть показан на графике).

То же соотношение получится, если процентили отмечать интервалами одинаковой длины σ, откладывая их влево и вправо от пика нормальной кривой. Такие процентили обозначены в нижней части графика 7. Видно, что разность процентилей между пиком и + 1σ равна 34 (84-50), а между + 1σ и + 2σ — всего 14 (98 — 84).

Второй недостаток: как показатели, процентили нельзя использовать для последующего статистического анализа, поскольку они являются значениями порядковой шкалы.

Итак, процентили показывают относительное положение каждого индивида в нормативной выборке, а не величину различия между результатами.

Стандартные показатели.Преимущественное использование в тестах стандартных показателей объясняется их пригодностью во многих отношениях. Такие показатели выражают отклонение индивидуального результата от средней нормы в единицах, пропорциональных стандартному отклонению распределения [1].

Стандартные показатели могут быть получены как линейным, так и нелинейным преобразованием первичных показателей. Если используется линейное преобразование, то при этом сохраняются соотношения между первичными показателями, поскольку они вычисляются вычитанием из каждого первичного показателя одной и той же величины с последующим делением результата на другую постоянную величину.

Относительная величина разницы между стандартными показателями, полученными при таком линейном преобразовании, в точности соответствует относительной величине различия первичных показателей.

Все свойства первоначального распределения показателей полностью воспроизводятся в распределении стандартных линейных показателей. По этой причине любые вычисления, которые можно производить с исходными данными, могут также выполняться и с линейными стандартными показателями без какого-либо искажения конечных результатов.

Линейно преобразованные стандартные показатели часто именуются просто как стандартный показатель или z — показатель. Чтобы вычислить z, находят разность между индивидуальным первичным результатом и средним значением для нормативной группы и затем делят эту разность на σ нормативной группы.

Очевидно, что получающиеся при таком вычислении отрицательные показатели означают, что выполнение тестов индивидом было ниже среднего. Более того, поскольку для большинства групп область значений умещается в пределах от 3σ ниже и выше среднего значения, удовлетворительное различение индивидуальных показателей возможно, только если zвычисляется с точностью хотя бы до одной десятой. Все это делает показатель z неудобным для вычислений и сообщений результатов.

Поэтому обычно применяется еще одно линейное преобразование, единственная цель которого придать показателям более удобную форму. Стандартное преобразование Z-показателей можно представить в виде формулы:

Zt = + σZ (**)

где Zt — преобразованный Z-показатель, – среднее значение преобразованного распределения, σ – стандартное отклонение преобразованного распределения.

Таким образом, чтобы перевести z-показатель в новую шкалу, необходимо просто умножить его на выбранную величину σ, и полученное произведение прибавить (с учетом знака при z) к выбранному среднему значению .

При желании в качестве и σ можно выбрать любые удобные значения; например, показатели отдельных субтестов в шкалах интеллекта Векслера преобразуются так, что =10, а σ=3. Считается (16), что для тестов с распределением баллов, если не полностью нормальным, то более или менее симметричным, преобразованные Zt -показатели со средним значением = 50 и с σ = 10являются точной значимой нормой.

Все эти меры служат образцами линейного преобразования стандартных показателей.

Напомним, что одной из причин введения производной шкалы вместо первичных показателей является стремление к сопоставимости показателей различных тестов. Значения только что рассмотренных линейно преобразованных стандартных показателей сопоставимы только, если их исходные распределения имеют приблизительно одну и ту же форму.

В этих условиях результат, соответствующий, скажем, +1σ над средним в каких-либо двух тестах, означает, что индивид занимает по отношению к обеим нормативным группам одно и то же положение. Его показатель превышает данные для одного и того же процента членов каждой из групп, и этот процент можно найти из статистических таблиц, если известна форма распределения.

Чтобы добиться сопоставимости результатов, принадлежащих к распределениям различной формы, можно применить нелинейное преобразование, позволяющее придать распределению форму заданной кривой. В качестве эталона обычно используется нормальное распределение, хотя при определенных обстоятельствах другой тип распределения может оказаться более пригодным.

Одним из главных доводов в пользу такого выбора является то, что большинство распределений первичных показателей ближе к нормальному, чем к какому-либо иному. Более того, физические характеристики организма, такие, как рост и вес, измеряющиеся в шкалах с равными единицами, определенными на основе некоторых физических операций, обычно имеют нормальное распределение.

Нормализованные стандартные показателиэто стандартные показатели, соответствующие распределению, преобразованному так, что оно принимает вид нормальной кривой.

Их значения могут быть найдены с помощью таблиц, в которых приводится процент случаев различных отклонений в единицах σ от среднего значения для нормальной кривой. При этом сначала определяется процент лиц в нормативной выборке с тем же или более высоким первичным результатом. Затем этот процент отыскивают в таблице нормального распределения частот и по нему находят соответствующее значение нормализованного стандартного показателя.

Нормализованные стандартные показатели имеют ту же форму, что и линейно преобразованные стандартные показатели, т.е. при среднем значении они равны 0, а при стандартном отклонении равны 1.

Таким образом, значение 0 нормализованный показатель принимает в случае, если индивидуальный результат приходится на самую середину нормальной кривой, т.е. превосходит 50% результатов группы. Результат «-1» означает, что он превосходит приблизительно 16% результатов группы, а «+1» — 84%. Эти проценты соответствуют точкам, лежащим на 1σ ниже и выше среднего значения нормальной кривой (см. график 6).

Как и при линейном преобразовании, нормализованным стандартным показателям можно придать любую удобную форму (используя приведенную выше формулу **).

Например, в руководстве по конструированию психологических тестов (США) считается [8], что типичным преобразованием ненормализованных стандартных показателей должно быть приведение их к распределению со средним значением = 50 и стандартным отклонением σ = 10. В результате получается T-показатель, предложенный впервые Мак-Коллом: на шкале Т число 50 соответствует среднему значению; 60 показатель в 1σ над средним и т.д.

Таким образом, Т-показатели это нормально распределенные стандартные показатели со стандартным отклонением 10.

Еще одним достаточно известным преобразованием является шкала станайн, разработанная во время второй мировой войны для использования военно-воздушными силами США.

В этой шкале используются только однозначные числа. Среднее значение показателя равно 5, а σ — примерно 2. Название станайн (сокращение от standart nine, т. е. стандартная девятка) связано с тем, что этот показатель принимает значения от 1 до 9. Использование однозначных чисел удобно для машинной обработки, поскольку каждый показатель занимает на перфокарте всего один столбец.

Первичные показатели легко преобразуются в станайны упорядочиванием их числовых значений и приписыванием им новых значений в соответствии с нормальной кривой процентов, приведенной в таблице 3.

Например, если в группе ровно 100 человек, то 4 из них имеющие низшие показатели, получают станайн 1, следующие 7 — станайн 2, следующие 12 — станайн 3 и т. д. Если группа состоит из большего или меньшего числа случаев, то предварительно выясняется, скольким из них соответствует каждый из выписанных в табл. 4 процентов. Так, при 200 случаях станайн 1 будет приписан 8 случаям (4%, 200), а при 150 случаях -6 (4% от 150).

 

Процент
Станайн

 

Таблица 3. Проценты нормального распределения для перевода первичных результатов теста в станайны.

 

Эта таблица была составлена для перевода рядов случаев непосредственно в станайны для любой группы от 10 до 100 случаев. Станайны, ввиду их практических и теоретических достоинств, находят достаточно широкое применение, особенно в тестах способностей и достижений.

Хотя нормализованные стандартные показатели отвечают основным целям тестирования, тем не менее, имеются определенные технические возражения против нормализации всех распределений подряд. Такое преобразование следует проводить при наличии большой и репрезентативной выборки, когда есть основания считать, что отклонение распределения от нормального произошло в силу определенных дефектов теста, а не особенностей выборки или действия других факторов, влияющих на исследуемую функцию. Следует также отметить, что, когда исходное распределение первичных показателей приближается к нормальному, линейные и нормализованные стандартные показатели мало будут отличаться друг от друга. Хотя методы получения этих двух типов показателей совершенно различны, сами показатели в таких условиях будут почти тождественны [1, 15].

В целом, если это возможно, следует предпочесть такую нормализацию распределения, которая достигается надлежащей коррекцией уровней трудности тестовых заданий, а не путем последующего преобразования явно ненормального распределения. При наличии приблизительно нормального распределения первичных показателей линейные стандартные показатели будут служить тем же целям, что и нормализованные стандартные показатели.

Итак,в качестве источника конкретной меры выступает нормативная выборка (выборка стандартизации), на которой построено нормативное распределение тестовых баллов. Как базовые, процентильные шкалы лежат в основе всех традиционных шкал, применяемых в тестологии (T-очки MMPI, баллы IQ, стены 16 PF и др.).

Приведем примеры параметров для наиболее популярных стандартных шкал:

1) Т-шкалаМак-Колла(тест-опросник ММРI и др. тесты, где среднее равно Х = 50, а σ = 10)

2) Шкала IQ: Х=100 и σ =15,

3) Шкала «стэнайнов» (целочисленные значения от 1 до 9 — стандартная девятка): Х=5,0 и σ=2,

4) Шкала «стенов» (стандартная десятка, 16PF Кеттелла) предложена Р.Б. Кеттеллом. Этот способ представляет собой перевод исходных тестовых оценок в 10-балльную шкалу, путем разбиения оси значений тестовых оценок на 10 интервалов, соответствующих долям стандартного отклонения.

Для этого среднее арифметическое по группе принимается за среднюю точку и ей приписывается значение, равное 5,5 балла по стандартной десятибалльной системе. Всякая оценка в интервале ( +0,25σ)переводится в 6 стенов, а оценка ( -0,25σ)дает стен равный 5.Любое дальнейшее увеличение или уменьшение тестовой оценки на 0,5σувеличивает или уменьшает стандартную оценку на 1 стен.

При такой системе стандартизации к среднему диапазону (или к норме) принято относить стандартные оценки от 4 до 7 стенов. Только при получении стандартных оценок до 3 стенов и выше 8 стенов следует говорить о значимых отклонениях, выходящих за границы средней нормы [13].

Для наглядности приведем образец такой таблицы для фактора «А» — опросника 16PF:

Сырые баллы: 0-4 5-6 7 8-9 10-12 13 14-15 16 17-18 19-20

Стены: 1 2 3 4 5 6 7 8 9 10

Применение стандартных шкал позволяет прибегать на практике к более грубым, приближенным способам проверки типа распределения тестовых баллов. Если, например, процентильная нормализация с переводом в стены и линейная нормализация с переводом в стены по формуле («) дают совпадающие целые значения стенов для каждого « », то это означает, что распределение обладает нормальностью с точностью до «стандартной десятки».

Применение стандартных шкал необходимо для соотнесения результатов по разным тестам, для построения «диагностических профилей» по батарее тестов и тому подобных целей.

Подчеркнем еще раз, что с точки зрения теории измерений процентильные шкалы относятся к порядковым шкалам: они дают информацию, у кого из испытуемых сильнее выражено измеряемое свойство, но ничего не позволяют говорить о том, насколько или во сколько раз сильнее.

Для того, чтобы строить на базе таких шкал количественный прогноз, нужно повысить уровень измерения. Переход к шкалам интервалов производится или на базе эмпирического распределения, или на базе произвольной модели теоретического распределения. В большинстве случаев в роли такой теоретической модели оказывается модель нормального распределения, хотя в общем случае может быть использована любая модель [1, 15].

В дифференциальной психометрике нередко используются еще 2 вида шкал (и соответственно 2 вида тестовых норм):

во-первых, это то, что можно условно назвать «абсолютными тестовыми нормами» — при этом, в роли шкалы выступает сама шкала «сырых» очков;


Рекомендуемые страницы:

стандартных индикаторов | Программный цикл | Стартер проекта

Государственный департамент и USAID, опираясь на технический опыт обоих агентств и сообществ по вопросам развития и безопасности, совместно разработали стандартные индикаторы для измерения как того, что выполняется за счет средств иностранной помощи правительства США, так и коллективного воздействия иностранных и принимающих стран. -государственные усилия по продвижению развития страны.В прошлом показатели разрабатывались и отслеживались отдельно двумя агентствами, и их было нелегко объединить, чтобы дать полную картину результатов, которые были достигнуты за счет ресурсов иностранной помощи.

Стандартные показатели

Поскольку Агентство должно иметь возможность отчитываться о результатах, достигнутых его инвестициями в развитие, USAID определил некоторые показатели эффективности в качестве наилучшего выбора для характеристики прогресса в каждом из секторов и технических областей, в которых оно работает.Этот набор индикаторов, называемых стандартными индикаторами, должен иметь приоритет перед альтернативами везде, где применим конкретный стандартный индикатор.

Так, например, для результата: сокращение времени / затрат на перемещение товаров через границы, варианты измерения времени варьируются от минут до часов, дней или недель. Список стандартных индикаторов USAID делает этот выбор для всех — он выбирает дни. Стандартизация ограниченного набора показателей, которые широко используются для конкретного типа проекта, позволяет агрегировать скромный объем данных по всему миру.По этой причине важно проконсультироваться со стандартным списком индикаторов USAID в начале процесса выбора индикаторов и принять те, которые в противном случае представляют собой хорошие индикаторы для различных результатов в матрице результатов миссии. Многие стандартные индикаторы USAID подходят для измерения эффективности на уровне IR и суб-IR. Некоторые из них, однако, более подходят на уровне проекта, где отслеживаются действия с участием отдельных участников и бенефициаров.

Для миссий, ориентированных на торговлю в рамках своей структуры результатов CDCS, список стандартных индикаторов USAID включает относительно небольшое количество индикаторов эффективности, которые могут оказаться действительными мерами для структуры результатов CDCS, в том числе на суб-IR уровне.К ним относятся:

  • Количество положений Соглашения ВТО об упрощении процедур торговли, получивших поддержку правительства США
  • Среднее время (в часах) на экспорт товаров по торговому коридору, получающих помощь от правительства США
  • Количество фирм, получающих помощь от правительства США, которые прошли сертификацию в международных организациях по контролю качества на соответствие минимальным стандартам продукции

Другие стандартные индикаторы торговли будут более подходящими в качестве показателей уровня проекта.


ProjectStarter

ЛУЧШИЕ ПРОЕКТЫ ЧЕРЕЗ УЛУЧШЕНИЕ
МОНИТОРИНГ, ОЦЕНКА И ОБУЧЕНИЕ

Набор инструментов, разработанный и внедренный:
Управление торговли и регуляторной реформы
Бюро экономического роста, образования и окружающей среды
Агентство США по международному развитию (USAID)

Для получения дополнительной информации, пожалуйста, обращайтесь к Paul Fekete.


Последнее обновление: 12 июня 2019 г.

.Стандарты и индикаторы

| NICE

Индикаторы

NICE измеряют результаты, которые отражают качество медицинской помощи или процессы, связанные с улучшенными результатами на основании фактических данных.

Наше меню одного индикатора состоит из 3 типов индикаторов:

  • Индикаторы общей практики, подходящие для использования в QOF
  • Индикаторы для общей практики, подходящие для использования вне QOF
  • Показатели группы ввода в клиническую эксплуатацию.

Просмотр единого меню для индикаторов

Показатели в разработке

В настоящее время мы разрабатываем потенциальные индикаторы для:

  • тревога
  • слабоумие
  • депрессия
  • инфаркт миокарда.

Напишите нам, чтобы зарегистрироваться в качестве заинтересованной стороны.

Используйте индикаторы для:

  • определить, где необходимы улучшения
  • устанавливает приоритеты для улучшения качества и поддержки
  • создание локальных панелей мониторинга производительности
  • Производительность
  • по сравнению с национальными данными
  • поддерживает местные схемы повышения качества
  • демонстрируют прогресс, достигнутый местными системами здравоохранения в достижении результатов.

Развитие

Наши показатели подкреплены надежной доказательной базой и прошли тщательный процесс, который включает:

  • разработка независимым комитетом экспертов (включая врачей общей практики, консультантов больниц, практикующих специалистов в области общественного здравоохранения и социальной помощи, комиссаров NHS и непрофессионалов.)
  • испытание и пилотирование
  • общественные консультации.

Мы публикуем все исходные данные, использованные для создания индикаторов. Мы работаем в партнерстве с NHS Digital над разработкой и тестированием индикаторов и технических характеристик.

Прочтите руководство по процессу (PDF).

В каждом индикаторе:

  • знаменатель, описывающий целевую группу населения, включенную в показатель
  • числитель, описывающий количество людей в знаменателе, которым следует пройти указанное вмешательство, лечение или результат
  • описание включений, исключений и исключений.

Управление и обновление меню NICE

Мы проверяем и поддерживаем все индикаторы в меню, чтобы все индикаторы соответствовали последним рекомендациям.

Новые и обновленные индикаторы добавляются каждый год, обычно в августе.

Есть вопрос? Связаться с командой

.

МГЭ-ЦУР — Показатели ЦУР

Уровень классификации глобальных показателей ЦУР


Чтобы облегчить внедрение глобальной системы показателей, все показатели классифицируются МГЭ-ЦУР на три уровня в зависимости от уровня их методологической разработки и доступности данных на глобальном уровне, а именно:

Критерии классификации уровня / определения:

Уровень 1: Показатель концептуально ясен, имеет международно установленную методологию и стандарты, а данные регулярно производятся странами по крайней мере для 50 процентов стран и населения в каждом регионе, где показатель актуален.

Уровень 2: Показатель концептуально ясен, имеет международно установленную методологию и стандарты, но данные не предоставляются странами регулярно.

Уровень 3: Для этого индикатора пока нет установленных на международном уровне методологии или стандартов, но методология / стандарты разрабатываются (или будут) разработаны или протестированы. (По состоянию на 51-ю сессию Статистической комиссии ООН система глобальных показателей не содержит индикаторов уровня III)

Все показатели одинаково важны, и создание многоуровневой системы предназначено исключительно для помощи в разработке глобальных стратегий реализации.Для показателей уровня I и II доступность данных на национальном уровне может не обязательно совпадать с глобальной классификацией уровней, и страны могут создать свою собственную классификацию уровней для реализации.

Обратите внимание, что метаданные индикаторов уровня I и II доступны в репозитории метаданных.


Ниже представлена ​​обновленная по состоянию на 17 июля 2020 года классификация глобальных показателей ЦУР, разработанная МГЭ-ЦУР. В документе также отражены возможные хранители и партнерские агентства для индикаторов.

Для любых будущих запросов о добавлении или изменении агентства в качестве со-хранителя, после того, как все стороны достигнут окончательного соглашения, отправьте подтверждение в Секретариат с копией всем возможным агентствам-хранителям.

По состоянию на 17 июля 2020 г .: Обновленная классификация уровней содержит 123 индикатора уровня I, 106 индикаторов уровня II и 2 индикатора, которые имеют несколько уровней (разные компоненты индикатора классифицируются по разным уровням) . Обратите внимание, что классификация по уровням недавно обновленных показателей является предварительной, пока не будет проведен полный обзор доступности данных.

Список изменений с 15 октября 2018 г. доступен здесь .


.

индикаторов мониторинга производительности | Программный цикл | Project Starter

Показатели эффективности — это показатели, которые USAID использует для определения прогресса в достижении результатов, включенных в матрицу результатов. Объединяя каждый результат с соответствующими точными измерениями, USAID устраняет значительную часть двусмысленности, присущей многим заявлениям о результатах.

Показатели эффективности уточняют наше понимание результатов, которые CDCS обязует достичь своей миссией. В соответствии с требованиями ADS USAID ожидается, что PMP будет отслеживать, «как будет отслеживаться прогресс, производительность, программные предположения и операционный контекст» по каждому DO с использованием показателей эффективности.

Выбор показателей эффективности

При подготовке CDCS сотрудники должны выбрать индикаторы в соответствии с требованиями USAID, которые требуют:

  • По крайней мере, один показатель эффективности для каждого НП, указанного в матрице результатов CDCS;
  • По крайней мере, один показатель эффективности для каждого суб-НП, указанного в матрице результатов CDCS; и
  • По крайней мере, один показатель эффективности для любой Цели проекта, которая не соответствует IR или суб-IR, после утверждения PAD.

Примечательно, что USAID не требует, чтобы показатели эффективности определялись ни на уровне целей РФ, ни на уровне DO, хотя выбор показателей эффективности на уровне DO является вариантом, который может выбрать Миссия.

По сути, индикаторы могут быть как количественными, так и качественными. Чтобы любая мера была полезной в качестве индикатора эффективности, она должна быть действительной (измерять то, что она намеревается измерить) и надежной (использоваться несколько раз точно таким же образом — воспроизводиться). Ниже приведены семь дополнительных характеристик хороших показателей эффективности, которые помогают сделать их правильным выбором для мониторинга эффективности программ USAID.

  • Прямой
  • Объектив
  • Полезно для управления
  • Приписываемый
  • Практический
  • Достаточно
  • В разбивке по мере необходимости

Эти характеристики подробно рассматриваются в СОВЕТАХ USAID по выбору показателей эффективности, представленных на этой странице. Что касается дезагрегации по гендерному признаку, Практическое руководство USAID по интеграции гендерной проблематики в планы работы и отчеты является важным источником по использованию гендерно чувствительных показателей.Также см. Страницу этого веб-сайта о дезагрегации данных, которая включает показания и инструменты, которые могут оказаться полезными.

USAID требует, чтобы показатели эффективности были определены для каждого результата на каждом уровне результатов, включенных в матрицу результатов. Для любого конкретного результата допускается максимум три показателя.

USAID различает стандартные индикаторы — набор индикаторов, разработанных совместно с Государственным департаментом, для всех типов программ, для которых USAID пытается согласованно собирать данные от миссий, — и пользовательские индикаторы, которые выбираются на Уровень миссии.Прогресс по большинству структур результатов CDCS измеряется комбинацией этих двух типов показателей.

Для некоторых типов результатов выбор соответствующего индикатора, который может использоваться повторно таким же образом, прост.

  • Если результат интереса выглядит следующим образом: стоимость доставки товаров снижена, нет сомнений в том, что метрикой для оценки того, был ли достигнут прогресс, будет стоимость. Единственный реальный выбор в этом случае может заключаться в том, как выражена стоимость, в долларах или песо.Для других типов результатов может быть более широкий диапазон вариантов.
  • Для результата: экспортное производство томатов увеличилось, мнения могут быть разными по поводу того, будет ли наилучшей мерой килограммы на гектар; количество гектаров экспортной продукции для этой культуры; количество фермеров, выращивающих помидоры на экспорт; или нужна ли комбинация индикаторов для отражения реального намерения программы.

Как правило, рекомендуется начинать процесс выбора показателей с просмотра стандартного списка показателей USAID и выбора тех, которые подходят для результатов, указанных в матрице результатов миссии.В большинстве технических областей, включая торговлю, только часть перечисленных стандартных индикаторов будет уместной на уровне структуры результатов CDCS. Другие более уместны на уровне проекта и обсуждаются в следующем разделе комплекта.


ProjectStarter

УЛУЧШЕННЫЕ ПРОЕКТЫ ЧЕРЕЗ УЛУЧШЕНИЕ
МОНИТОРИНГ, ОЦЕНКА И ОБУЧЕНИЕ

Набор инструментов, разработанный и внедренный:
Управление торговли и регуляторной реформы
Бюро экономического роста, образования и окружающей среды
Агентство США по международному развитию (USAID)

Для получения дополнительной информации обращайтесь к Полю Фекете.


.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *