Выборка
Материал из Википедии — свободной энциклопедии
Выборка — множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.
Содержание |
[править] Объём выборки
Объём выборки — число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30—35.
[править] Зависимые и независимые выборки
При сравнении двух (и более) выборок важным параметром является их зависимость. Если можно установить гомоморфную пару (то есть, когда одному случаю из выборки X сооветствует один и только один случай из выборки Y и наоборот) для каждого случая в двух выборках (и это основание взаимосвязи является важным для измеряемого на выборках признака), такие выборки называются зависимыми. Примеры зависимых выборок:
- пары близнецов,
- два измерения какого-либо признака до и после экспериментального воздействия,
- мужья и жёны
- и т. п.
В случае, если такая взаимосвязь между выборками отсутствует, то эти выборки считаются независимыми, например:
- мужчины и женщины,
- психологи и математики.
Соответственно, зависимые выборки всегда имеют одинаковый объём, а объём независимых может отличаться.
Сравнение выборок производится с помощью различных статистических критериев:
- t-критерий Стьюдента
- T-критерий Вилкоксона
- U-критерий Манна-Уитни
- Критерий знаков
- и др.
[править] Репрезентативность
Выборка может рассматриваться в качестве репрезентативной или нерепрезентативной.
[править] Пример нерепрезентативной выборки
В США одним из наиболее известных исторических примеров нерепрезентативной выборки считается случай, происшедший во время президентских выборов в 1936 году[1]. Журнал «Литрери Дайджест», успешно прогнозировавший события нескольких предшествующих выборов, ошибся в своих предсказаниях, разослав десять миллионов пробных бюллетеней своим подписчикам, людям, выбранным по телефонным книгам всей страны, и людям из регистрационных списков автомобилей. В 25 % вернувшихся бюллетеней (почти 2,5 миллиона) голоса были распределены следующим образом:
- 57 % отдавали предпочтение кандидату-республиканцу Альфу Лэндону
- 40 % выбрали действующего в то время президента-демократа Франклина Рузвельта
На действительных же выборах, как известно, победил Рузвельт, набрав более 60 % голосов. Ошибка «Литрери Дайджест» заключалась в следующем: желая увеличить репрезентативность выборки, — так как им было известно, что большинство их подписчиков считают себя республиканцами, — они расширили выборку за счёт людей, выбранных из телефонных книг и регистрационных списков. Однако они не учли современных им реалий и в действительности набрали ещё больше республиканцев: во время Великой депрессии обладать телефонами и автомобилями могли себе позволить в основном представители среднего и верхнего класса (то есть большинство республиканцев, а не демократов).
[править] Виды плана построения групп из выборок
Выделяют несколько основных видов плана построения групп[2]:
- Исследование с экспериментальной и контрольной группами, которые ставятся в разные условия.
- Исследование с экспериментальной и контрольной группами с привлечением стратегии попарного отбора
- Исследование с использованием только одной группы — экспериментальной.
- Исследование с использованием смешанного (факторного) плана — все группы ставятся в разные условия.
[править] Стратегии построения групп
Отбор групп для их участия в психологическом эксперименте осуществляется с помощью различных стратегий, которые нужны для того, чтобы обеспечить максимально возможное соблюдение внутренней и внешней валидности[3].
- Рандомизация (случайный отбор)
- Попарный отбор
- Стратометрический отбор
- Приближённое моделирование
- Привлечение реальных групп
[править] Рандомизация
Рандомизация, или случайный отбор, используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вуза, можно сложить бумажки с именами всех студентов вуза в шляпу, а затем достать из неё 100 бумажек — это будет случайным отбором (Гудвин Дж., с. 147).
[править] Попарный отбор
Попарный отбор — стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп с лучшим вариантом — привлечением близнецовых пар (моно- и дизиготных), так как позволяет создать .
[править] Стратометрический отбор
Стратометрический отбор — рандомизация с выделением страт (или кластеров). При данном способе формирования выборки генеральная совокупность делится на группы (страты), обладающие определёнными характеристиками (пол, возраст, политические предпочтения, образование, уровень доходов и др.), и отбираются испытуемые с соответствующими характеристиками.
[править] Приближённое моделирование
Приближённое моделирование — составление ограниченных выборок и обобщение выводов об этой выборке на более широкую популяцию. Например, при участии в исследовании студентов 2-го курса университета, данные этого исследования распространяются на «людей в возрасте от 17 до 21 года». Допустимость подобных обобщений крайне ограничена.
[править] Источники
- ↑ Исследование в психологии: методы и планирование / Дж. Гудвин. — СПб.: Питер, 2004. С. 146.
- ↑ Дружинин В. Н. Экспериментальная психология. — 2-е изд., доп. — СПб.: Питер, 2002. С. 92
- ↑ См. там же. С. 93—95.
[править] Рекомендуемая литература
Наследов А. Д. Математические методы психологического исследования. СПб.: Речь, 2004.
[править] См. также
В некоторых типах исследований выборка разделяется на:
- экспериментальную
- и контрольную группы.