Выборка хорошо представляющая генеральную совокупность называется. Генеральная совокупность и выборка

100 р бонус за первый заказ

Выберите тип работы Дипломная работа Курсовая работа Реферат Магистерская диссертация Отчёт по практике Статья Доклад Рецензия Контрольная работа Монография Решение задач Бизнес-план Ответы на вопросы Творческая работа Эссе Чертёж Сочинения Перевод Презентации Набор текста Другое Повышение уникальности текста Кандидатская диссертация Лабораторная работа Помощь on-line

Узнать цену

Генеральная совокупность - вся изучаемая выборочным методом статистическая совокупность объектов и/или явлений общественной жизни, имеющих общие качественные признаки или количественные переменные.

Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени. Примеры генеральных совокупностей:
- Все жители Москвы (10,6 млн. человек по данным переписи 2002 года)
- Мужчины-Москвичи (4,9 млн. человек по данным переписи 2002 года)
- Юридические лица России (2,2 млн. на начало 2005 года)
- Розничные торговые точки, осуществляющие продажу продуктов питания (20 тысяч на начало 2008 года) и т.д.

Корректное определение Г.С. и ее характеристик чрезвычайно важно для выбора дизайна исследования - стратегии построения репрезентативной выборки (см. ). Важнейшими характеристиками Г.С. являются ее объем и доступность элементов для определения.

С точки зрения объема, принято выделять конечные и бесконечные Г.С. Это деление является чисто техническим, оно обусловлено особенностями процедур оценивания объема и ошибок репрезентативной вероятностной (случайной) выборки. Конечными считаются Г.С., численность которых сопоставима с объемом выборки. Если объем выборки превышает несколько процентов от численности Г.С., ошибку выборки необходимо оценивать с поправкой на объем Г.С.

Бесконечными называются Г.С., объем которых, по сравнению с объемом репрезентативной случайной выборки, несоизмеримо велик. Строго говоря, все Г.С. в социальных науках конечны (даже если их численность составляет несколько миллиардов), однако на практике Г.С. можно считать бесконечной, если объем выборки, обеспечивающий приемлемый уровень ошибки, не превышает 1-2 % от ее численности. Иногда понятие бесконечности связывают непосредственно с объемом Г.С., например, более ста тысяч объектов.

Г.С., принадлежность к которым очевидна или легко устанавливается, называются конкретными. Для конкретных Г.С. несложно определить объем и получить относительно полный список их элементов - основу выборки (см. Выборки основа ). Например, список совершеннолетних жителей города можно получить в адресном столе, а списки студентов крупного города - в университетах. Если конкретная Г.С. очень велика (например, население страны), списки могут быть получены для всех ее структурных частей. Построение репрезентативной выборки случайной (см. ) для конкретных Г.С. технически всегда возможно; проблемы могут возникнуть в связи с недостатком времени, квалифицированного персонала или материальных ресурсов.

Г.С., принадлежность к которой можно установить только в результате целенаправленных процедур или специальных исследований, называются гипотетическими. К таким Г.С. относятся, например, аудитории СМК (нельзя узнать, видел ли человек конкретный рекламный ролик, если не спросить его об этом), любители определенных видов аквариумных рыбок, эксперты по узкой проблеме и т.п. Для определения объема некоторых гипотетических Г.С. также необходимы специальные исследования. Возможность построения репрезентативной выборки случайной (см. ) для гипотетичных Г.С. большого объема во многих случаях представляется проблематичной.

ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ ПАРАМЕТР - статистический термин, применяемый для обозначений любой количественной характеристики генеральной совокупности (см. ). Математическое ожидание (см. ), дисперсия (см. ), вероятность (см. ) положительного ответа, коэффициент корреляции между двумя случайными величинами (см. ) являются Г.С.П. Аналогичные характеристики выборки (см. ) называются статистиками выборочными (см. ).

Выборка (Выборочная совокупность) - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.
Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.

Характеристики выборки:

Качественная характеристика выборки - кого именно мы выбираем и какие способы построения выборки мы для этого используем.

Количественная характеристика выборки - сколько случаев выбираем, другими словами объём выборки.

Объём выборки — число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30—35.

Генеральная совокупность – множество тех людей, сведения о которых стремится получить социолог в своем исследовании. В зависимости от того, насколько широкой будет тема исследования, настолько же широка будет генеральная совокупность.

Выборочная совокупность – уменьшенная модель генеральной совокупности; те, кому социолог раздает анкеты, кого называют респондентами, кто, наконец, представляет собой объект социологического исследования.

Кого именно относить к генеральной совокупности, определяют цели исследования, а кого включать в выборочную совокупность решают математические методы. Если социолог намеревается взглянуть на афганскую войну глазами ее участников, в генеральную совокупность войдут все воины-афганцы, но опрашивать ему придется небольшую часть – выборочную совокупность. Для того чтобы выборка точно отражала генеральную совокупность, социолог придерживается правила: любой воин-афганец, независимо от места жительства, места работы, состояния здоровья и других обстоятельств, должен иметь одинаковую вероятность попасть в выборочную совокупность.

Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки . После чего решается вопрос о типе выборки.

Выборки делятся на три больших класса:

а) сплошные (переписи, референдумы). Опрашиваются все единицы из генеральной совокупности;

б) случайные ;

в) неслучайные.

Случайный и неслучайный типы выборки в свою очередь подразделяются на несколько видов.

К случайным относят:

1) вероятностную;

2) систематическую;

3) районированную (стратифицированную);

4) гнездовую.

К неслучайным относят:

1) «стихийную»;

2) квотную;

3) метод «основного массива».

Полный и точный перечень единиц выборочной совокупности образует основу выборки . Элементы, предназначенные для отбора, называются единицами отбора . Единицы отбора могут совпадать с единицами наблюдения, поскольку единицей наблюдения считается элемент генеральной совокупности, с которого непосредственно ведется сбор информации. Обычно единица наблюдения – это отдельный человек. Отбор из списка лучше всего производить, нумеруя единицы и используя таблицу случайных чисел, хотя часто используется квази-случайный метод, когда из перечня простого берется каждый n-й элемент.

Если основа выборки включает список единиц отбора, то структура выборки подразумевает их группирование по каким-то важным признакам, например, распределение индивидов по профессии, квалификации, полу или возрасту. Если в генеральной совокупности, к примеру, 30% молодежи, 50% людей среднего возраста и 20% пожилых, то и в выборочной совокупности должны соблюдаться те же самые процентные пропорции трех возрастов. К возрастам могут добавиться классы, пол, национальность и т.д. Для каждой устанавливаются процентные пропорции в генеральной и выборочной совокупности. Таким образом, структура выборки – процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность.

Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объем выборки сообщает о том, какое их количество попало сюда.

Объем выборки – количество единиц выборочной совокупности. Поскольку выборочная совокупность – это часть генеральной совокупности, отобранной с помощью специальных методов, ее объем всегда меньше объема генеральной. Поэтому так важно, чтобы часть не искажала представления о целом, то есть репрезентировала его.

На достоверность данных влияют не количественные характеристики выборочной совокупности (ее объем), а качественные характеристики генеральной совокупности – степень ее однородности. Расхождение между генеральной и выборочной совокупностью называется ошибкой репрезентативности , допустимое отклонение – 5%.

Вот некоторые способы избежать ошибки:

    каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;

    отбор желательно производить из однородных совокупностей;

    надо знать характеристики генеральной совокупности;

    при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.

Если выборочная совокупность (выборка) составлена правильно, то социолог получает надежные результаты, характеризующие всю генеральную совокупность.

Каковы же основные методы выборки ?

Метод механической выборки , когда из общего списка генеральной совокупности через равные промежутки отбирается необходимое число респондентов (например, каждый 10-й).

Метод серийной выборки . При этом генеральная совокупность разбивается на однородные части и из каждой пропорционально отбираются единицы анализа (например, по 20% мужчин и женщин на предприятии).

Метод гнездовой выборки . В качестве единиц отбора выступают не отдельные респонденты, а группы с последующим сплошным исследованием в них. Данная выборка будет представительна, если состав групп схож (например, по одной группе студентов из каждого потока какого-нибудь факультета вуза).

Метод основного массива – опрос 60–70% генеральной совокупности.

Метод квотной выборки . Наиболее сложный метод, требующий определения не менее четырёх признаков, по которым проводится отбор респондентов. Применяется обычно при большой генеральной совокупности.

Понятие репрезентативности. Концептуальный объект и генеральная совокупность. Проектируемый объект. Проектируемая и реальная генеральная совокупности.

Мы знаем, что социологическая наука имеет дело не с текучей непосредственностью жизни, а с данными, организованными по определенным правилам в пространстве признаков. Под данными имеются в виду значения переменных, приписанные единицам исследования - объектам. Эти объекты - сообщества, институции, люди, тексты, вещи - образуют в пространстве признаков многообразные и нередко причудливые конфигурации, давая исследователю возможность высказывать обобщающие суждения о действительности.

Как только речь заходит о действительности, обнаруживается, что полученные данные относятся, строго говоря, только к регистрационным документам (анкетам, бланкам интервью, протоколам наблюдения и т. п.). Нет никаких гарантий, что действительность за окнами лаборатории (скажем, по ту сторону шкал) не окажется иной. До выборочной процедуры мы еще не дошли, но уже встает вопрос о репрезентативности данных: можно ли распространить сведения, полученные в процессе обследования, на объекты, находящиеся за пределами нашего конкретного опыта? Ответ однозначен: можно. В противном случае наши наблюдения не выходили бы за рамки «здесьи-теперь-совокупности». Они относились бы не к москвичам, а к тем, кто только что был опрошен по телефону в Москве; не к читателям газеты «Неделя», а к тем, кто прислал в редакцию по почте заполненный отрывной купон. После завершения опроса мы обязаны считать, что и «москвичи», и «читатели» остались прежними. Мы верим в стабильность мира потому, что научные наблюдения обнаруживают удивительное постоянство.

Любое единичное наблюдение распространяется на более широкую сферу наблюдений, и проблема репрезентации заключается в том, чтобы установить степень соответствия между параметрами обследованной совокупности и «реальными» характеристиками объекта. Выборочная процедура предназначена как раз для того, чтобы реконструировать реальный объект исследования и генеральную совокупность из отдельных моментных наблюдений.

Понятие выборочной репрезентативности близко понятию внешней валидности; только в первом случае производится экстраполяция одной и той же характеристики на более широкую совокупность единиц, а во втором - переход из одного смыслового контекста в другой. Выборочная процедура осуществляется каждым человеком тысячу раз на дню, при этом никто особенно не задумывается над репрезентативностью наблюдений. Опыт заменяет калькуляцию. Чтобы узнать, хорошо ли посолена каша, вовсе не обязательно съедать всю кастрюлю - здесь более эффективны методы неразрушающего контроля, в том числе выборочная проверка: нужно попробовать одну ложечку. При этом надо быть уверенным, что каша хорошо перемешана. Если каша перемешана плохо, имеет смысл провести не один замер, а серию, т. е. попробовать в разных местах кастрюли - это уже выборка. Сложнее убедиться в том, что ответ студента на экзамене репрезентирует его знания, а не является случайной удачей либо неудачей. Для этого и задаются несколько вопросов. Предполагается, что, если бы студент ответил на все возможные вопросы по предмету, результат был бы «истинный», т. е. отражал реальные знания. Но тогда никто не смог бы выдержать экзамен.



В основании выборочной процедуры всегда лежит «если бы» - предположение о том, что экстраполяция наблюдений существенноне изменит полученный результат. Поэтому генеральную совокупность можно определить как «объективную возможность» выборочной совокупности.

Проблема несколько усложняется, если разобраться в том, что имеется в виду под объектом исследования. Изучив достаточно многочисленную совокупность людей, социолог приходит к выводу, что переменная «радикализм-консерватизм» положительно коррелирует с возрастом: в частности, старшие поколения обнаруживают скорее консервативность, чем революционность. Но обследованный объект - выборочная совокупность - не существует в реальности как таковой. Он сконструирован процедурой отбора респондентов и проведения интервью, а затем сразу же исчезает, растворяется в массиве. Действительно, выборочная совокупность, с которой непосредственно «снимаются» данные, порождается процедурой, но в то же время она растворена в большой совокупности, которую представляет или репрезентирует с разной степенью точности и надежности. Социологические заключения относятся не к обследованным на прошлой неделе респондентам, а к идеализированным объектам: «старшим поколениям», «молодежи», тем, кто обнаруживает «радикализм» или «консерватизм». Речь идет о категориальных обобщениях, не ограниченных пространственно-временными обстоятельствами. В этом отношении выборочная процедура помогает освободиться от наблюдений и перейти в мир идей.

Таким образом, у нас есть возможность провести разграничение объекта исследования и генеральной совокупности: объект - не просто совокупность единиц, а понятие, в соответствии с которым осуществляется идентификация и отбор единиц исследования. В этом отношении справедливо гегелевское предписание считать истинным только то бытие, которое соответствует своему понятию. Теоретически объем понятия, обозначающего объект исследования, должен соответствовать объему генеральной совокупности. Однако такое соответствие достигается крайне редко.

Нам понадобится понятие концептуального объекта - идеального конструкта, обозначающего рамки темы. «Россияне», «аудитория центральных газет», «электорат», «демократическая общественность» - таковы типичные объекты исследовательского интереса социологов. Несомненно, концептуальному объекту должна соответствовать вполне реальная генеральная совокупность. Для этого необходимо предусмотреть еще один объект исследования - проектируемый объект. Проектируемый объект - это совокупность доступных исследователю единиц. Задача состоит в том, чтобы установить группы, являющиеся недоступными либо труднодоступными для сбора данных.

Очевидно, что обследовать объект, обозначаемый как «россияне», практически невозможно. Среди россиян немало людей находится в тюрьмах, исправительно-трудовых учреждениях, в следственных изоляторах и иных труднодоступных для интервьюера местах. Эту группу придется «вычесть» из проектируемого объекта. «Вычесть» придется и многих пациентов психиатрических больниц, детей, часть престарелых. Вряд ли гражданскому социологу удастся обеспечить нормальные шансы на попадание в выборку и военнослужащим. Аналогичные проблемы сопровождают обследование читателей, избирателей, жителей малых городов, посетителей театров.

Перечисленные затруднения - лишь малая часть тех, зачастую непреодолимых препятствий, с которыми сталкивается социолог на полевой стадии исследования. Специалист должен предвидеть эти затруднения и не строить иллюзий по поводу полной реализации проектируемого объекта. В противном случае его ждут разочарования.

Итак, объект исследования не совпадает с генеральной совокупностью примерно так же, как карта местности не совпадает с самой местностью.

Долго думали-гадали, Генералы все писали на большом листу. Было гладко на бумаге, да забыли про овраги, А по ним ходить, -

эти слова из старинной солдатской песни вполне применимы к проектированию выборки, если учесть, что ходить придется по квартирам.

Несомненно, генеральная совокупность - это та совокупность, из которой производится выборка единиц. Однако так только кажется. Выборка производится из той совокупности, из которой производится фактический отбор респондентов. Назовем ее реальной. Различия между проектируемой и реальной совокупностями можно увидеть воочию, сравнив списки «проектированных» респондентов и опрошенных фактически.

Реальный объект - та совокупность, которая сформировалась на стадии полевого исследования с учетом ограничений в доступности первичной социологической информации. Помимо заключенных, военнослужащих и больных, меньшую вероятность попасть в выборку имеют жители удаленных от транспортных коммуникаций сел, особенно если обследование производится осенью; те, кого, как правило, нет дома, не склонны к разговорам с посторонними людьми и т. п. Бывает, что интервьюеры, пользуясь отсутствием контроля, пренебрегают точным исполнением своих обязанностей и опрашивают не тех, кого положено опрашивать по инструкции, а тех, кого легче «достать». Например, посещать квартиры респондентов интервьюерам приказано по вечерам, когда легче застать их дома. Если исследование проводится, предположим, в ноябре, то уже в пять часов вечера в средней полосе России на улице совершенно темно. Во многих городах таблички с названиями улиц и номерами домов встречаются не часто. Если обязанности интервьюеров выполняют студентки местного пединститута, можно представить степень отклонения реального объекта от проектируемого. Иногда исследователи поступают еще проще: заполняют анкеты сами. Эти затруднения являются одним из источников так называемых систематических ошибок выборки.

Существуют достаточно эффективные способы контроля заполнения вопросников и приемы ремонта выборки, в частности «взвешивание» основных типологических групп респондентов: группы тех, кого не хватает, увеличиваются, а избыточные группы уменьшаются. Так реальный массив подгоняется под проектируемый и это вполне оправданно.

http://www.hi-edu.ru/e-books/xbook096/01/index.html?part-011.htm – очень полезный сайт!

Выборочный метод исследования является основным статистическим методом. Это естественно, так как объем изучаемых объектов как правило бесконечен (и даже, если конечен, то весьма затруднительно перебрать все объекты, приходится довольствоваться лишь их частью, выборкой).

Генеральная и выборочная совокупности

Генеральной совокупностью называется совокупность всех исследуемых в данном эксперименте элементов.

Выборочной совокупностью (или выборкой) называется конечная совокупность объектов, случайно отобранных из генеральной совокупности.

Объемом совокупности (выборочной или генеральной) называется число объектов этой совокупности.

Пример генеральной и выборочной совокупностей

Допустим, исследуется психологическая предрасположенность человека к делению данного отрезка в отношении золотого сечения. Так как происхождение самого понятия золотого сечения продиктовано антропометрией человеческого тела, то понятно, что в данном случае генеральной совокупностью является любое антропогенное существо достигшее физической зрелости и приобретшее окончательные пропорции, то есть - вся взрослая часть человечества. Объем этой совокупности практически бесконечен.

Если же эта предрасположенность исследуется исключительно в художественной среде, то генеральная совокупность - это люди, имеющие непосредственное отношение к дизайну: художники, архитекторы, дизайнеры. Таких людей тоже очень много, и можно считать, что объем генеральной совокупности в данном случае тоже бесконечен.

И в том, и в другом случае для исследования мы вынуждены ограничиться разумными объемами выборок, выбирая в качестве представителей той и другой совокупностей студентов технических специальностей (как людей, далеких от художественного мира) или студентов специальности дизайн (как людей, имеющих непосредственное отношение к миру художественных образов).

Репрезентативность

Основной проблемой выборочного метода является вопрос о том, насколько точно объекты, отобранные из генеральной совокупности для исследования, представляют изучаемые характеристики генеральной совокупности, то есть - вопрос о репрезентативности выборки.

Итак, выборка называется репрезентативной (представительной), если она достаточно точно представляет количественные соотношения генеральной совокупности.

Разумеется, трудно сказать, что именно скрывается за расплывчатой формулировкой достаточно точно . Вопросы репрезентативности вообще являются наиболее спорными в любом экспериментальном исследовании. Имеется масса ставших уже классическими примеров, когда недостаточная представительность выборки приводила экспериментаторов к абсурдным результатам.

Как правило, вопросы репрезентативности решаются при помощи экспертной оценки, когда научное сообщество принимает точку зрения группы авторитетных специалистов по поводу корректности проведенного исследования.

Пример репрезентативности

Вернемся к примеру с делением отрезка. Вопросы репрезентативности выборок лежат здесь в самой основе исследования: мы ни в коем случае не должны смешивать группы испытуемых по признаку принадлежности их к художественной среде.

Статистическое распределение наблюдаемого признака

Частота наблюдаемого значения

Пусть в результате испытания в выборке объема наблюдаемый признакпринял значения,, …, причем значениенаблюдалосьраз, значение-раз, и т. д., значениенаблюдалосьраз. Тогда частотой наблюдаемого значенияназывается число, значения- числои т. д.

Относительная частота наблюдаемого значения

Относительной частотой наблюдаемого значенияпризнаканазывается отношение частотык объемувыборки:

Понятно, что сумма частот наблюдаемого признака должна давать объем выборки

а сумма относительных частот должна давать единицу:

Эти соображения можно использовать для контроля при составлении статистических таблиц. Если равенства не соблюдаются, то при протоколировании результатов эксперимента была допущена ошибка.

Статистическое распределение наблюдаемого значения

Статистическим распределением наблюдаемого признака называется соответствие между наблюдаемыми значениями признака и отвечающими им частотами (или относительными частотами).

Как правило, статистическое распределение записывается в виде двухстрочной таблицы, в которой в первой строке указываются наблюдаемые значения признака, а во второй - соответствующие им частоты (или относительные частоты):

Это наука, которая, основываясь на методах теории вероятностей, занимается систематизацией и обработкой статистических данных для получения научных и практических выводов.

Статистическими данными называются сведения о числе объектов, обладающих теми или иными признаками.

Группа объектов, объединенных по некоторому качественному или количественному признаку, называется статистической совокупностью . Объекты, входящие в совокупность, называются её элементами, а их общее число - ее объемом.

Генеральной совокупностью называется множество всех мыслимо возможных наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий или более строго: генеральной совокупностью называется случайная величина x и связанное с ней вероятностное пространство {W,Á,Р}.

Распределение случайной величины x называют распределением генеральной совокупности (говорят, например, о нормально распределенной или просто нормальной генеральной совокупности).

Например, если производится ряд независимых измерений случайной величины x, то генеральная совокупность теоретически бесконечна (т.е. генеральная совокупность - абстрактное, условно - математическое понятие); если же проверяется число дефектных изделий в партии из N изделий, то эту партию рассматривают как конечную генеральную совокупность объема N.

В случае социально-экономических исследований генеральной совокупностью объема N может быть население какого-то города, региона или страны, а измеряемыми признаками - доходы, расходы или объем сбережений отдельно взятого человека. Если какой-то признак имеет качественный характер (например, пол, национальность, социальное положение, род деятельности и т.п.), но принадлежит к конечному множеству вариантов, то он может быть также закодирован числом (как это часто делают в анкетах).

Если число объектов N достаточно велико, то провести сплошное обследование затруднительно, а иногда физически невозможно (например, проверить качество всех патронов). Тогда случайным образом отбирают из всей генеральной совокупности ограниченное число объектов и подвергают их изучению.

Выборочной совокупностью или просто выборкой объема n называется последовательность х 1 , х 2 , …, х n независимых одинаково распределенных случайных величин, распределение каждой из которых совпадает с распределением случайной величины x.

Например, результаты n первых измерений случайной величины x принято рассматривать как выборку объема n из бесконечной генеральной совокупности. Полученные данные называют наблюдениями случайной величины x, а также говорят, что случайная величина x "принимает значения" х 1 , х 2 , …, х n .


Основная задача математической статистики - сделать научно обоснованные выводы о распределении одной или более неизвестных случайных величин или их взаимосвязи между собой. Метод, состоящий в том, что на основании свойств и характеристик выборки делаются заключения о числовых характеристиках и законе распределения случайной величины (генеральной совокупности) называется выборочным методом.

Для того, чтобы характеристики случайной величины, полученные выборочным методом, были объективны, необходимо, чтобы выборка была репрезентативной, т.е. достаточно хорошо представляла исследуемую величину. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно, т.е. все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку. Для этого существуют различные виды отбора выборки.

1. Простым случайным отбором называется отбор, при котором объекты извлекаются по одному из всей генеральной совокупности.

2. Стратифицированный (расслоенный ) отбор заключается в том, что исходная генеральная совокупность объема N подразделяется на подмножества (страты) N 1 , N 2 ,…,N k , так что N 1 + N 2 +…+ N k = N. Когда страты определены, из каждого из них извлекается простая случайная выборка объема n 1 , n 2 , …, n k . Частным случаем стратифицированного отбора является типический отбор, при котором объекты отбирают не из всей генеральной совокупности, а из каждой типической ее части.

Комбинированный отбор сочетает в себе сразу несколько видов отбора, образующих различные фазы выборочного обследования. Существуют и другие методы организации выборки.

Выборка называется повторной , если отобранный объект перед выбором следующего возвращается в генеральную совокупность. Выборка называется бесповторной , если отобранный объект в генеральную совокупность не возвращается. Для конечной генеральной совокупности случайный отбор без возвращения приводит на каждом шаге к зависимости отдельных наблюдений, случайный равновозможный выбор с возвращением - к независимости наблюдений. На практике обычно имеют дело с бесповторными выборками. Тем не менее, когда объем генеральной совокупности N во много раз больше, чем объем выборки n (например, в сотни или тысячи раз), зависимостью наблюдений можно пренебречь.

Таким образом, случайная выборка х 1 , х 2 , …, х n - это результат последовательных и независимых наблюдений над случайной величиной ξ, представляющую генеральную совокупность, и все элементы выборки имеют тоже распределении, что исходная случайная величина x.

Функцию распределения F x (х) и другие числовые характеристики случайной величины x будем называть теоретическими, в отличие от выборочных характеристик , которые определяются по результатам наблюдений.

Пусть выборка х 1 , х 2 , …, х к есть результат независимых наблюдений случайной величины x, причем х 1 наблюдалось n 1 раз, х 2 - n 2 раза, …, х к - n к раз, так что n i = n - объем выборки. Число n i , показывающее, сколько раз появилось значение х i в n наблюдениях, называется частотой данного значения, а отношение n i /n = w i - относительной частотой . Очевидно, что числа w i рациональны и .

Статистическая совокупность, расположенная в порядке возрастания признака, называется вариационным рядом . Его члены обозначают x (1) , x (2), … x (n) и называют вариантами . Вариационный ряд называется дискретным , если его члены принимают конкретные изолированные значения. Статистическим распределением выборки дискретной случайной величины x называется перечень вариант и соответствующих им относительных частот w i . Полученная таблица называется статистическим рядом.

X (1) x (2) ... x k(k)
ω 1 ω 2 ... ω k

Наибольшее и наименьшее значения вариационного ряда обозначают x min и x max и называют крайними членами вариационного ряда.

Если изучается непрерывная случайная величина, то группировка заключается в разбиении интервала наблюдаемых значений на k частичных интервалов равной длины h, и подсчете числа попаданий наблюдений в эти интервалы. Полученные числа принимают за частоты n i (для некоторой новой, уже дискретной случайной величины). В качестве новых значений вариант x i обычно берутся середины интервалов (либо в таблице указываются сами интервалы). Согласно формуле Стерждеса рекомендуемое число интервалов разбиения k » 1 + log 2 n , а длины частичных интервалов равны h = (x max - x min)/k. Предполагается, что весь интервал имеет вид .

Графически статистические ряды могут быть представлены в виде полигона, гистограммы или графика накопленных частот.

Полигоном частот называют ломаную линию, отрезки которой соединяют точки (x 1 , n 1), (x 2 , n 2), …, (x k , n k). Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (x 1 , w 1), (x 2 , w 2), …, (x k , w k). Полигоны обычно служат для изображения выборки в случае дискретных случайных величин (рис. 7.1.1).

Рис. 7.1

.1.

Гистограммой относительных частот называется ступенчатая фигура, состоящая из прямоугольников, основанием которых служат частичные интервалы длиною h , а высоты

равны w i /h.

Гистограмма обычно служит для изображения выборки в случае непрерывных случайных величин. Площадь гистограммы равна единице (рис. 7.1.2). Если на гистограмме относительных частот соединить середины верхних сторон прямоугольников, то полученная ломанная образует полигон относительных частот. Поэтому гистограмму можно рассматривать как график эмпирической (выборочной) плотности распределения f n (x). Если у теоретического распределения существует конечная плотность, то эмпирическая плотность является некоторым приближением теоретической.

Графиком накопленных частот называется фигура, строящаяся аналогично гистограмме с той разницей, что для расчета высот прямоугольников берутся не простые, а накопленные относительные частоты , т.е. величины . Эти величины не убывают, и график накопленных частот имеет вид ступенчатой "лестницы" (от 0 до 1).

График накопленных частот на практике используются для приближения теоретической функции распределения.

Задача. Анализируется выборка из 100 малых предприятий региона. Цель обследования - измерение коэффициента соотношения заемных и собственных средств (х i) на каждом i-ом предприятии. Результаты представлены в таблице 7.1.1.

Таблица Коэффициенты соотношений заемных и собственных средств предприятий.

5,56 5,45 5,48 5,45 5,39 5,37 5,46 5,59 5,61 5,31
5,46 5,61 5,11 5,41 5.31 5,57 5,33 5,11 5,54 5,43
5,34 5,53 5,46 5,41 5,48 5,39 5,11 5,42 5,48 5,49
5,36 5,40 5,45 5,49 5,68 5,51 5,50 5,68 5,21 5,38
5,58 5,47 5,46 5,19 5,60 5,63 5,48 5,27 5,22 5,37
5,33 5,49 5,50 5,54 5,40 5.58 5,42 5,29 5,05 5,79
5,79 5,65 5,70 5,71 5,85 5,44 5,47 5,48 5,47 5,55
5,67 5,71 5,73 5,05 5,35 5,72 5,49 5,61 5,57 5,69
5,54 5,39 5,32 5,21 5,73 5,59 5,38 5,25 5,26 5,81
5,27 5,64 5,20 5,23 5,33 5,37 5,24 5,55 5,60 5,51

Построить гистограмму и график накопленных частот.

Решение . Построим группированный ряд наблюдений:

1. Определим в выборке х min = 5,05 и x max = 5,85;

2. Разобьем весь диапазон на k равных интервалов: k » 1 + log 2 100 = 7,62; k = 8, отсюда длина интервала

Таблица 7.1.2. Сгруппированный ряд наблюдений

Номер Интервала Интервалы Середины интервалов х i w i f n (x)
5,05-5,15 5,1 0,05 0,05 0,5
5,15-5,25 5,2 0,08 0,13 0,8
5,25-5,35 5,3 0,12 0,25 1,2
5,35-5,45 5,4 0,20 0,45 2,0
5,45-5,55 5,5 0,26 0,71 2,6
5,55-5,65 5,6 0,15 0,86 1,5
5,65-5,75 5,7 0,10 0,96 1,0
5,75-5,85 5,8 0,04 1,00 0,4

На рис. 7.1.3 и 7.1.4, построенных по данным таблицы 7.1.2, представлены гистограмма и график накопленных частот. Кривые соответствуют плотности и функции нормального распределения, "подобранного" к данным.

Таким образом, распределение выборки является некоторым приближением распределения генеральной совокупности.