Перейти к содержимому

Разница между дисперсией выборки & дисперсией популяции

    Пояснение

    В статистике термин «выборка» означает отбор части совокупных статистических данных с целью получения соответствующей информации о целом. Совокупность или совокупность статистической информации определенного характера всех членов, охваченных исследованием, называется «населением» или «вселенной». (Das, N.G., 2010). Отобранная часть населения, которая используется для получения характеристик населения или совокупности, называется «выборкой». Популяция состоит из отдельных единиц или членов, и некоторые из них включаются в выборку. Общее число единиц популяции называется численностью популяции, а численность выборки — численностью выборки. Популяция и выборка могут быть конечными или бесконечными, а также существующими или гипотетическими.

    Дисперсия: Дисперсия — это числовое значение, которое показывает, насколько широко отдельные цифры в наборе данных распределяются относительно среднего значения. То есть насколько далеко каждое число находится от среднего, а значит, и друг от друга. Дисперсия, равная нулю, означает, что все данные идентичны. Чем больше дисперсия, тем больше значения разбросаны относительно среднего, а значит, и друг от друга. Чем меньше дисперсия, тем меньше значения разбросаны относительно среднего, следовательно, друг от друга, и дисперсия не может быть отрицательной.

    Разница между дисперсией популяции и дисперсией выборки

    Основное различие между дисперсией популяции и дисперсией выборки связано с расчетом дисперсии. Дисперсия рассчитывается в пять этапов. Сначала рассчитывается среднее значение, затем вычисляются отклонения от среднего, в-третьих, эти отклонения возводятся в квадрат, в-четвертых, возведенные в квадрат отклонения суммируются, и, наконец, эта сумма делится на количество элементов, для которых рассчитывается дисперсия. Таким образом, дисперсия = Σ(xi-x-)/n. Где xi = ith. число, x- = среднее и n = число предметов.

    Теперь, когда дисперсия должна быть рассчитана на основе данных популяции, n равно числу элементов. Таким образом, если дисперсия кровяного давления всех 1000 человек должна быть рассчитана на основе данных о кровяном давлении всех 1000 человек, то n = 1000. Однако если дисперсия рассчитывается на основе выборочных данных, то перед делением суммы квадратов отклонений из n следует вычесть 1. Таким образом, в приведенном выше примере, если выборочные данные содержат 100 элементов, знаменатель будет равен 100 — 1 = 99.

    В связи с этим значение дисперсии, рассчитанное по выборочным данным, выше, чем то, которое можно было бы получить, используя данные о популяции. Логика этого заключается в том, чтобы компенсировать недостаток информации о данных популяции. Выяснить дисперсию высот у людей невозможно из-за абсолютного отсутствия информации о высотах всех живущих людей, не говоря уже о будущем. Даже если мы возьмем один умеренный пример, например, данные о росте всех живущих мужчин в США, это физически возможно, но затраты и время, связанные с этим, уничтожат цель его расчета. По этой причине для большинства статистических целей берутся выборочные данные, что сопровождается отсутствием информации о большинстве данных. Чтобы компенсировать это, значение дисперсии и стандартного отклонения, которое представляет собой квадратный корень из дисперсии, выше в случае выборочных данных, чем дисперсия из популяционных данных.

    Это служит автоматической защитой для аналитиков и лиц, принимающих решения. Эта логика применима для принятия решений в области капитального бюджетирования, личных и бизнес-финансов, строительства, управления дорожным движением и многих других областях. Это помогает заинтересованным лицам быть в безопасности при принятии решения или для других выводов.

    Резюме: Популяционная дисперсия — это значение дисперсии, рассчитанное по популяционным данным, а выборочная дисперсия — это дисперсия, рассчитанная по выборочным данным. В связи с этим значение знаменателя в формуле для дисперсии в случае выборочных данных равно «n-1», а в случае популяционных данных — «n». В результате дисперсия и стандартное отклонение, полученные по выборочным данным, больше, чем те, которые были получены по данным популяции.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    Adblock
    detector