Определить доверительный интервал среднего значения. Доверительный интервал для математического ожидания

Для подавляющего большинства простых измерений достаточно хорошо выполняется так называемый нормальный закон случайных погрешностей (закон Гаусса) , выведенный из следующих эмпирических положений.

1) погрешности измерений могут принимать непрерывный ряд значений;

2) при большом числе измерений погрешности одинаковой величины, но разного знака встречаются одинаково часто,

3) чем больше величина случайной погрешности, тем меньше вероятность ее появления.

График нормального закона распределения Гаусса представлен на рис.1. Уравнение кривой имеет вид

где - функция распределения случайных ошибок (погрешностей), характеризующая вероятность появления ошибки , σ – средняя квадратичная ошибка.

Величина σ не является случайной величиной и характеризует процесс измерений. Если условия измерений не изменяются, то σ остается постоянной величиной. Квадрат этой величины называют дисперсией измерений. Чем меньше дисперсия, тем меньше разброс отдельных значений и тем выше точность измерений.

Точное значение средней квадратичной ошибки σ, как и истинное значение измеряемой величины, неизвестно. Существует так называемая статистическая оценка этого параметра, в соответствии с которой средняя квадратичная ошибка равняется средней квадратичной ошибке среднего арифметического . Величина которой определяется по формуле

где - результат i -го измерения; - среднее арифметическое полученных значений; n – число измерений.

Чем больше число измерений, тем меньше и тем больше оно приближается к σ. Если истинное значение измеряемой величины μ, ее среднее арифметическое значение, полученное в результате измерений , а случайная абсолютная погрешность , то результат измерений запишется в виде .

Интервал значений от до , в который попадает истинное значение измеряемой величины μ, называется доверительным интервалом. Поскольку является случайной величиной, то истинное значение попадает в доверительный интервал с вероятностью α, которая называется доверительной вероятностью, или надежностью измерений. Эта величина численно равна площади заштрихованной криволинейной трапеции. (см. рис.)

Все это справедливо для достаточно большого числа измерений, когда близка к σ. Для отыскания доверительного интервала и доверительной вероятности при небольшом числе измерений, с которым мы имеем дело в ходе выполнения лабораторных работ, используется распределение вероятностей Стьюдента. Это распределение вероятностей случайной величины , называемой коэффициентом Стьюдента , дает значение доверительного интервала в долях средней квадратичной ошибки среднего арифметического .


Распределение вероятностей этой величины не зависит от σ 2 , а существенно зависит от числа опытов n. С увеличением числа опытов n распределение Стьюдента стремится к распределению Гаусса.

Функция распределения табулирована (табл.1). Значение коэффициента Стьюдента находится на пересечении строки, соответствующей числу измерений n , и столбца, соответствующего доверительной вероятности α

Вероятность того, что истинное значение измеряемой величины лежит внутри некоторого интервала, называется доверительной вероятностью , или коэффициентом надежности , а сам интервал - доверительным интервалом.

Каждой доверительной вероятности соответствует свой доверительный интервал. В частности, доверительной вероятности 0,67 соответствует доверительный интервал от до . Однако это утверждение справедливо только при достаточно большом числе измерений (более 10), да и вероятность 0,67 не представляется достаточно надежной - примерно в каждой из трех серий измерений y может оказаться за пределами доверительного интервала. Для получения большей уверенности в том, что значение измеряемой величины лежат внутри доверительного интервала, обычно задаются доверительной вероятностью 0,95 - 0,99. Доверительный интервал для заданной доверительной вероятности с учетом влияния числа измерений n можно найти, умножив стандартное отклонение среднего арифметического

.

на так называемый коэффициент Стьюдента. Коэффициенты Стьюдента для ряда значений и n приведены в таблице.

Таблица - Коэффициенты Стьюдента

Число измерений n Доверительная вероятность y
0,67 0,90 0,95 0,99
2,0 6,3 12,7 63,7
1,3 2,4 3,2 5,8
1,2 2,1 2,8 4,6
1,2 2,0 2,6 4,0
1,1 1,8 2,3 3,3
1,0 1,7 2,0 2,6

Окончательно, для измеряемой величины y при заданной доверительной вероятности y и числе измерений n получается условие

Величину мы будем называть случайной погрешностью величины y.

Пример: см. лекцию №5 – ряд чисел.

Определим

При числе измерений – 45 и доверительной вероятности – 0,95 получим, что коэффициент Стьюдента приблизительно равен 2,15. Тогда доверительный интервал для данного ряда измерений равен 62,6.

Промахи(грубая погрешность) - грубые погрешности, связанные с ошибками оператора или неучтенными внешними воздействиями. Их обычно исключают из результатов измерений. Промахи, как правило, вызываются невнимательностью. Они могут возникать также вследствие неисправности прибора.

Запишите задачу. Например: средний вес студента мужского пола в университете АВС составляет 90 кг . Вы будете тестировать точность предсказания веса студентов мужского пола в университете АВС в пределах данного доверительного интервала.

Составьте подходящую выборку. Вы будете использовать ее для сбора данных для тестирования гипотезы. Допустим, вы уже случайно выбрали 1000 студентов мужского пола.

Рассчитайте среднее значение и стандартное отклонение этой выборки. Выберите статистические величины (например, среднее значение и стандартное отклонение), которые вы хотите использовать для анализа вашей выборки. Вот как вычислить среднее значение и стандартное отклонение:

  • Для расчета среднего значения выборки сложите значения весов 1000 выбранных мужчин и разделите результат на 1000 (число мужчин). Допустим, получили средний вес, равный 93 кг.
  • Для расчета стандартного отклонения выборки необходимо найти среднее значение. Затем нужно вычислить дисперсию данных или среднее значение квадратов разностей от среднего. Найдя это число, просто возьмите квадратный корень из него. Допустим, в нашем примере стандартное отклонение равно 15 кг (заметим, что иногда эта информация может быть дана вместе с условием статистической задачи).
  • Выберите нужный доверительный уровень. Наиболее часто используемые доверительные уровни: 90 %, 95 % и 99 %. Он также может быть дан вместе с условием задачи. Допустим, вы выбрали 95 %.

  • Рассчитайте предел погрешности. Вы можете найти предел погрешности с помощью следующей формулы: Z a/2 * σ/√(n). Z a/2 = коэффициент доверия (где а = доверительный уровень), σ = стандартное отклонение, а n = размер выборки. Это формула показывает, что вы должны умножить критическое значение на стандартную ошибку. Вот как вы можете решить эту формулу, разбив ее на части:

    • Вычислите критическое значение или Z a/2 . Доверительный уровень равен 95 %. Преобразуйте проценты в десятичную дробь: 0,95 и разделите ее на 2, чтобы получить 0,475. Затем посмотрите в таблицу Z-оценок , чтобы найти соответствующее значение для 0,475. Вы найдете значение 1,96 (на пересечении строки 1,9 и столбца 0,06).
    • Возьмите стандартную ошибку (стандартное отклонение): 15 и разделите ее на квадратный корень из размера выборки: 1000. Вы получите: 15/31,6 или 0,47 кг.
    • Умножьте 1,96 на 0,47 (критическое значение на стандартную ошибку), чтобы получить 0,92 - предел погрешности.
  • Запишите доверительный интервал. Чтобы сформулировать доверительный интервал, просто запишите среднее значение (93) ± погрешность. Ответ: 93 ± 0,92. Вы можете найти верхнюю и нижнюю границы доверительного интервала, прибавляя и вычитая погрешность к/от средней величины. Итак, нижняя граница составляет 93 - 0,92 или 92,08, а верхняя граница составляет 93 + 0,92 или 93,92.

    • Вы можете использовать следующую формулу для вычисления доверительного интервала: x̅ ± Z a/2 * σ/√(n) , где x̅ - среднее значение.
  • Доверительный интервал для математического ожидания - это такой вычисленный по данным интервал, который с известной вероятностью содержит математическое ожидание генеральной совокупности. Естественной оценкой для математического ожидания является среднее арифметическое её наблюденных значений. Поэтому далее в течение урока мы будем пользоваться терминами "среднее", "среднее значение". В задачах рассчёта доверительного интервала чаще всего требуется ответ типа "Доверительный интервал среднего числа [величина в конкретной задаче] находится от [меньшее значение] до [большее значение]". С помощью доверительного интервала можно оценивать не только средние значения, но и удельный вес того или иного признака генеральной совокупности. Средние значения, дисперсия, стандартное отклонение и погрешность, через которые мы будем приходить к новым определениям и формулам, разобраны на уроке Характеристики выборки и генеральной совокупности .

    Точечная и интервальная оценки среднего значения

    Если среднее значение генеральной совокупности оценивается числом (точкой), то за оценку неизвестной средней величины генеральной совокупности принимается конкретное среднее, которое рассчитано по выборке наблюдений. В таком случае значение среднего выборки - случайной величины - не совпадает со средним значением генеральной совокупности. Поэтому, указывая среднее значение выборки, одновременно нужно указывать и ошибку выборки. В качестве меры ошибки выборки используется стандартная ошибка , которая выражена в тех же единицах измерения, что и среднее. Поэтому часто используется следующая запись: .

    Если оценку среднего требуется связать с определённой вероятностью, то интересующий параметр генеральной совокупности нужно оценивать не одним числом, а интервалом. Доверительным интервалом называют интервал, в котором с определённой вероятностью P находится значение оцениваемого показателя генеральной совокупности. Доверительный интервал, в котором с вероятностью P = 1 - α находится случайная величина , рассчитывается следующим образом:

    ,

    α = 1 - P , которое можно найти в приложении к практически любой книге по статистике.

    На практике среднее значение генеральной совокупности и дисперсия не известны, поэтому дисперсия генеральной совокупности заменяется дисперсией выборки , а среднее генеральной совокупности - средним значением выборки . Таким образом, доверительный интервал в большинстве случаев рассчитывается так:

    .

    Формулу доверительного интервала можно использовать для оценки среднего генеральной совокупности, если

    • известно стандартное отклонение генеральной совокупности;
    • или стандартное отклонение генеральной совокупности не известно, но объём выборки - больше 30.

    Среднее значение выборки является несмещённой оценкой среднего генеральной совокупности . В свою очередь, дисперсия выборки не является несмещённой оценкой дисперсии генеральной совокупности . Для получения несмещённой оценки дисперсии генеральной совокупности в формуле дисперсии выборки объём выборки n следует заменить на n -1.

    Пример 1. Собрана информация из 100 случайно выбранных кафе в некотором городе о том, что среднее число работников в них составляет 10,5 со стандартным отклонением 4,6. Определить доверительный интервал 95% числа работников кафе.

    где - критическое значение стандартного нормального распределения для уровня значимости α = 0,05 .

    Таким образом, доверительный интервал 95% среднего числа работников кафе составил от 9,6 до 11,4.

    Пример 2. Для случайной выборки из генеральной совокупности из 64 наблюдений вычислены следующие суммарные величины:

    сумма значений в наблюдениях ,

    сумма квадратов отклонения значений от среднего .

    Вычислить доверительный интервал 95 % для математического ожидания.

    вычислим стандартное отклонение:

    ,

    вычислим среднее значение:

    .

    Подставляем значения в выражение для доверительного интервала:

    где - критическое значение стандартного нормального распределения для уровня значимости α = 0,05 .

    Получаем:

    Таким образом, доверительный интервал 95% для математического ожидания данной выборки составил от 7,484 до 11,266.

    Пример 3. Для случайной выборки из генеральной совокупности из 100 наблюдений вычислено среднее значение 15,2 и стандартное отклонение 3,2. Вычислить доверительный интервал 95 % для математического ожидания, затем доверительный интервал 99 %. Если мощность выборки и её вариация остаются неизменными, а увеличивается доверительный коэффициент, то доверительный интервал сузится или расширится?

    Подставляем данные значения в выражение для доверительного интервала:

    где - критическое значение стандартного нормального распределения для уровня значимости α = 0,05 .

    Получаем:

    .

    Таким образом, доверительный интервал 95% для среднего данной выборки составил от 14,57 до 15,82.

    Вновь подставляем данные значения в выражение для доверительного интервала:

    где - критическое значение стандартного нормального распределения для уровня значимости α = 0,01 .

    Получаем:

    .

    Таким образом, доверительный интервал 99% для среднего данной выборки составил от 14,37 до 16,02.

    Как видим, при увеличении доверительного коэффициента увеличивается также критическое значение стандартного нормального распределения, а, следовательно, начальная и конечная точки интервала расположены дальше от среднего, и, таким образом, доверительный интервал для математического ожидания увеличивается.

    Точечная и интервальная оценки удельного веса

    Удельный вес некоторого признака выборки можно интерпретировать как точечную оценку удельного веса p этого же признака в генеральной совокупности. Если же эту величину нужно связать с вероятностью, то следует рассчитать доверительный интервал удельного веса p признака в генеральной совокупности с вероятностью P = 1 - α :

    .

    Пример 4. В некотором городе два кандидата A и B претендуют на пост мэра. Случайным образом были опрошены 200 жителей города, из которых 46% ответили, что будут голосовать за кандидата A , 26% - за кандидата B и 28% не знают, за кого будут голосовать. Определить доверительный интервал 95% для удельного веса жителей города, поддерживающих кандидата A .

    Константин Кравчик доходчиво объясняет, что такое доверительный интервал в медицинских исследованиях и как его использовать

    «Катрен-Стиль» продолжает публикацию цикла Константина Кравчика о медицинской статистике. В двух предыдущих статьях автор касался объяснения таких понятий, как и .

    Константин Кравчик

    Математик-аналитик. Специалист в области статистических исследований в медицине и гуманитарных науках

    Город: Москва

    Очень часто в статьях по клиническим исследованиям можно встретить загадочное словосочетание: «доверительный интервал» (95 % ДИ или 95 % CI - confidence interval). Например, в статье может быть написано: «Для оценки значимости различий использовали t-критерий Стьюдента с расчетом 95 % доверительного интервала».

    Какого же значение «95 % доверительного интервала» и зачем его рассчитывать?

    Что такое доверительный интервал? - Это диапазон, в котором находятся истинные средние значения в генеральной совокупности. А что, бывают «неистинные» средние значения? В каком‑то смысле да, бывают. В мы объясняли, что невозможно измерить интересующий параметр во всей генеральной совокупности, поэтому исследователи довольствуются ограниченной выборкой. В этой выборке (например, по массе тела) есть одно среднее значение (определенный вес), по которому мы и судим о среднем значении во всей генеральной совокупности. Однако едва ли средний вес в выборке (особенно небольшой) совпадет со средним весом в генеральной совокупности. Поэтому более правильно рассчитывать и пользоваться диапазоном средних значений генеральной совокупности.

    Например, представим, что 95 % доверительный интервал (95 % ДИ) по гемоглобину составляет от 110 до 122 г/л. Это означает, что с вероятностью 95 % истинное среднее значение по гемоглобину в генеральной совокупности будет находиться в пределах от 110 до 122 г/л. Иными словами, мы не знаем средний показатель гемоглобина в генеральной совокупности, но можем с 95 %-й вероятностью указать диапазон значений для этого признака.

    Доверительный интервал особенно уместен для разницы в средних значениях между группами или, как это называют, в размере эффекта.

    Допустим, мы сравнивали эффективность двух препаратов железа: давно присутствующего на рынке и только что зарегистрированного. После курса терапии оценили концентрацию гемоглобина в исследуемых группах пациентов, и статистическая программа нам посчитала, что разность между средними значениями двух групп с вероятностью 95 % находится в диапазоне от 1,72 до 14,36 г/л (табл. 1).

    Табл. 1. Критерий для независимых выборок
    (сравниваются группы по уровню гемоглобина)

    Трактовать это следует так: у части пациентов генеральной совокупности, которая принимает новый препарат, гемоглобин будет выше в среднем на 1,72–14,36 г/л, чем у тех, кто принимал уже известный препарат.

    Иными словами, в генеральной совокупности разность в средних значениях по гемоглобину у групп с 95 %-й вероятностью находится в этих пределах. Судить, много это или мало, будет уже исследователь. Смысл всего этого в том, что мы работаем не с одним средним значением, а с диапазоном значений, следовательно, мы более достоверно оцениваем разницу по параметру между группами.

    В статистических пакетах, на усмотрение исследователя, можно самостоятельно сужать или расширять границы доверительного интервала. Снижая вероятности доверительного интервала, мы сужаем диапазон средних. Например, при 90 % ДИ диапазон средних (или разницы средних) будет уже, чем при 95 %.

    И наоборот, увеличение вероятности до 99 % расширяет диапазон значений. При сравнении групп нижняя граница ДИ может пересечь нулевую отметку. Например, если мы расширили границы доверительного интервала до 99 %, то границы интервала расположились от –1 до 16 г/л. Это означает, что в генеральной совокупности есть группы, различие средних между которыми по изучаемому признаку равняется 0 (М=0).

    При помощи доверительного интервала можно проверять статистические гипотезы. Если доверительный интервал пересекает нулевое значение, то нулевая гипотеза, предполагающая, что группы не различаются по изучаемому параметру, верна. Пример описан выше, когда мы расширили границы до 99 %. Где‑то в генеральной совокупности у нас нашлись группы, которые никак не различались.

    95% доверительный интервал разницы по гемоглобину, (г/л)


    На рисунке в виде линии изображен 95 % доверительный интервал разницы средних значений по гемоглобину между двумя группами. Линия проходит нулевую отметку, следовательно, имеет место разница между средними значениями, равная нулю, что подтверждает нулевую гипотезу о том, что группы не различаются. Диапазон разницы между группами лежит от –2 до 5 г/л, Это означает, что гемоглобин может как снизиться на 2 г/л, так и повыситься на 5 г/л.

    Доверительный интервал - очень важный показатель. Благодаря ему можно посмотреть, были ли различия в группах действительно за счет разности средних или за счет большой выборки, т. к. при большой выборке шансы найти различия больше, чем при малой.

    На практике это может выглядеть так. Мы взяли выборку в 1000 человек, измерили уровень гемоглобина и обнаружили, что доверительный интервал разницы средних лежит от 1,2 до 1,5 г/л. Уровень статистической значимости при этом p

    Мы видим, что концентрация гемоглобина повысилась, но практически незаметно, следовательно, статистическая значимость появилась именно за счет объема выборки.

    Доверительный интервал может быть высчитан не только для средних значений, но и для пропорций (и отношений рисков). Например, нас интересует доверительный интервал пропорций пациентов, которые достигли ремиссии, принимая разработанное лекарство. Допустим, что 95 % ДИ для пропорций, т. е. для доли таких пациентов, лежит в пределах 0,60–0,80. Таким образом, мы можем сказать, что наше лекарство оказывает терапевтический эффект от 60 до 80 % случаев.

    Случайные статьи

    Вверх