Стандартная ошибка онлайн - IT Новости
Microclimate.su

IT Новости
259 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Стандартная ошибка онлайн

Понятие об ошибке выборки.

Онлайн школа английского языка нового поколения. Более 7 лет предоставляет обучение английскому языку по Skype (Скайп) и является лидером данного направления! Основные преимущества:

    Вводный урок бесплатно; Большое число опытных преподавателей (нейтивов и русскоязычных); Курсы НЕ на определенный срок (месяц, полгода, год), а на конкретное количество занятий (5, 10, 20, 50); Более 10 000 довольных клиентов. Стоимость одного занятия с русскоязычным преподавателем — от 600 рублей, с носителем языка — от 1500 рублей

Стандартная ошибка статистики, т.е. оценка стандартного отклонения ее выборочного распределения, приближенно показывает, насколько значение статистики может отличаться от своего среднего значения (параметра генеральной совокупности).

Стандартная ошибка среднего (или просто стандартная ошибка) приближенно показывает, насколько ее выборочная средняя (случайная наблюдаемая величина) отличается от среднего генеральной совокупности μ (фиксированная неизвестная величина):

(7.1)

Стандартная ошибка уменьшается с увеличением размера выборки n (при прочих равных условиях), отражая тот факт, что большая по размеру выборка содержит больше информации и таким образом достигается большая точность.

Когда объем генеральной совокупности настолько мал, что выборка составляет достаточно большую часть генеральной совокупности, стандартную ошибку можно уменьшить, введя в формулу корректирующий (поправочный) коэффициент для конечной совокупности, чтобы получить уточненную (откорректированную) стандартную ошибку:

(7.2)

Кроме того, формулу (7.1) используют повторной выборке, а формулу (7.2) – для бесповторной, однако, если объем выборочной совокупности достаточно большой, то поправочный коэффициент не играет большой роли и стандартная ошибка для бесповторной выборки определяется по формуле (7.1).

Для измерения стандартной ошибки доли альтернативного признака применяют другие формулы. При повторной выборке:

(7.3)

При бесповторной выборке:

(7.4)

Теоретическую (идеальную) генеральную совокупность можно определить; как очень большую, иногда предполагаемую (воображаемую) генеральную совокупность, которую представляет ваша выборка. Если вас интересует теоретическая генеральная совокупность, не используйте поправку на конечность генеральной совокупности. С другой стороны, если необходимо сделать вывод об основе выборки, не выходя за ее пределы, то поправка может быть полезной, так как ее использование уменьшает вариацию системы. Если есть сомнения, лучше не использовать поправку.

Стандартная ошибка доли показывает неопределенность, или изменчивость, в наблюдаемой доле , а стандартная ошибка среднего–неопределенность в наблюдаемой частоте х.

Доверительным интервалом называют интервал, рассчитанный из данных таким образом, что существует известная вероятность включения интересующего вас (неизвестного) параметра генеральной совокупности в интервал, и эта вероятность интерпретируется с точки зрения случайного эксперимента начинающегося с извлечения случайной выборки. Границы доверительного интервала определяются на основе точечной оценки и предельной ошибки выборки, которая равна произведению стандартной ошибки и — критерия Стьюдента. Предельная ошибка выборки показывает максимально возможную ошибку для принятой вероятности, а доверительное число – как соотносятся предельная и стандартная ошибки.

(7.3)

Вероятность того, что параметр совокупности будет принадлежать доверительному интервалу называют уровнем доверительности, который обычно устанавливают равным 95%, хотя часто используют и другие уровни – 90; 99; 99,9%. Чем выше уровень доверительности, тем шире (а значит, и менее полезен) доверительный интервал. Приблизительная обобщенная формулировка утверждения о доверительном интервале имеет следующий вид: мы уверены на 95%, что значение параметра генеральной совокупности находится между значением оценки минус две стандартные ошибки оценки и значением оценки плюс две стандартные ошибки оценки.

Это утверждение основано на том факте, что при нормальном распределении с вероятностью 0,95 следует ожидать значения на расстоянии , т.е. приблизительно два стандартных отклонения от среднего.

Формулировка утверждения о двустороннем 95% доверительном интервале для среднего генеральной совокупности имеет следующий вид:

мы уверены, на 95%, что среднее генеральной совокупности m находится между и , где значение t берется из t-таблицы.

(7.4)

Формулировка утверждения о двустороннем 95% доверительном интервале для генеральной доли имеет следующий вид:

мы уверены на 95%, что доля интересующего нас свойства в генеральной совокупности р находится между и , где значение t берется из t-таблицы.

(7.5)

Чтобы получить доверительный уровень, отличный от 95%, следует просто при построении доверительного интервала использовать соответствующее значение. t-таблицу используют для коррекции дополнительной неопределенности, обусловленной тем, что вместо неизвестного точного значения изменчивости генеральной совокупности используют оценку (стандартную ошибку). Когда вы работаете с бесповторной выборкой размера п, число степеней свободы, равное , представляет собой количество независимых элементов информации, использованных при вычислении стандартной ошибки (поскольку при вычислении стандартного отклонения из наблюдаемых значений вычитают среднее). Если известно точное значение стандартной ошибки, используют t-значение для бесконечного числа степеней свободы.

Для того чтобы использование доверительного интервала было корректным, необходимо выполнение двух следующих условий:

(1) данные должны представлять собой случайную выборку из рассматриваемой генеральной совокупности;

(2) измеренные значения должны подчиняться нормальному распределению.

Читать еще:  Как изменять html код страницы

Первое условие гарантирует, что данные правильно представляют неизвестный параметр, а второе дает основание использовать t-таблицу для вычисления вероятности.

Односторонний доверительный интервал с известной доверительностью указывает, что среднее генеральной совокупности либо не меньше, либо не больше некоторого вычисленного значения. Граничное значение для одностороннего доверительного интервала вычисляется таким же образом, как и для двустороннего интервала, только t-значение для двустороннего интервала заменяется на t-значение для одностороннего интервала и выбирается граничная точка интервала так, чтобы построенный односторонний интервал включал выборочное среднее .

При использовании одностороннего интервала вы должны быть уверены, что независимо от поведения данных вы будете использовать односторонний интервал с той же стороны (т.е. открытый в сторону больших значений или открытый в сторону меньших значений). В противном случае использование одностороннего доверительного интервала некорректно. При наличии сомнений лучше использовать двусторонний интервал. Утверждение об одностороннем доверительном интервале формулируется следующим образом:

мы уверены на 95%, что среднее генеральной совокупности не меньше, чем ; или мы уверены на 95%, что среднее генеральной совокупности не больше, чем .

Интервал предсказания позволяет использовать данные выборки для предсказания с известной вероятностью значения нового наблюдения при условии, что это новое наблюдение получено тем же способом, что и предшествующие. В качестве меры неопределенности здесь используется стандартная ошибка предсказания , мера изменчивости расстояния между средним значением выборки и новым наблюдением. Интервал предсказания строят тем же способом, что и доверительный интервал; просто заменяют стандартную ошибку среднего на, стандартную ошибку предсказания. Формулировка утверждения об интервале предсказания (двустороннем) для значения нового наблюдения будет следующей:

Мы уверены на 95%, что новое наблюдение будет находиться между и .

Формулировка утверждения об интервале предсказания (одностороннем) для значения нового наблюдения будет такой:

Мы уверены на 95%, что новое наблюдение будет не меньше, чем ; или мы уверены на 95%, что новое наблюдение будет не больше, чем .

Выбирая соответствующие t-значение из таблицы, интервалы предсказания для уровней доверительности, отличных от 95%, необходимо помнить, что доверительный интервал дает информацию о среднем генеральной совокупности, в то время как интервал предсказания дает информацию о единственном наблюдении, случайно выбранном из той же генеральной совокупности.

Оценка погрешности прямых измерений

Вычисляет погрешность прямых измерений для заданной выборки и доверительного интервала.

Измеряя линей­ные размеры предметов измерительными инстру­ментами : линейкой, штангенциркулем, микрометром, проводя измерения времени секундомером или силы электрического тока или величины напряжения соответствующими электроизмерительными приборами Вы проводите прямые измерения.

Погрешность измерений

Любое измерение проводится с определенной точностью, при этом измеренное значение всегда отличается от истинного, так как инструменты измерения, методики и органы чувств человека несовершенны. Поэтому важную роль играет оценка погрешности измерений, результат измерений с учетом погрешности записывается в виде: X ± ΔX, где ΔX — абсолютная погрешность измерений.

Случайные и систематичес­кие погрешности

Погрешности подразделяются на случайные и систематичес­кие.
Систематические погрешности остаются постоянными или закономерно меняются в процессе измерения. Например неточность прибора, неправильная его регулировка ведет к систематической погрешности. Если причина систематической погрешности известна, то чаще всего такую погрешность можно исключить.
Случайные погрешности вызваны различными случайными факторами, влияющими на точность измерений. Например, при измерении секундомером отрезков времени, случайные погрешности связаны с различным (случайным) временем реакции экспериментатора на события запускающие и останавливающие секундомер. Чтобы уменьшить влияние случайной погрешности необходимо проводить многократное измерение физической величины.
Калькулятор ниже вычисляет случайную погрешность выборки прямых измерений для заданного доверительного интервала. Немного теории можно найти сразу за калькулятором.

Расчет погрешностей непосредственных измерений.

Измерения

arrow_upward arrow_downwardЗначениеmode_edit

Размер страницы:

Измерения

Импортировать данные Ошибка импорта

  • backup
  • Выбрать

В большинстве случаев результат измерения подчиняется нормальному закону распределения, поэтому истинное значение измерения будет равно пределу:

В случае ограниченного количества измерений, наиболее близким к истинному будет среднее арифметическое:

Согласно элементарной теории ошибок Гаусса случайную погрешность отдельного измерения характеризует так называемое среднеквадратическое отклонение:
, квадрат этой величины называется дисперсией. При увеличении этой величины возрастает разброс результатов измерений, т. е. увеличивается погрешность.

Для оценки погрешности всей серии измерений, вместо отдельного измерения надо найти среднюю квадратичную погрешность среднего арифметического, характеризующую отклонение от истинного значения искомой величины .
По закону сложения ошибок среднее арифметическое имеет меньшую ошибку, чем результат каждого отдельного измерения. Cред­няя квадратичная погрешность среднего арифметического равна:

Стандартная случайная погрешность Δх равна:
, где — коэффициент Стьюдента для заданной доверительной вероятности и числа степеней свободы k = n-1.
Коэффициент Стьюдента можно получить по таблице или воспользоваться нашим калькулятором для вычисления квантилей распределения Стьюдента: Квантильная функция распределения Стьюдента. Следует иметь в виду, что квантильная функция выдает значения одностороннего критерия Стьюдента. Значение двустороннего квантиля для заданной доверительно вероятности соответствует значению одностороннего квантиля для вероятности:

Стандартная ошибка средней арифметической

Среднее арифметическое, как известно, используется для получения обобщающей характеристики некоторого набора данных. Если данные более-менее однородны и в них нет аномальных наблюдений (выбросов), то среднее хорошо обобщает данные, сведя к минимуму влияние случайных факторов (они взаимопогашаются при сложении).

Когда анализируемые данные представляют собой выборку (которая состоит из случайных значений), то среднее арифметическое часто (но не всегда) выступает в роли приближенной оценки математического ожидания. Почему приближенной? Потому что среднее арифметическое – это величина, которая зависит от набора случайных чисел, и, следовательно, сама является случайной величиной. При повторных экспериментах (даже в одних и тех же условиях) средние будут отличаться друг от друга.

Для того, чтобы на основе статистического анализа данных делать корректные выводы, необходимо оценить возможный разброс полученного результата. Для этого рассчитываются различные показатели вариации. Но то исходные данные. И как мы только что установили, среднее арифметическое также обладает разбросом, который необходимо оценить и учитывать в дальнейшем (в выводах, в выборе метода анализа и т.д.).

Интуитивно понятно, что разброс средней должен быть как-то связан с разбросом исходных данных. Основной характеристикой разброса средней выступает та же дисперсия.

Дисперсия выборочных данных – это средний квадрат отклонения от средней, и рассчитать ее по исходным данным не составляет труда, например, в Excel предусмотрены специальные функции. Однако, как же рассчитать дисперсию средней, если в распоряжении есть только одна выборка и одно среднее арифметическое?

Расчет дисперсии и стандартной ошибки средней арифметической

Чтобы получить дисперсию средней арифметической нет необходимости проводить множество экспериментов, достаточно иметь только одну выборку. Это легко доказать. Для начала вспомним, что средняя арифметическая (простая) рассчитывается по формуле:

где xi – значения переменной,
n – количество значений.

Теперь учтем два свойства дисперсии, согласно которым, 1) — постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат и 2) — дисперсия суммы независимых случайных величин равняется сумме соответствующих дисперсий. Предполагается, что каждое случайное значение xi обладает одинаковым разбросом, поэтому несложно вывести формулу дисперсии средней арифметической:

Используя более привычные обозначения, формулу записывают как:

где σ 2 – это дисперсия, случайной величины, причем генеральная.

На практике же, генеральная дисперсия известна далеко не всегда, точнее совсем редко, поэтому в качестве оной используют выборочную дисперсию:

Стандартное отклонение средней арифметической называется стандартной ошибкой средней и рассчитывается, как квадратный корень из дисперсии.

Формула стандартной ошибки средней при использовании генеральной дисперсии

Формула стандартной ошибки средней при использовании выборочной дисперсии

Последняя формула на практике используется чаще всего, т.к. генеральная дисперсия обычно не известна. Чтобы не вводить новые обозначения, стандартную ошибку средней обычно записывают в виде соотношения стандартного отклонения выборки и корня объема выборки.

Назначение и свойство стандартной ошибки средней арифметической

Стандартная ошибка средней много, где используется. И очень полезно понимать ее свойства. Посмотрим еще раз на формулу стандартной ошибки средней:

Числитель – это стандартное отклонение выборки и здесь все понятно. Чем больше разброс данных, тем больше стандартная ошибка средней – прямо пропорциональная зависимость.

Посмотрим на знаменатель. Здесь находится квадратный корень из объема выборки. Соответственно, чем больше объем выборки, тем меньше стандартная ошибка средней. Для наглядности изобразим на одной диаграмме график нормально распределенной переменной со средней равной 10, сигмой – 3, и второй график – распределение средней арифметической этой же переменной, полученной по 16-ти наблюдениям (которое также будет нормальным).

Судя по формуле, разброс стандартной ошибки средней должен быть в 4 раза (корень из 16) меньше, чем разброс исходных данных, что и видно на рисунке выше. Чем больше наблюдений, тем меньше разброс средней.

Казалось бы, что для получения наиболее точной средней достаточно использовать максимально большую выборку и тогда стандартная ошибка средней будет стремиться к нулю, а сама средняя, соответственно, к математическому ожиданию. Однако квадратный корень объема выборки в знаменателе говорит о том, что связь между точностью выборочной средней и размером выборки не является линейной. Например, увеличение выборки с 20-ти до 50-ти наблюдений, то есть на 30 значений или в 2,5 раза, уменьшает стандартную ошибку средней только на 36%, а со 100-а до 130-ти наблюдений (на те же 30 значений), снижает разброс данных лишь на 12%.

Лучше всего изобразить эту мысль в виде графика зависимости стандартной ошибки средней от размера выборки. Пусть стандартное отклонение равно 10 (на форму графика это не влияет).

Видно, что примерно после 50-ти значений, уменьшение стандартной ошибки средней резко замедляется, после 100-а – наклон постепенно становится почти нулевым.

Таким образом, при достижении некоторого размера выборки ее дальнейшее увеличение уже почти не сказывается на точности средней. Этот факт имеет далеко идущие последствия. Например, при проведении выборочного обследования населения (опроса) чрезмерное увеличение выборки ведет к неоправданным затратам, т.к. точность почти не меняется. Именно поэтому количество опрошенных редко превышает 1,5 тысячи человек. Точность при таком размере выборки часто является достаточной, а дальнейшее увеличение выборки – нецелесообразным.

Подведем итог. Расчет дисперсии и стандартной ошибки средней имеет довольно простую формулу и обладает полезным свойством, связанным с тем, что относительно хорошая точность средней достигается уже при 100 наблюдениях (в этом случае стандартная ошибка средней становится в 10 раз меньше, чем стандартное отклонение выборки). Больше, конечно, лучше, но бесконечно увеличивать объем выборки не имеет практического смысла. Хотя, все зависит от поставленных задач и цены ошибки. В некоторых опросах участие принимают десятки тысяч людей.

Дисперсия и стандартная ошибка средней имеют большое практическое значение. Они используются в проверке гипотез и расчете доверительных интервалов.

Онлайн калькуляторы для расчета статистических критериев

В данном сервисе реализован алгоритм выбора оптимальной методики статистического анализа, который позволит исследователю на основании информации о количестве сравниваемых совокупностей, типе распределения, шкале измерения переменных, отпределить наиболее подходящий статистический метод, статистический критерий.

Калькулятор позволит найти значение любой относительной величины по заданным параметрам: числителю, знаменателю, десятичному коэффициенту. Учитывается вид относительной величины для правильного обозначения вводимых данных и формирования грамотного ответа. Для каждого результата также выводится средняя ошибка m.

Данный статистический метод служит для сравнения двух средних величин (M), рассчитанных для несвязанных между собой вариационных рядов. Для вычислений также понадобятся значения средних ошибок средних арифметических (m). Примеры сравниваемых величин: среднее артериальное давление в основной и контрольной группе, средняя длительность лечения пациентов, принимавших препарат или плацебо.

Парный t-критерий Стьюдента используется для сравнения связанных совокупностей — результатов, полученных для одних и тех же исследуемых (например, артериальное давление до и после приема препарата, средний вес пациентов до и после применения диеты).

Этот калькулятор позволит вам быстро рассчитать все основные показатели динамического ряда, состоящего из любого количества данных. Вводимые данные: количество лет, значение первого года, уровни ряда. Результат: показатели динамического ряда, значения, полученные при его выравнивании, а также графическое изображение динамического ряда.

Здесь вы сможете быстро решить любую задачу по стандартизации, с использованием прямого метода. Вводите данные о сравниваемых совокупностях, выбирайте один из четырех способов расчета стандарта, задавайте значение коэффициента, используемого для расчета относительных величин. Результаты применения метода стандартизации выводятся в виде таблицы.

Относительный риск — позволяет проводить количественную оценку вероятности исхода, связанной с наличием фактора риска. Находит широкое применение в современных научных исследованиях, выборки в которых сформированы когортным методом. Наш онлайн-калькулятор позволит выполнить расчет относительного риска (RR) с 95% доверительным интервалом (CI), а также дополнительных показателей, таких как разность рисков, число пациентов, трующих лечения, специфичность, чувствительность.

Метод отношения шансов (OR), как и относительный риск, используется для количественной оценки взаимосвязи фактора риска и исхода, но применяется в исследованиях, организованных по принципу «случай-контроль».

В данном калькуляторе представлены все основные статистические методы, используемые для анализа четырехпольной таблицы (фактор риска есть-нет, исход есть-нет). Выполняется проверка важнейших статистических гипотез, рассчитываются хи-квадрат, точный критерий Фишера и другие показатели.

Онлайн-калькулятор в автоматизированном режиме поможет рассчитать все основные показатели вариационного ряда: средние величины (средняя арифметическая, мода, медиана), стандартное отклонение, среднюю ошибку средней арифметической. Поддерживается ввод как простых, так и взвешенных рядов.

При помощи данного сервиса вы сможете рассчитать значение U-критерия Манна-Уитни — непараметрического критерия, используемого для сравнения двух выборок, независимо от характера их распределения.

Онлайн-калькулятор для проведения корреляционного анализа используется для выявления и изучения связи между количественными признаками при помощи расчета коэффициента корреляции Пирсона. Также выводится уравнение парной линейной регрессии, используемое при описании статистической модели.

Данный калькулятор используется для расчета рангового критерия корреляции Спирмена, являющегося методом непараметрического анализа зависимости одного количественного признака от другого. Оценка значимости корреляционной связи между переменными выполняется как по коэффициенту Спирмена, так и по t-критерию Стьюдента.

Критерий хи-квадрат является непараметрическим аналогом дисперсионного анализа для сравнения нескольких групп по качественному признаку. Онлайн калькулятор по расчету критерия хи-квадрат позволяет оценить связь между двумя качественными признаками по частоте их значений. Число сравниваемых групп может быть от 2 до 9.

0 0 голоса
Рейтинг статьи
Ссылка на основную публикацию
Adblock
detector