Вероятность в excel

Таблица формул Excel для теории вероятностей и статистики

Комбинаторика и вероятность

Ниже вы найдете основные формулы Excel, которые могут применяться при решении вероятностных задач и задач по комбинаторике.

Выдает случайное число в интервале от 0 до 1 (равномерно распределенное).

Выдает случайное число в заданном интервале.

Вычисляет отдельное значение биномиального распределения.

Определяет гипергеометрическое распределение.

Вычисляет значение нормальной функции распределения.

Выдает обратное нормальное распределение.

Выдает стандартное нормальное интегральное распределение.

Выдает обратное значение стандартного нормального распределения.

Определяет вероятность того, что значение из диапазона находится внутри заданных пределов.

Математическая статистика

При решении задач по математической статистике можно использовать те формулы, что перечислены выше, а также следующие (сгруппированы для удобства: обработка выборки, разные распределения, остальные формулы):

Обработка выборки: формулы Excel

ЧИСЛКОМБ / COMBIN

ФАКТР / FACT

СЛЧИС / RAND

СЛУЧМЕЖДУ / RANDBETVEEN

БИНОМРАСП / BINOMDIST

ГИПЕРГЕОМЕТ / HYRGEOMDIST

НОРМРАСП / NORMDIST

НОРМОБР / NORMINV

НОРМСТРАСП / NORMSDIST

НОРМСТОБР / NORMSINV

ПЕРЕСТ / PERMUT

ВЕРОЯТНОСТЬ / PROB

Вычисляет среднее абсолютных значений отклонений точек данных от среднего.

Вычисляет среднее арифметическое аргументов.

Вычисляет среднее геометрическое.

Вычисляет среднее гармоническое.

Определяет эксцесс множества данных.

Находит медиану заданных чисел.

Определяет значение моды множества данных.

Определяет квартиль множества данных.

Определяет асимметрию распределения.

Оценивает стандартное отклонение по выборке.

Оценивает дисперсию по выборке.

Законы распределений: формулы Excel

СРОТКЛ / AVEDEV

СРЗНАЧ / AVERAGE

СРГЕОМ / GEOMEAN

СРГАРМ / HARMEAN

ЭКСЦЕСС / KURT

МЕДИАНА / MEDIAN

МОДА / MODE

КВАРТИЛЬ / QUARTILE

СКОС / SKEW

СТАНДОТКЛОН / STDEV

ДИСП / VAR

Определяет интегральную функцию плотности бета-вероятности.

Определяет обратную функцию к интегральной функции плотности бета-вероятности.

Вычисляет одностороннюю вероятность распределения хи-квадрат.

Вычисляет обратное значение односторонней вероятности распределения хи-квадрат.

Находит экспоненциальное распределение.

Находит F-распределение вероятности.

Определяет обратное значение для F-распределения вероятности.

Находит преобразование Фишера.

Находит обратное преобразование Фишера.

Находит обратное гамма-распределение.

Выдает распределение Пуассона.

Выдает t-распределение Стьюдента.

Выдает обратное t-распределение Стьюдента.

Выдает распределение Вейбулла.

Другое (корреляция, регрессия и т.п.)

БЕТАРАСП / BETADIST

БЕТАОБР / BETAINV

ХИ2РАСП / CHIDIST

ХИ2ОБР / CHIINV

ЭКСПРАСП / EXPONDIST

FРАСП / FDIST

FРАСПОБР / FINV

ФИШЕР / FISHER

ФИШЕРОБР / FISHERINV

ГАММАРАСП / GAMMADIST

ГАММАОБР / GAMMAINV

ПУАССОН / POISSON

СТЬЮДРАСП / TDIST

СТЬЮДРАСПОБР / TINV

ВЕЙБУЛЛ / WEIBULL

Определяет доверительный интервал для среднего значения по генеральной совокупности.

Находит коэффициент корреляции между двумя множествами данных.

Подсчитывает количество чисел в списке аргументов.

Подсчитывает количество непустых ячеек, удовлетворяющих заданному условию внутри диапазона.

Определяет ковариацию, то есть среднее произведений отклонений для каждой пары точек.

Вычисляет значение линейного тренда.

Находит параметры линейного тренда.

Определяет коэффициент корреляции Пирсона.

Справочный файл по формулам Excel

Нужна шпаргалка по функциям Excel под рукой? Скачивайте файл: Математические и статистические формулы Excel

Полезные ссылки

А если у вас есть задачи, которые надо срочно сделать, а времени нет? Можете поискать готовые решения в решебнике:

Функция распределения и плотность вероятности в EXCEL

Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта www.excel2.ru . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL .

Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.

Генеральная совокупность и случайная величина

Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.

Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.

Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.

В нашем примере, ГС — это просто числовой массив значений весов деталей. Х – вес одной из деталей.

Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной . По определению, любая случайная величина имеет функцию распределения , которая обычно обозначается F(x).

Функция распределения

Функцией распределения вероятностей случайной величины Х называют функцию F(x), значение которой в точке х равно вероятности события X файл примера ):

В справке MS EXCEL Функцию распределения называют Интегральной функцией распределения ( Cumulative Distribution Function , CDF ).

Приведем некоторые свойства Функции распределения:

Функция распределения F(x) изменяется в интервале [0;1], т.к. ее значения равны вероятностям соответствующих событий (по определению вероятность может быть в пределах от 0 до 1);
Функция распределения – неубывающая функция;
Вероятность того, что случайная величина приняла значение из некоторого диапазона [x1;x2): P(x ₁ Примечание : В MS EXCEL имеется несколько функций, позволяющих вычислить вероятности дискретных случайных величин. Перечень этих функций приведен в статье Распределения случайной величины в MS EXCEL .

Непрерывные распределения и плотность вероятности

В случае непрерывного распределения случайная величина может принимать любые значения из интервала, в котором она определена. Т.к. количество таких значений бесконечно велико, то мы не можем, как в случае дискретной величины, сопоставить каждому значению случайной величины ненулевую вероятность (т.е. вероятность попадания в любую точку (заданную до опыта) для непрерывной случайной величины равна нулю). Т.к. в противном случае сумма вероятностей всех возможных значений случайной величины будет равна бесконечности, а не 1. Выходом из этой ситуации является введение так называемой функции плотности распределения p(x) . Чтобы найти вероятность того, что непрерывная случайная величина Х примет значение, заключенное в интервале (а; b), необходимо найти приращение функции распределения на этом интервале:

Как видно из формулы выше плотность распределения р(х) представляет собой производную функции распределения F(x), т.е. р(х) = F’(x).

Типичный график функции плотности распределения для непрерывной случайно величины приведен на картинке ниже (зеленая кривая):

Примечание : В MS EXCEL имеется несколько функций, позволяющих вычислить вероятности непрерывных случайных величин. Перечень этих функций приведен в статье Распределения случайной величины в MS EXCEL .

В литературе Функция плотности распределения непрерывной случайной величины может называться: Плотность вероятности, Плотность распределения, англ. Probability Density Function (PDF) .

Чтобы все усложнить, термин Распределение (в литературе на английском языке — Probability Distribution Function или просто Distribution ) в зависимости от контекста может относиться как Интегральной функции распределения, так и кее Плотности распределения.

Из определения функции плотности распределения следует, что p(х)>=0. Следовательно, плотность вероятности для непрерывной величины может быть, в отличие от Функции распределения, больше 1. Например, для непрерывной равномерной величины , распределенной на интервале [0; 0,5] плотность вероятности равна 1/(0,5-0)=2. А для экспоненциального распределения с параметром лямбда =5, значение плотности вероятности в точке х=0,05 равно 3,894. Но, при этом можно убедиться, что вероятность на любом интервале будет, как обычно, от 0 до 1.

Напомним, что плотность распределения является производной от функции распределения , т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения >1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере экспоненциального распределения ).

Примечание : Площадь, целиком заключенная под всей кривой, изображающей плотность распределения , равна 1.

Примечание : Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения . Этот термин присутствует в параметрах функций, например в НОРМ.РАСП (x; среднее; стандартное_откл; интегральная ). Если функция MS EXCEL должна вернуть Функцию распределения, то параметр интегральная , д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности , то параметр интегральная , д.б. ЛОЖЬ.

Примечание : Для дискретного распределения вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности может называть даже «функция вероятностной меры» (см. функцию БИНОМ.РАСП() ).

Вычисление плотности вероятности с использованием функций MS EXCEL

Понятно, что чтобы вычислить плотность вероятности для определенного значения случайной величины, нужно знать ее распределение.

Найдем плотность вероятности для стандартного нормального распределения N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ) =0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ) .

Напомним, что вероятность того, что непрерывная случайная величина примет конкретное значение x равна 0. Для непрерывной случайной величины Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b).

Вычисление вероятностей с использованием функций MS EXCEL

1) Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения вероятность равна F(+∞)-F(0)=1-0,5=0,5.

В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА) =1-0,5. Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).

2) Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению , приняла отрицательное значение. Согласно определения Функции распределения, вероятность равна F(0)=0,5.

В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА) =0,5.

3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению , примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) — НОРМ.СТ.РАСП(0;ИСТИНА) .

Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье Распределения случайной величины в MS EXCEL приведены распределения, для которых в MS EXCEL имеются соответствующие функции, позволяющие вычислить вероятности.

Обратная функция распределения (Inverse Distribution Function)

Вспомним задачу из предыдущего раздела: Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению, приняла отрицательное значение.

Вероятность этого события равна 0,5.

Теперь решим обратную задачу: определим х, для которого вероятность, того что случайная величина Х примет значение =НОРМ.СТ.ОБР(0,5) =0.

Однозначно вычислить значение случайной величины позволяет свойство монотонности функции распределения.

Обратите внимание, что для вычисления обратной функции мы использовали именно функцию распределения , а не плотность распределения . Поэтому, в аргументах функции НОРМ.СТ.ОБР() отсутствует параметр интегральная , который подразумевается. Подробнее про функцию НОРМ.СТ.ОБР() см. статью про нормальное распределение .

Обратная функция распределения вычисляет квантили распределения , которые используются, например, при построении доверительных интервалов . Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения . В файле примера можно вычислить и другой квантиль этого распределения. Например, 0,8-квантиль равен 0,84.

В англоязычной литературе обратная функция распределения часто называется как Percent Point Function (PPF).

Примечание : При вычислении квантилей в MS EXCEL используются функции: НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье Распределения случайной величины в MS EXCEL .

Функция ВЕРОЯТНОСТЬ для расчета вероятности событий в Excel

Очень часто при работе в Excel необходимо использовать вычисления вероятности появления некоторого события. Для этого используется статистическая функция ВЕРОЯТНОСТЬ.

Примеры использования функции вероятность для расчетов в Excel

Стоит отметить, что используются часто в Excel и другие статистические функции, к примеру:

Функция выполняет вычисление вероятности того, что значения с интервала находятся в заданных пределах. В случае, если верхний предел не будет задан, то будет возвращена вероятность того, что значения аргумента x_интервал будет равно значению аргумента под названием нижний_предел.

Вычисление процента вероятности события в Excel

Пример 1. Дана таблица диапазона числовых значений, а также вероятностей, которые им соответствуют:

Необходимо при использовании данной статистической функции вычислить вероятность события, что значение с указанного интервала входит в интервал [1;4].

Для этого введем функцию со следующими аргументами:

х_интервал – это начальные данные (0, …, 4);
интервал вероятностей является множеством вероятностей для начальных данных (0,15; 0,1; 0,15; 0,2; 0,4);
нижний предел равен значению 1;
верхний предел равен 4.

В результате выполненных вычислений получим:

Пример 2. В условии предыдущего примера нужно вычислить вероятность события «значение х равно 4».

Введем в ячейку С3 введем функцию с такими аргументами:

х_интервал – начальные параметры (0, …, 4);
интервал вероятностей – совокупность вероятностей для параметров (0,1; 0,15; 0,2; 0,15; 0,4);
нижний предел – 4;

В данном примере верхний предел не указан, поскольку необходимо конкретное значение вероятности, а именно для значения 4.

Функция ВЕРОЯТНОСТЬ при нескольких условиях интервалов

Пример 3. В условии примера 1 нужно вычислить вероятность того, что значения интервала [0; 4] будут находится находятся внутри интервалов [0;1] и [3;4].

Описание формул аналогичные предыдущим примерам.

В результате выполненных вычислений получим:

Таким образом составив формулу можно с помощью данной функции вычислить процент вероятности при нескольких условиях.

Решение задач на вычисление вероятности в Excel

Пример 4.В партии 20 изделий, из них 5 бракованных. Найти вероятность того, что в выборке из 4 изделий ровно одно бракованное.

Решение. В данной задаче, прежде всего, определим значения параметров: число_успехов_ в_ выборке = 1; размер_ выборки = 4; число_ успехов_ в_ совокупности = 5; размер_ совокупности = 20.

Искомую вероятность можно рассчитать с помощью функции =ГИПЕРГЕОМЕТ(1; 4; 5; 20), которая дает значение 0,4696.

Если производится несколько испытаний, причем вероятность события А в каждом испытании не зависит от исходов других испытаний, то такие испытания называют независимыми относительно событияА.

Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Вероятность события А в каждом испытании одна и та же, а именно равна р. Следовательно, вероятность ненаступления события А в каждом испытании также постоянна и равна q = 1 – р.

Вероятность того, что при n повторных независимых испытаниях событие А осуществится ровно k раз вычисляется по формуле Бернулли: .

Для нахождения наиболее вероятного числа успехов k₀ по заданным n и р можно воспользоваться неравенствами np – q £ k₀£ np + p или правилом: если число np + p не целое, то k₀ равно целой части этого числа.

В случае, если n велико, р мало, а , используют асимптотическую формулу Пуассона вычисления вероятности наступления события А ровно k раз при n повторных независимых испытаниях: .

Пример 5. Вероятность того, что расход электроэнергии на протяжении одних суток не превысит установленной нормы, равна р = 0,75. Найти вероятность того, что в ближайшие 6 суток расход электроэнергии в течение 4 суток не превысит нормы.

Решение. Вероятность нормального расхода электроэнергии на протяжении каждых из 6 суток постоянна и равна p = 0,75. Следовательно, вероятность перерасхода электроэнергии в каждые сутки также постоянна и равна q = 1— р = 1 — 0,75 = 0,25. Искомая вероятность по формуле Бернулли равна = 0,297. Для вычисления в Excel используем формулу =БИНОМРАСП(4; 6; 0,75; 0), которая дает значение 0,297. При этом определены следующие значения параметров: число_ успехов = 4; число_ испытаний = 6; вероятность_ успеха = 0,75; интегральная = 0. Подробно с синтаксисом функции БИНОМРАСП можно ознакомиться с помощью справки.

Пример 6. Телефонная станция обслуживает 400 абонентов. Для каждого абонента вероятность того, что в течение часа он позвонит на станцию, равна 0,01. Найти вероятность, что в течение часа ровно 5 абонентов позвонят на станцию.

Решение.Так как р = 0,01 мало и n = 400 велико, то будем пользоваться приближенной формулой Пуассона при l = 400 × 0,01 = 4. Тогда Р₄₀₀(5) » » 0,156293. Для вычисления в Excel используем формулу =ПУАССОН(5; 4; 0), которая дает значение 0,156293. При этом определены следующие значения параметров: количество_ событий = 5; среднее(λ) = 4; интегральная = 0. Подробно с синтаксисом функции ПУАССОН можно ознакомиться в справке.

В случае, когда число повторных испытаний большое и формула Бернулли неприменима, используют формулы Лапласа.

Локальная теорема Лапласа. Если вероятность р появления события А в каждом испытании постоянна и отлична от нуля и единицы, то вероятность того, что событие А появится в n испытаниях ровно k раз, приближенно равна (тем точнее, чем больше n) значению функции , где .

Имеются таблицы, в которых помещены значения функции .

Интегральная теорема Лапласа. Если вероятность р наступления события А в каждом испытании постоянна и отлична от нуля и единицы, то вероятность того, что событие А появится в n испытаниях от k₁ до k₂ раз, приближенно равна определенному интегралу:

, где .

При решении задач, требующих применения интегральной теоремы Лапласа, пользуются специальными таблицами для интеграла , тогда .

Пример 7. Найти вероятность того, что событие А наступит ровно 80 раз в 400 испытаниях, если вероятность появления этого события в каждом испытании равна 0,2.

Решение. По условию n = 400; k = 80; р = 0,2; q = 0,8. Воспользуемся асимптотической формулой Лапласа: , , . Для вычисления в Excel используем формулу =НОРМРАСП(80; 80; 8; 0), которая дает значение 0,04986. При этом определены следующие значения параметров: k = 80; среднее= np = 80; стандартное_откл = = = 8, интегральная = 0. Подробно с синтаксисом функции НОРМРАСП можно ознакомиться с помощью справки.

Пример 8. Вероятность того, что деталь не прошла проверку ОТК, равна 0,2. Найти вероятность того, что среди 400 случайно отобранных деталей окажется непроверенных от 70 до 100 деталей.

Решение.Воспользуемся интегральной формулой Лапласа: n = 400; k₁= 70; k₂=100; р = 0,2; q = 0,8; . Так как функция является нечетной, то P₄₀₀(70; 100) = Ф(2,5)+ + Ф(1,25) = 0,4938 + 0,3944 = 0,8882.

Для вычисления в Excel используем формулу нормального распределения =НОРМРАСП(100; 80; 8; 1) — НОРМРАСП(70; 80; 8; 1), которая дает значение 0,8882. При этом параметр интегральная = 1, остальные значения параметров определяются аналогично примеру, рассмотренному выше.

0 0 голоса

Рейтинг статьи