SQL VARIANCE() Population variance

SQL VARIANCE() функция вычисляющая статистическую дисперсию (Population variance).
Дисперсия (от лат. dispersio — рассеяние) это величина отклонения от среднего значения.
Примеры практического применения:
1. Допустим вы планируете вывести производство на максимальную мощность. Вы ожидаете что ваши рабочие будут выпускать по 5 единиц продукции в день. В конце месяца вы получили отчет. Выпущено 150 единиц продукции дисперсия составила 100. Это означает что в большую часть месяца ваше производство простаивало. И 150 единиц продукции было получено за несколько дней. Плохо это или хорошо зависит от специфики производства. Если дисперсия составила 0 то это означает что вы производили по 5 единиц продукции как вы и ожидали.

2. На основе дисперсии в сетевых утилитах вычисляется среднее или стандартное отклонение(дрожание канала, jitter , mdev, stdev).

Формула вычисления статистической дисперсии ниже

Где мю это математическое ожидание с равнозначной вероятностью т.е среднее значение.
Русскоязычное определение.
"Дисперсия есть среднее арифметическое из квадратов отклонений величин xi от их среднего арифметического" Большая советская энциклопедия.

Давайте посчитаем статистическую дисперсию для 0,1,2
Среднее значение (0+1+2)/3=1
дисперсия = ((0-1)^2 + (1-1)^2 + (2-1)^2)/3 = (1 + 0 + 1)/3 =2/3

mysql> delete from test;
Query OK, 0 rows affected (0.00 sec)

mysql> insert into test (id) values (0);
Query OK, 1 row affected (0.03 sec)

mysql> insert into test (id) values (1);
Query OK, 1 row affected (0.03 sec)

mysql> insert into test (id) values (2);
Query OK, 1 row affected (0.05 sec)

mysql> select variance(id) from test;
+--------------+
| variance(id) |
+--------------+
|       0.6667 |
+--------------+
1 row in set (0.00 sec)

mysql>

Комментарии

Популярные сообщения