Приглашаем посетить сайт

Пушкин (pushkin-lit.ru)

Словарь статистики
Статьи на букву "О"

В начало словаря

По первой букве
A-Z А Б В Г Д З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Э Я
Предыдущая страница Следующая страница

Статьи на букву "О"

Объединенная оценка дисперсии

Объединенная оценка дисперсии - это взвешенное среднее оценок дисперсий каждой из выборок. Если все выборки взяты из одной генеральной совокупности, объединенная оценка дисперсии  точнее отдельных оценок.

Используется при проверке гипотез о различии выборок.

Объект

Статистическая единица.

См. тж. item.

Примеры объектов:

·         физический предмет,

·         определенное количество материала,

·         услуга, действие или процесс,

·         организация или человек.

Ошибка, состоящая в том, что мы отвергаем нулевую гипотезу (поскольку статистика принимает значение, принадлежащее критической области), в то время как нулевая гипотеза  верна.

Примечание. Ее часто называют ошибкой I-го типа, а иногда - ошибкой типа "пропуск цели".

Ошибка, состоящая в том, мы не отвергаем (принимаем) нулевую гипотезу (поскольку статистика принимает значение, не принадлежащее к критической области), в то время как она неверна.

Примечание. Ее часто называют также ошибкой II-го типа, а иногда - ошибкой типа "ложная тревога".

Объем выборки

Количество элементов в выборке.

Одномерное распределение частот

Распределение частот для единственного показателя (признака).

Однородность дисперсии

Равенство дисперсий переменной, подсчитанных в пределах разных групп. Является стандартным требованием в таких, например, методах, как регрессионный и дисперсионный анализы.

Синоним: гомоскедастичность.

Антоним: гетероскедастичность.

Односторонний доверительный интервал

Пусть T - функция от наблюдаемых значений (статистика), - параметр генеральной совокупности.

Если вероятность Pr{T} =

1-, то интервал от наименьшего возможного значения  до T 

- это односторонний доверительный интервал  для  с доверительным уровнем 1-. Аналогично, если Pr{T} =

1-, то интервал от T до наибольшего возможного значения  - это также односторонний доверительный интервал   для  с доверительным уровнем 1-.

Примечание. Граница T доверительного интервала - это статистика и потому, вообще говоря, принимает разные значения от выборки к выборке.

Односторонний критерий

Критерий, в котором используемая статистика одномерна, а критическая область  включает множество значений, меньших критического значения (или множество значений, больших критического значения).

Примечание. Как правило, мощность одностороннего критерия выше, чем двустороннего.

Ожидаемая встречаемость

Встречаемости, предсказываемые

(«ожидаемые») используемой моделью.

Пример. В задачах анализа таблиц сопряженности стандартной является гипотеза о независимости, согласно которой ожидаемая частота в клетке (i, j) равна произведению , где  и  - маргинальные частоты по i-й строке и j-му столбцу.

Ожидаемое значение

То же, что и математическое ожидание   статистики. Предполагается, что если объем выборки  стремится к бесконечности, то среднее значение статистики стремится к ее математическому ожиданию.

Остаток, невязка

Разность между наблюденным значением отклика и значением, вычисленным (предсказанным) в соответствии с рассматриваемой моделью. Например, в t-критерии для двух непарных выборок, предсказанным значением измерения будет среднее выборки, из которой оно взято, так что остаток будет равен наблюденному значению минус выборочное среднее.

Анализ остатков - песня, без которой не обходится ни одно исследование.

Отклик

То же, что и зависимая переменная

Отрицательное биномиальное распределение

Распределение вероятностей дискретной случайной величины X такое, что

=, где x=0,1,2,..., а c>0 и 0<p<1 - параметры.

Здесь =.

Примечания

1.      Эпитет "отрицательное" в названии связан с тем, что последовательные вероятности при x=0,1,2,..., получаются при разложении бинома с отрицательным показателем степени (-с): pc[1-(1-p)]-c последовательных положительных целых степеней величины (1-p).

2.      Когда c = 1, распределение называют

"геометрическим распределением".

Оценивание

См. оценка.

Оцениватель

См. оценка.

Оценка

Этим термином обозначают несколько близких, но неодинаковых, понятий, каждому из которых соответствует свой английский термин.

Прежде всего, оценка (estimator) - это функция, алгоритм, словом, способ получить по выборке число (estimate), которое мы объявляем значением неизвестного параметра. Сам процесс перехода от выборочных данных к оценке называется оцениванием (estimation), или снова оценкой.

Оценки параметров совокупности иногда обозначают специальным символом, «шапкой», чтобы отличить их от истинного значения. Например, так: - истинное значение параметра,  - его оценка по выборке. Впрочем, столь же часто для истинных значений параметров используют греческие буквы, а для оценок - их латинские соответствия.

Пример

Обычной оценкой (estimator) среднего является  (X1 X2 ... Xn)/n, где n - объем выборки,  а X1,X2,...,Xn - выборка. Если результатом вычислений на некоторой выборке окажется значение 5, то 5 будет оценкой (estimate) среднего.

Ошибка выборки, выборочная ошибка

Часть ошибки оценивания, обусловленная только тем фактом, что объем выборки  меньше, чем объем генеральной совокупности.

Ошибки первого и второго рода

При проверке статистической гипотезы возможны два вида ошибок.

Ошибка первого рода состоит в том, что мы объявляем нулевую гипотезу ложной, когда на самом деле она верна.

Выбирая уровень значимости  для статистического критерия, мы ограничиваем значение вероятности ошибки первого рода. Уровень значимости обычно обозначают греческой буквой  (альфа); его типичные значения 0.05, 0.01 и 0.001.

Ошибка второго рода возникнет, если мы не отвергнем нулевую гипотезу, когда она является ложной. Вероятность этой ошибки обычно обозначается греческой буквой b (бета), величина 1- называется мощностью критерия.

Греческие буквы используются в статистике и для других целей; примеры: мера связи альфа Кронбаха и бета-распределение.

Вероятность ошибки первого рода зависит от компонент статистического критерия. Обычно, при фиксированном уровне значимости, вероятность ошибки второго рода снижается по мере того, как растет объем выборки. 

Предыдущая страница Следующая страница