Приглашаем посетить сайт

Ахматова (ahmatova.niv.ru)

Словарь статистики
Статьи на букву "Д"

В начало словаря

По первой букве
A-Z А Б В Г Д З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Э Я
Предыдущая страница Следующая страница

Статьи на букву "Д"

ДА

См. дисперсионный анализ.

Двумерная нормальность

Так характеризуют ситуацию, когда наши случайные величины X и Y подчиняются двумерному нормальному распределению, которое имеет специфическую колоколообразную форму (не всякое колоколообразное распределение нормально!), однако, если распределение не слишком «испорчено», говорят о приближенной нормальности.

Двумерная функция распределения

Функция, дающая для любой пары значений x, y вероятность того, что случайная величина  Х будет меньше или равна x, а случайная величина Y меньше или равна y:

F(x,y) = Pr[X£x; Y£y].

Примечание. Это понятие можно легко обобщить на большее число случайных величин.

Двумерное нормальное распределение

Распределение вероятностей двух непрерывных величин X и Y, плотность вероятности  которого равна:

, где -<x< и  -<y< ,  и  - математические ожидания,  и  - стандартные отклонения маргинальных (нормальных) распределений X и Y,  - коэффициент корреляции  случайных величин X и Y.

Если такое распределение нарисовать в трехмерном пространстве, откладывая по вертикальной оси его плотность, то мы увидим колокол, если две дисперсии равны друг другу, или сплющенный "колпак", если дисперсии не равны.

Важность этого распределения обычно аргументируется тем, что если переменные распределены совместно нормально, то всевозможные маргинальные распределения также нормальны. Кроме того, в таких случаях некоррелированность (равенство нулю коэффициента корреляции) эквивалентна независимости.

Двумерное распределение Лапласа-Гаусса

См. двумерное нормальное распределение.

Обратите внимание: не двухмерное.

Двусторонний доверительный интервал

См. доверительный интервал.

Двусторонний критерий

Критерий, в котором используемая статистика одномерна, а критическая область  состоит из множества значений, меньших первого критического значения, и множества значений, больших второго критического значения.

Примечание. Выбор между односторонним и двусторонним критериями определяется альтернативной гипотезой.

Диаграмма рассеяния

Полезный способ визуализации множества двух- или трехмерных данных (совместного распределения двух или трех переменных). На ней каждому наблюдению соответствует одна точка, по осям откладываются значения переменных, точки на диаграмме не соединены между собой.

Диаграмма рассеяния обычно выводится перед вычислением коэффициента линейной корреляции или подгонкой регрессионной линии.

Примеры.

Чем сильнее точки группируются вдоль прямой линии, тем сильнее линейная взаимосвязь между двумя переменными (тем выше корреляция).

Если линия, вдоль которой группируются точки, идет от левого нижнего угла к правому верхнему, взаимосвязь между двумя переменными положительная (прямая).

Если линия, вокруг которой группируются точки, идет от верхнего левого угла к нижнему правому, взаимосвязь между двумя переменными отрицательная (обратная).

Если точки разбросаны по диаграмме случайным образом, между двумя переменными нет взаимосвязи (очень низкая или нулевая корреляция).

Очень низкая или нулевая корреляция может быть результатом нелинейной связи между переменными. Если существующая взаимосвязь действительно нелинейна (точки группируются вокруг некоторой, не прямой, линии), коэффициент корреляции  не является хорошей мерой силы этой взаимосвязи.

Диаграмма рассеяния показывает также нелинейную взаимосвязь между переменными и наличие или отсутствие выбросов.

Если мы имеем дело с большим количеством переменных, все возможные диаграммы рассеяния можно представить одновременно в матрице диаграмм рассеяния.

Диаграмма "стебель-с-листьями", "ствол-лист", "опора-и-консоль"

Придуманный Дж.Тьюки способ представления выборки данных, измеренных в интервальной шкале. Часто используется в разведочном анализе данных для иллюстрации основных характеристик распределения данных в удобной и легкой для восприятия форме.

Диаграмма похожа на гистограмму, однако обычно более информативна для относительно маленьких множеств данных

(<100 точек). Помимо графика  выдается таблица, позволяющая с легкостью записать данные в порядке изменения их величин, что бывает полезно для многих статистических процедур.

Мы можем сравнивать разные множества данных посредством множественных диаграмм "стебель-с-листьями". Используя вплотную прилегающие диаграммы, мы можем сравнить значения одной и той же характеристики в парных выборках, например, частоту пульса после нагрузки у курящих и некурящих.

Дискретная переменная

Переменная, измеренная в номинальной или ранговой шкале. Значения такой переменной часто называют градациями. Множество объектов (статистических единиц), соответствующих одной и той же градации, называют категорией объектов.

Дискретная производная; разностная операция

Популярный и эффективный метод удаления тренда временного ряда. Позволяет лучше видеть закономерности, лежащие в основе поведения временного ряда.

Примечание. Эпитет "дискретная" часто опускают и говорят просто о производной временного ряда.

Дискретная шкала

Одна из шкал измерений: номинальная или ранговая.

Дисперсионный анализ

Совокупность моделей и методов, применяемых для анализа зависимости непрерывного отклика от дискретных факторов.

Дисперсия (случайной величины или распределения вероятностей)

Второй центрированный момент сл.в. X, задаваемый формулой .

Несмещенная выборочная оценка дисперсии для выборки из n наблюдений x1,x2,...,xn со средним   вычисляется согласно формуле .

См. тж. стандартное отклонение.

Дихотомическая переменная

Переменная, имеющая только две категории. Например, пол (мужской, женский).

См. тж бинарная переменная.

Доверительная вероятность

Вероятность1-, где, как правило, принимает одно из стандартных значений 0.1, 0.05 или 0.01, характеризующая доверительный интервал,  или, реже, статистически накрывающий интервал

Примечание. Величину 1- часто выражают в процентах.

Доверительные границы

Доверительные границы - нижняя и верхняя границы доверительного интервала. Для одностороннего интервала вида (-, T] или [T, )  , говорят о (обратите внимание - единственное число) доверительной границе T.

Пример, Верхняя и нижняя границы 95% доверительного интервала - это 95% доверительные границы. 

Доверительный интервал

Доверительный интервал для скалярного параметра генеральной совокупности - это отрезок, с большой вероятностью содержащий этот параметр. Эта фраза без дальнейших уточнений бессмысленна. Поскольку границы доверительного интервала оцениваются по выборке, естественна его частотная интерпретация: если много раз брать из генеральной совокупности независимые выборки и по каждой из них оценивать доверительный интервал, то определенная доля этих интервалов "накроет" значение параметра. Доверительный интервал строят так, чтобы доля накрывающих интервалов равнялась доверительному уровню; не путать с уровнем значимости критерия - вещи близкие, но не тождественные. Стандартные значения доверительных уровней: 95%, 90%, 99% и, реже, 99.9%.

Ширина доверительного интервала характеризует степень нашего незнания: слишком широкий доверительный интервал  может служить указанием на то, что следует собрать больше данных.

Доверительные интервалы дают больше информации о параметре, чем простая точечная оценка, поскольку отграничивают сразу целую совокупность допустимых значений.

См. тж. доверительные границы.

Доверительный уровень

Вероятность того, что неизвестное значение параметра будет накрыто доверительным интервалом. Как правило, задается величиной 1-, где в качестве  берут один из стандартных уровней значимости 0.1, 0.05 или 0.01.

Например, для =0.05 доверительный уровень  равен 1-0.05=0.95. Часто выражается в процентах, так что последнее значение - это 95% доверительный уровень.

Предыдущая страница Следующая страница