1. Математическая статистика
Контрольная работа 1
ФИО, группа
задача 1 задача 2 задача 3 задача 4 Сумма баллов
ВАРИАНТ 0
1. (1+1+1+1+1+1+1) Дана выборка: 0, 2, 13, 5, 5, 3, 1, 4, 5, 2. Построить вариацион-
ный ряд, определить ранги наблюдений, вычислить моду, межквартильный размах,
несмещённую оценку дисперсии, выбросы. Нарисовать коробчатую диаграмму.
2. (2+2) Дана выборка из нормального распределения со средним значением 4 и дис-
персией 1: 2, 4, 1.5, 5, 3, 6.5, 5.5, 2. Найти разность Fn(x)−F(x) при x = 5.1, где Fn(x)
и F(x) эмпирическая и теоретическая функции распределения. Нарисовать график
ЭФР.
3. (1+1+1) По выборке x1, x2, x3, x4, x5 из нормального распределения N(θ, σ2
) постро-
ена следующая оценка параметра θ: ˆθ = 0.1x1 + 0.2x2 + 0.3x3 + 0.3x4 + 0.1x5.
а) Выяснить является ли оценка ˆθ несмещенной;
б) Найти дисперсию оценки ˆθ;
в) Является ли оценка ˆθ эффективной среди всех линейных оценок?
4. (3+3) Для случайной величины с распределением
X 0 1 2 4
P 0, 5 + θ 0, 1 − θ 0, 2 0, 2
получена выборка: 1, 4, 2, 2, 0, 1.
а) Выпишите функцию правдоподобия и ее логарифм.
б) Вычислите оценку максимального правдоподобия.
2. Решения задач
1. 1. Вариационный ряд - это упорядоченная выборка, он имеет вид:
0, 1, 2, 2, 3, 4, 5, 5, 5, 13
2. Ранги наблюдений - это их порядковые номера в вариационном ряду
1, 2.5, 10, 8, 8, 5, 2, 6, 8, 2.5
3. Мода – это наиболее часто встречающееся значение Mo = 5.
4. Медиана – это среднее арифметическое двух центральных элементов для чётного
числа наблюдений: Me = 3+4
2
= 3.5
5. Нижняя квартиль - это точка, ниже которой лежит примерно 25% наблюдений.
Для её вычисления надо определить медиану для меньшей подвыборки 0,1,2,2,3, на
которые разбивает выборку медиана Me: Q0.25 = 2.
Верхняя квартиль - это точка, выше которой лежит примерно 75% наблюдений. Для
того, чтобы её найти надо определить медиану для большей подвыборки 4,5,5,5,13:
Q0.75 = 5.
6. Межквартильный размах d = Q0.75 − Q0.25 = 5 − 2 = 3.
7. Размах данных, то есть разность между максимальным и минимальным элемен-
тами, составляет r = 13 − 0 = 13
8. Среднее ¯x = 1
n
n
i=1
xi = 0+1+2+2+3+4+5+5+5+13
10
= 4.
9. Дисперсия
s2
=
1
n − 1
n
i=1
(xi − ¯x)2
=
=
1
10 − 1
((0 − 4)2
+ (1 − 4)2
+ (2 − 4)2
+ (2 − 4)2
+ (3 − 4)2
+ (4 − 4)2
+ (5 − 4)2
+
+ (5 − 4)2
+ (5 − 4)2
+ (13 − 4)2
) =
118
9
≈ 13.1. (1)
Среднеквадратическое отклонение
s =
1
n − 1
n
i=1
(xi − ¯x)2 =
118
9
≈ 3.62.
10. Выбросы - это те наблюдения, которые меньше Q0.25−1.5d или больше Q0.75+1.5d.
В данном случае, Q0.25 − 1.5d = 2 − 1.5 · 3 = −2.5 и Q0.75 + 1.5d = 5 + 1.5 · 3 = 9.5,
поэтому выбросы следующие: x = 13.
2. Левее точки 5.1 лежит 6 наблюдений, поэтому Fn = 6
8
= 0.75. Найдём значение тео-
ретической функции распределения по таблице. Для этого надо провести процедуру
стандартизации z = x−µ
σ
= 5.1−4
1
= 1.1, F(5.1) = Φ(1.1) ≈ 0.8643.
Окончательно находим Fn(5.1) − F(5.1) ≈ 0.75 − 0.8643 = −0.1143.
3. 3. а) Оценка ˆθ является несмещенной, если E(ˆθ) = θ:
E(ˆθ) = E(0.1x1 + 0.2x2 + 0.3x3 + 0.3x4 + 0.1x5) =
= 0.1E(x1) + 0.2E(x2) + 0.3E(x3) + 0.3E(x4) + 0.1E(x5) =
= 0.1θ + 0.2θ + 0.3θ + 0.3θ + 0.1θ = θ. (2)
Следовательно, оценка несмещённая.
б) Дисперсия оценки:
D(ˆθ) = E(0.1x1 + 0.2x2 + 0.3x3 + 0.3x4 + 0.1x5) =
= 0.12
D(x1) + 0.22
D(x2) + 0.32
D(x3) + 0.32
D(x4) + 0.12
D(x5) =
= 0.01σ2
+ 0.04σ2
+ 0.09σ2
+ 0.09σ2
+ 0.01σ2
= 0.24σ2
. (3)
в) Оценка не является эффективной, так как среди линейных несмещённых оценок
эффективной оценкой является среднее ¯x. Можно это проверить явно для данного
случая, найдя её дисперсию: D(¯x) = D(1
5
(x1 + x2 + x3 + x4 + x5)) = 1
25
(σ2
+ σ2
+ σ2
+
σ2
+ σ2
) = 1
5
σ2
= 0.2σ2
.
Откуда получаем, что 0.24σ2
= D(ˆθ) > D(¯x) = 0.2σ2
.
4. а) Функция правдоподобия имеет вид:
L(λ) = P(X = 1) · P(X = 4) · P(X = 2) · P(X = 2) · P(X = 0) · P(X = 1) =
= (0.1 − θ)2
(0.2)3
(0.5 + θ). (4)
Выпишем натуральный логарифм функции правдоподобия:
ln L = ln (0.1 − θ)2
(0.2)3
(0.5 + θ)
И воспользуемся свойствами логарифма:
ln L = 2 ln(0.1 − θ) + ln(0.2)3
+ ln(0.5 + θ).
б) Чтобы найти максимум функции, вычислим производную по параметру θ и
приравняем ее к нулю:
(ln L)′
= −
2
0.1 − θ
+
1
0.5 + θ
= 0 ⇒ 1 + 2θ = 0.1 − θ ⇒ θ = −0.3.
Остаётся убедиться, что это действительно максимум, для этого проверим до-
статочное условие:
(ln L)′′
= −
2
(0.1 − θ)2
−
1
(0.5 + θ)2
< 0.