forked from yordanbabukov/Statistics-and-probabilities-notes
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathHW2-notes-2016.txt
39 lines (31 loc) · 2.44 KB
/
HW2-notes-2016.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Задача 1
Извличаме данните.
Поглеждаме записките и построяваме доверителен интервал.
Методът за построяване на доверителен интервал не е изрично посочен, така че имаме свобода.
Задача 2
Знаем 3 метода за тестване на хипотези.
Метод 1: prop.test, ползва се когато имаме пропорция
Метод 2: t.test, ползва се когато имаме нормално разпределени данни
Метод 3: wilcox.test, ползва се, когато задачата не е за пропорция и данните не са нормално разпределени
Основен проблем:
Как да проверим дали данните, с които разполагаме са близки до нормално разпределени?
Пример:
#данните са височини на ескимоси
x <- scan()
155 156 153 155 154 154 154 155 155 155 156 153
qqnorm(x)
qqline(x, add=TRUE)
Гледаме на око, дали правата описва сравнително добре данните.
hist(x)
Гледаме на око, дали данните са сравнително нормално разпределени
Но.. и двата метода са тип "на око"
Затова е добре да приложим и статически метод, който проверява дали данните са от нормално разпределение.
shapiro.test(x)
Връща резултат: p-value. Ако p-value >= 0.05 приемаме нулевата хипотеза, че данните са от нормално разпределение. В противен случай не.
В случая с ескимоската височина, тестът на Шапиро каза, че са от нормално разпределени, затова може приложим t.test с построена нулева хипотеза, дали средната височина на ескимоската популация е 156 сантиметра по следния начин:
t.test(x, mu=156)
Задача 3:
Вижте записки 8-new.txt
Задача 4:
Вижте записки 9-new.txt
При въпроси или неориентиране - пишете.