Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Групповой проект №1
1. ГРУППОВОЙ ПРОЕКТ №1
Подготовили студенты 711 группы Величко Виктория, Гнедёнок Виталий, Кислицын Павел,
Литвин Лада, Любецкая Милана, Макаревич Екатерина, Малиновская Полина, Марочканич Ксения,
Павловец Елизавета, Фандеева Екатерина, Фурсова Елизавета
Можно ли на основе демографической
информации предсказать объем продаж в
магазинах спортивных товаров?
2. № магазина Продажи Возраст Прирост Доход Среднее образование Высшее образование
1 891822,03 32,32 -0,16 25980,15 70,67 10,98
2 1124967,97 32,53 0,37 18730,88 63,74 13,25
3 909500,98 31,44 2,23 31109,23 76,91 19,55
4 2631166,88 33,16 1,52 35614,12 82,95 20,81
5 882972,65 31,87 0,14 23038,43 65,21 16,98
6 1078573,12 33,41 -1,04 34531,72 73,49 32,99
7 844320,19 34,05 1,68 30350,36 80,22 22,32
8 1849119,03 28,89 2,36 38964,94 87,60 24,57
9 3860007,32 36,11 0,78 49392,77 85,30 30,88
10 826573,88 32,81 0,12 25595,69 65,59 17,45
11 604682,87 33,05 1,15 29622,61 80,62 18,64
12 1903611,60 33,50 0,06 31586,10 80,38 38,32
13 2356808,39 32,68 1,63 39674,56 79,85 23,78
14 2788571,96 28,52 1,13 28878,98 81,24 16,93
15 634878,29 32,89 1,49 24287,08 70,22 19,14
16 2371627,37 30,50 4,79 46711,24 87,10 30,88
17 2627837,96 30,29 1,89 33449,81 80,21 26,56
18 1868116,33 31,29 1,87 31694,45 75,29 28,36
19 2236796,86 33,05 1,79 25459,22 77,62 19,25
20 1318876,23 32,93 0,27 47047,34 85,18 35,50
21 1868097,84 31,84 3,01 26433,24 74,18 18,64
22 1695218,57 31,08 23,46 33396,66 81,70 41,11
23 2700194,42 32,18 0,70 26179,36 73,41 17,86
24 1156049,77 31,69 -0,16 33454,64 73,72 26,54
25 643858,44 34,03 0,71 42271,50 78,65 29,87
26 2188687,36 34,73 0,14 46514,75 80,95 24,54
27 830351,94 30,56 0,38 27030,81 66,81 14,14
28 1226905,57 33,52 0,74 42910,08 77,89 20,83
29 566903,59 32,40 0,67 40561,40 79,36 19,03
30 826518,40 29,91 0,21 22325,96 58,36 10,67
31 506516,12 25,64 0,11 20155,80 53,24 11,36
32 306525,46 21,24 0,26 15963,47 51,90 12,66
Исходные данные
Дана информация об объемах
продаж за месяц в 32 случайно
выбранных магазинах,
принадлежащих крупной
франчайзинговой сети.
Следовательно, все магазины имеют
одинаковый размер и торгуют
одинаковыми товарами. Округ, в
котором находятся магазины,
называется потребительской базой.
Для каждого из 32 магазинов
приводится демографическая
информация о потребителях в
соответствующих округах.
ЗАДАНИЕ
3. 0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 10000,00 20000,00 30000,00 40000,00 50000,00 60000,00
Объемпродаж
Средний доход семьи
Диаграмма разброса
1-4
У является объем продаж,
независимой Х – средний
доход семьи.
Между средним доходом семьи Х и
объемом продаж У можно
предположить наличие
положительной зависимости.
xaya
xnx
yxnxy
a
10
221
)(
Расчёт параметров линейной зависимости
a1 43,9
a2 92959,6
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение 92959,55014
Переменная X 1 43,88297445
4. Теоретические объёмы продаж
№ yx № yx
1 1233045,809 17 1560836,708
2 914926,2786 18 1483806,29
3 1458125,095 19 1210185,851
4 1655813,068 20 2157536,769
5 1103954,385 21 1252928,746
6 1608314,137 22 1558504,328
7 1424823,623 23 1241787,736
8 1802857,017 24 1561048,663
9 2260461,214 25 1947958,705
10 1216174,56 26 2134165,136
11 1392887,788 27 1279151,895
12 1479051,569 28 1975981,494
13 1833997,253 29 1872914,43
14 1360255,092 30 1072689,082
15 1158748,861 31 977456,0066
16 2142787,702 32 793484,0963
Экономико-
математическая
модель примет вид:
yx=92959,6+43,9*x.
Это значит, что если средний
объем дохода равен нулю, то
объём продаж составит
92959,6 ден.ед. А при
увеличении объёма доходов
на 1 ден.ед. объём продаж
возрастет на 43,9.
5. y = 43,883x + 92960
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
0 10000 20000 30000 40000 50000 60000
Объемпродаж
Средний доход семьи
График уравнения регрессии
y = 43,883x + 92960
0
500000
1000000
1500000
2000000
2500000
0 10000 20000 30000 40000 50000 60000
Продажи
Доход
График уравнения регрессии
5-8
У является объем продаж,
независимой Х – средний
доход семьи.
Проверка на типичность
n
yy xii
2
)(
n
xxi
x
2
)(
2
00
n
ata
x
a
n
at
*2
11
σε 763553,6
σx 8699,559
ta0 0,66683
ta1 2,73851
Условие типичности:
ta0>tk<ta1
0,66683<1,96<2,73851
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
6. Оценка практической
значимости модели
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,4472
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь умеренная.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
признается существенной.
tr> tk
2
1
2
r
n
rtr
tr=2,7385
Вывод
(0,45)2 = 0,2025. Поэтому
более 20% общей вариации
продаж объясняется
изменением доходов
населения. Между доходом и
продажами существует
умеренная связь. С
повышением доходов
продажи стремятся к
увеличению.
Синтезированная с помощью
уравнения регрессии
математическая модель м.б.
использована для
практических целей.
7. 0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 20,00 40,00 60,00 80,00 100,00
Объемпродаж
Количество покупателей со средним
образованием
Диаграмма разброса
9А
У является объем продаж,
независимой Х – количество
покупателей, имеющих
среднее образование
Между количеством покупателей со
средним образованием Х и объемом
продаж У можно предположить
наличие положительной зависимости.
xaya
xnx
yxnxy
a
10
221
)(
Расчёт параметров линейной зависимости
a1 55674,0
a0 -2670783,9
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение -2670783,9
Переменная X 1 55674,0
8. Теоретические объёмы продаж
№ yx № yx
1 1263551,755 17 1794586,913
2 877847,9635 18 1520988,255
3 1610873,902 19 1650419,133
4 1947105,792 20 2071264,343
5 959866,8763 21 1459067,651
6 1420942,107 22 1877730,441
7 1795388,619 23 1416465,919
8 2206106,731 24 1433285,029
9 2078435,152 25 1707935,925
10 980783,5919 26 1836041,762
11 1817519,027 27 1048555,532
12 1804235,215 28 1665690,506
13 1774928,43 29 1747625,908
14 1852009,06 30 578405,4424
15 1238888,18 31 293020,6021
16 2178676,159 32 218417,464
Экономико-
математическая
модель примет вид:
yx=-2670783,9+55674*x
Это значит, что, если количество
покупателей со среднем
образованием равно нулю,
объём продаж сократится на
2670783,9. А при увеличении
числа покупателей со средним
образованием на 1%. объём
продаж возрастет на 55674.
9. 9Б
У является объем продаж,
независимой Х – количество
покупателей, имеющих
среднее образование
.
Проверка на типичность
n
yy xii
2
)(
n
xxi
x
2
)(
2
00
n
ata
x
a
n
at
*2
11
σε 690710,1
σx 9,010913
ta0 -21,1789
ta1 3,978193
Условие типичности:
ta0>tk<ta1
-21,1789 <1,96<3,978193
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
y = 55674x - 3E+06
0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 20,00 40,00 60,00 80,00 100,00
Объемпродаж
Количество покупателей со средним
образованием
y = 55674x - 3E+06
0
500000
1000000
1500000
2000000
2500000
0,00 20,00 40,00 60,00 80,00 100,00
Продажи
Покупатели со средним образованием
График уравнения регрессии
10. Оценка практической
значимости модели
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,587664978
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь заметная.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
признается существенной.
tr> tk
2
1
2
r
n
rtr
tr=3,978193404
Вывод
(0,59)2 = 0,35. Поэтому около
35% общей вариации продаж
объясняется изменением числа
покупателей со средним
образованием. Между
количеством покупателей со
средним образованием и
продажами существует заметная
связь. С повышением числа
покупателей со средним
образованием продажи
стремятся к увеличению.
Синтезированная с помощью
уравнения регрессии
математическая модель м.б.
использована для практических
целей.
11. 0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 10,00 20,00 30,00 40,00 50,00
Объемпродаж
Покупатели с высшим образованием
Диаграмма разброса
10А
У является объем продаж,
независимой Х – количество
покупателей, имеющих
высшее образование
Между количеством покупателей с
высшим образованием Х и объемом
продаж У можно предположить
наличие положительной зависимости.
xaya
xnx
yxnxy
a
10
221
)(
Расчёт параметров линейной зависимости
a1 40197,6
a0 606554,5
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение 606554,5382
Переменная X 1 40197,57462
12. Теоретические объёмы продаж
№ yx № yx
1 1048040,481 17 1674081,527
2 1139003,572 18 1746557,754
3 1392417,122 19 1380317,652
4 1443206,758 20 2033544,319
5 1289093,276 21 1355736,835
6 1932752,92 22 2259197,424
7 1503704,107 23 1324346,549
8 1594088,354 24 1673502,682
9 1847815,445 25 1807392,764
10 1308183,104 26 1592898,506
11 1355660,46 27 1174908,046
12 2147122,566 28 1444030,808
13 1562372,468 29 1371550,561
14 1287099,477 30 1035579,232
15 1376052,689 31 1062997,998
16 1848028,492 32 1115375,438
Экономико-
математическая
модель примет вид:
yx=606554,5+40197,6
Это значит, что если количество
покупателей с высшим
образованием равно нулю, то
объём продаж составит 605554,5.
При увеличении числа
покупателей со средним
образованием на 1%. объём
продаж возрастет на 40197,6.
13. 10Б
У является объем продаж,
независимой Х – количество
покупателей, имеющих
высшее образование
.
Проверка на типичность
n
yy xii
2
)(
n
xxi
x
2
)(
2
00
n
ata
x
a
n
at
*2
11
σε 792865,9
σx 7,9
ta0 4,19016101
ta1 2,185859749
Условие типичности:
ta0>tk<ta1
4,19016101>1,96>2,185859749
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
y = 40198x + 606555
0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 10,00 20,00 30,00 40,00 50,00
Объемпродаж
Покупатели с высшим образованием
y = 40198x + 606555
0
500000
1000000
1500000
2000000
2500000
0,00 10,00 20,00 30,00 40,00 50,00
Объёмпродаж
Покупатели с высшим образованием
ГРАФИК УРАВНЕНИЯ РЕГРЕССИИ
14. Оценка практической
значимости модели
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,370654999
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь умеренная.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
признается существенной.
tr> tk
2
1
2
r
n
rtr
tr=2,185858369
Вывод
(0,370655)2=0,13734, поэтому только
13,7% общей вариации объёма
продаж объясняется изменением
количества покупателей, имеющих
высшее образование (факторного
признака). Между объёмом продаж
и количеством покупателей,
имеющих высшее образование,
существует умеренная прямая
зависимость. С повышением
количества покупателей, имеющих
высшее образование, объём
продаж увеличивается.
Синтезированная с помощью
уравнения регрессии
математическая модель не может
быть использована для
прогнозирования объёма продаж, а
может быть использована только
для практических расчётов.
15. 0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
0 10 20 30 40
Объемпродаж
Средний возраст потребителей
Диаграмма разброса
11А
У является объем продаж,
независимой Х – средний
возраст покупателей
Между средним возрастом
покупателей Х и объемом продаж У
можно предположить наличие
положительной зависимости.
xaya
xnx
yxnxy
a
10
221
)(
Расчёт параметров линейной зависимости
a1 87696,72972
a0 -1275215,661
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение -1275215,661
Переменная X 1 87696,72972
16. Теоретические объёмы продаж
№ yx № yx
1 1558826,935 17 1381311,215
2 1577664,193 18 1468911,478
3 1481969,521 19 1623143,717
4 1632921,902 20 1613058,593
5 1519994,823 21 1516881,589
6 1654486,528 22 1450346,080
7 1710594,895 23 1546926,489
8 1258158,697 24 1504279,569
9 1891127,383 25 1708779,573
10 1601964,956 26 1770623,307
11 1623494,504 27 1404910,405
12 1662589,706 28 1664229,634
13 1590792,393 29 1565737,437
14 1225596,901 30 1347863,682
15 1609524,414 31 973144,3256
16 1399745,067 32 587059,4730
Экономико-
математическая
модель примет вид:
yx=-1275215,66+87696,73*x.
Это значит, что, если средний
возраст покупателей равен нулю,
объём продаж сократится на
1275215,661. При увеличении
среднего возраста покупателей
на 1 год, объём продаж возрастет
на 87696,7.
17. 11Б
У является объем продаж,
независимой Х – количество
покупателей, имеющих
высшее образование
.
Проверка на типичность
n
yy xii
2
)(
n
xxi
x
2
)(
2
00
n
ata
x
a
n
at
*2
11
σε 819987,8212
σx 2,707486178
ta0 -8,51798484
ta1 1,585998864
Условие типичности:
ta0>tk<ta1
-8,518<1,96>1,586
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
y = 87697x - 1E+06
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
0 5 10 15 20 25 30 35 40
Объемпродаж Средний возраст потребителей
y = 87697x - 1E+06
0
200000
400000
600000
800000
1000000
1200000
1400000
1600000
1800000
2000000
0,00 10,00 20,00 30,00 40,00
Продажи
Средний возраст потребителей
График уравнения регрессии
18. Оценка практической
значимости модели
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,278136748
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь слабая.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
не признается
существенной.
tr<tk
2
1
2
r
n
rtr
tr=1,585998864
Вывод
(0,28)2 = 0,1. По шкале Чеддока
установленная по уравнению
регрессии связь - слабая.
Поэтому около 10% общей
вариации продаж объясняется
изменением среднего возраста.
Между значением среднего
возраста и продажами
существует умеренная связь.
Синтезированная с помощью
уравнения регрессии
математическая модель м.б.
использована для практических
целей.
19. 12А
У является объем продаж,
независимой Х – прирост
покупателей
Между приростом покупателей Х и
объемом продаж У можно
предположить наличие положительной
зависимости.
xaya
xnx
yxnxy
a
10
221
)(
Расчёт параметров линейной зависимости
a1 28862,17747
a0 1454971,685
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение 1454971,685
Переменная X 1 28862,17747
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
-10 0 10 20 30
Объемпродаж
Прирост покупателей
Диаграмма разброса
20. Теоретические объёмы продаж
№ yx № yx
1 1450420,12 17 1509584,697
2 1465546,787 18 1508848,712
3 1519207,347 19 1506623,438
4 1498720,974 20 1462784,676
5 1459049,911 21 1541930,539
6 1424955,02 22 2132164,955
7 1503564,047 23 1475293,544
8 1523074,879 24 1450443,209
9 1477599,632 25 1475417,651
10 1458331,242 26 1458876,738
11 1488157,417 27 1466077,851
12 1456720,733 28 1476378,762
13 1502126,71 29 1474289,14
14 1487458,952 30 1461136,646
15 1497930,15 31 1458178,273
16 1593328,305 32 1462438,33
Экономико-
математическая
модель примет вид:
yx=1454971,685+28862,17*x
Это значит, что если прирост
покупателей равен нулю, то
объём продаж составит 1454971,7.
А при увеличении прироста
покупателей на 1%. объём
продаж возрастет на 28862,2.
21. 12Б
У является объем продаж,
независимой Х –прирост
покупателей.
Проверка на типичность
n
yy xii
2
)(
n
xxi
x
2
)(
2
00
n
ata
x
a
n
at
*2
11
σε 845582,7586
σx 4,062249943
ta0 9,424515866
ta1 0,759451846
Условие типичности:
ta0>tk<ta1
0,7595<1,96<9,4245
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
y = 28862x + 1E+06
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
-5 0 5 10 15 20 25
Объемпродаж Прирост покупателей
Диаграмма разброса
y = 28862x + 1E+06
0
500000
1000000
1500000
2000000
2500000
-10 0 10 20 30
Продажи
Прирост
График уравнения регрессии
22. Оценка практической
значимости модели
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,137342345
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь слабая.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
не признается
существенной.
tr<tk
2
1
2
r
n
rtr
tr=0,759451846
Вывод
0,142 = 0,0196. Поэтому менее
10% общей вариации продаж
объясняется изменением
прироста населения. Между
доходом и продажами
существует умеренная связь. С
повышением доходов прирост
стремятся к увеличению.
Синтезированная с помощью
уравнения регрессии
математическая модель м.б.
использована для практических
целей.
23. Оценка адекватности моделей
100*
//1
i
xii
y
yy
n
Модель 1 2 3 4 5
Задание 1-8 9 10 11 12
Ꜫ 57,48% 48,80% 59,61% 63,18% 69,88%
Вывод. Наиболее адекватной для практических целей
является модель 2 (yx=-2670783,9+55674*x), так как
она имеет наименьшую ошибку аппроксимации.
24. Оценка адекватности моделей
Модель 1 2 3 4 5
Задание 1-8 9 10 11 12
r 0,45 0,59 0,37 0,28 0,14
Вывод. Линейный коэффициент корреляции больше у модели 2.
(0,59)2 = 0,35. Поэтому более 35% общей вариации продаж объясняется
изменением числа покупателей со средним образованием. Между
количеством покупателей со средним образованием и продажами
существует заметная связь. С повышением числа покупателей со
средним образованием продажи стремятся к увеличению.
Синтезированная с помощью уравнения регрессии математическая
модель м.б. использована для практических целей.