SlideShare a Scribd company logo
1 of 25
Download to read offline
ГРУППОВОЙ ПРОЕКТ №1
Подготовили студенты 711 группы Величко Виктория, Гнедёнок Виталий, Кислицын Павел,
Литвин Лада, Любецкая Милана, Макаревич Екатерина, Малиновская Полина, Марочканич Ксения,
Павловец Елизавета, Фандеева Екатерина, Фурсова Елизавета
Можно ли на основе демографической
информации предсказать объем продаж в
магазинах спортивных товаров?
№ магазина Продажи Возраст Прирост Доход Среднее образование Высшее образование
1 891822,03 32,32 -0,16 25980,15 70,67 10,98
2 1124967,97 32,53 0,37 18730,88 63,74 13,25
3 909500,98 31,44 2,23 31109,23 76,91 19,55
4 2631166,88 33,16 1,52 35614,12 82,95 20,81
5 882972,65 31,87 0,14 23038,43 65,21 16,98
6 1078573,12 33,41 -1,04 34531,72 73,49 32,99
7 844320,19 34,05 1,68 30350,36 80,22 22,32
8 1849119,03 28,89 2,36 38964,94 87,60 24,57
9 3860007,32 36,11 0,78 49392,77 85,30 30,88
10 826573,88 32,81 0,12 25595,69 65,59 17,45
11 604682,87 33,05 1,15 29622,61 80,62 18,64
12 1903611,60 33,50 0,06 31586,10 80,38 38,32
13 2356808,39 32,68 1,63 39674,56 79,85 23,78
14 2788571,96 28,52 1,13 28878,98 81,24 16,93
15 634878,29 32,89 1,49 24287,08 70,22 19,14
16 2371627,37 30,50 4,79 46711,24 87,10 30,88
17 2627837,96 30,29 1,89 33449,81 80,21 26,56
18 1868116,33 31,29 1,87 31694,45 75,29 28,36
19 2236796,86 33,05 1,79 25459,22 77,62 19,25
20 1318876,23 32,93 0,27 47047,34 85,18 35,50
21 1868097,84 31,84 3,01 26433,24 74,18 18,64
22 1695218,57 31,08 23,46 33396,66 81,70 41,11
23 2700194,42 32,18 0,70 26179,36 73,41 17,86
24 1156049,77 31,69 -0,16 33454,64 73,72 26,54
25 643858,44 34,03 0,71 42271,50 78,65 29,87
26 2188687,36 34,73 0,14 46514,75 80,95 24,54
27 830351,94 30,56 0,38 27030,81 66,81 14,14
28 1226905,57 33,52 0,74 42910,08 77,89 20,83
29 566903,59 32,40 0,67 40561,40 79,36 19,03
30 826518,40 29,91 0,21 22325,96 58,36 10,67
31 506516,12 25,64 0,11 20155,80 53,24 11,36
32 306525,46 21,24 0,26 15963,47 51,90 12,66
Исходные данные
Дана информация об объемах
продаж за месяц в 32 случайно
выбранных магазинах,
принадлежащих крупной
франчайзинговой сети.
Следовательно, все магазины имеют
одинаковый размер и торгуют
одинаковыми товарами. Округ, в
котором находятся магазины,
называется потребительской базой.
Для каждого из 32 магазинов
приводится демографическая
информация о потребителях в
соответствующих округах.
ЗАДАНИЕ
0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 10000,00 20000,00 30000,00 40000,00 50000,00 60000,00
Объемпродаж
Средний доход семьи
Диаграмма разброса
1-4
У является объем продаж,
независимой Х – средний
доход семьи.
Между средним доходом семьи Х и
объемом продаж У можно
предположить наличие
положительной зависимости.
xaya
xnx
yxnxy
a
10
221
)(






Расчёт параметров линейной зависимости
a1 43,9
a2 92959,6
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение 92959,55014
Переменная X 1 43,88297445
Теоретические объёмы продаж
№ yx № yx
1 1233045,809 17 1560836,708
2 914926,2786 18 1483806,29
3 1458125,095 19 1210185,851
4 1655813,068 20 2157536,769
5 1103954,385 21 1252928,746
6 1608314,137 22 1558504,328
7 1424823,623 23 1241787,736
8 1802857,017 24 1561048,663
9 2260461,214 25 1947958,705
10 1216174,56 26 2134165,136
11 1392887,788 27 1279151,895
12 1479051,569 28 1975981,494
13 1833997,253 29 1872914,43
14 1360255,092 30 1072689,082
15 1158748,861 31 977456,0066
16 2142787,702 32 793484,0963
Экономико-
математическая
модель примет вид:
yx=92959,6+43,9*x.
Это значит, что если средний
объем дохода равен нулю, то
объём продаж составит
92959,6 ден.ед. А при
увеличении объёма доходов
на 1 ден.ед. объём продаж
возрастет на 43,9.
y = 43,883x + 92960
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
0 10000 20000 30000 40000 50000 60000
Объемпродаж
Средний доход семьи
График уравнения регрессии
y = 43,883x + 92960
0
500000
1000000
1500000
2000000
2500000
0 10000 20000 30000 40000 50000 60000
Продажи
Доход
График уравнения регрессии
5-8
У является объем продаж,
независимой Х – средний
доход семьи.
Проверка на типичность
n
yy xii 

2
)(

n
xxi
x
 

2
)(


2
00


n
ata

x
a
n
at
*2
11


σε 763553,6
σx 8699,559
ta0 0,66683
ta1 2,73851
Условие типичности:
ta0>tk<ta1
0,66683<1,96<2,73851
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
Оценка практической
значимости модели




















 
 
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,4472
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь умеренная.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
признается существенной.
tr> tk
2
1
2
r
n
rtr



tr=2,7385
Вывод
(0,45)2 = 0,2025. Поэтому
более 20% общей вариации
продаж объясняется
изменением доходов
населения. Между доходом и
продажами существует
умеренная связь. С
повышением доходов
продажи стремятся к
увеличению.
Синтезированная с помощью
уравнения регрессии
математическая модель м.б.
использована для
практических целей.
0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 20,00 40,00 60,00 80,00 100,00
Объемпродаж
Количество покупателей со средним
образованием
Диаграмма разброса
9А
У является объем продаж,
независимой Х – количество
покупателей, имеющих
среднее образование
Между количеством покупателей со
средним образованием Х и объемом
продаж У можно предположить
наличие положительной зависимости.
xaya
xnx
yxnxy
a
10
221
)(






Расчёт параметров линейной зависимости
a1 55674,0
a0 -2670783,9
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение -2670783,9
Переменная X 1 55674,0
Теоретические объёмы продаж
№ yx № yx
1 1263551,755 17 1794586,913
2 877847,9635 18 1520988,255
3 1610873,902 19 1650419,133
4 1947105,792 20 2071264,343
5 959866,8763 21 1459067,651
6 1420942,107 22 1877730,441
7 1795388,619 23 1416465,919
8 2206106,731 24 1433285,029
9 2078435,152 25 1707935,925
10 980783,5919 26 1836041,762
11 1817519,027 27 1048555,532
12 1804235,215 28 1665690,506
13 1774928,43 29 1747625,908
14 1852009,06 30 578405,4424
15 1238888,18 31 293020,6021
16 2178676,159 32 218417,464
Экономико-
математическая
модель примет вид:
yx=-2670783,9+55674*x
Это значит, что, если количество
покупателей со среднем
образованием равно нулю,
объём продаж сократится на
2670783,9. А при увеличении
числа покупателей со средним
образованием на 1%. объём
продаж возрастет на 55674.
9Б
У является объем продаж,
независимой Х – количество
покупателей, имеющих
среднее образование
.
Проверка на типичность
n
yy xii 

2
)(

n
xxi
x
 

2
)(


2
00


n
ata

x
a
n
at
*2
11


σε 690710,1
σx 9,010913
ta0 -21,1789
ta1 3,978193
Условие типичности:
ta0>tk<ta1
-21,1789 <1,96<3,978193
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
y = 55674x - 3E+06
0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 20,00 40,00 60,00 80,00 100,00
Объемпродаж
Количество покупателей со средним
образованием
y = 55674x - 3E+06
0
500000
1000000
1500000
2000000
2500000
0,00 20,00 40,00 60,00 80,00 100,00
Продажи
Покупатели со средним образованием
График уравнения регрессии
Оценка практической
значимости модели




















 
 
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,587664978
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь заметная.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
признается существенной.
tr> tk
2
1
2
r
n
rtr



tr=3,978193404
Вывод
(0,59)2 = 0,35. Поэтому около
35% общей вариации продаж
объясняется изменением числа
покупателей со средним
образованием. Между
количеством покупателей со
средним образованием и
продажами существует заметная
связь. С повышением числа
покупателей со средним
образованием продажи
стремятся к увеличению.
Синтезированная с помощью
уравнения регрессии
математическая модель м.б.
использована для практических
целей.
0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 10,00 20,00 30,00 40,00 50,00
Объемпродаж
Покупатели с высшим образованием
Диаграмма разброса
10А
У является объем продаж,
независимой Х – количество
покупателей, имеющих
высшее образование
Между количеством покупателей с
высшим образованием Х и объемом
продаж У можно предположить
наличие положительной зависимости.
xaya
xnx
yxnxy
a
10
221
)(






Расчёт параметров линейной зависимости
a1 40197,6
a0 606554,5
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение 606554,5382
Переменная X 1 40197,57462
Теоретические объёмы продаж
№ yx № yx
1 1048040,481 17 1674081,527
2 1139003,572 18 1746557,754
3 1392417,122 19 1380317,652
4 1443206,758 20 2033544,319
5 1289093,276 21 1355736,835
6 1932752,92 22 2259197,424
7 1503704,107 23 1324346,549
8 1594088,354 24 1673502,682
9 1847815,445 25 1807392,764
10 1308183,104 26 1592898,506
11 1355660,46 27 1174908,046
12 2147122,566 28 1444030,808
13 1562372,468 29 1371550,561
14 1287099,477 30 1035579,232
15 1376052,689 31 1062997,998
16 1848028,492 32 1115375,438
Экономико-
математическая
модель примет вид:
yx=606554,5+40197,6
Это значит, что если количество
покупателей с высшим
образованием равно нулю, то
объём продаж составит 605554,5.
При увеличении числа
покупателей со средним
образованием на 1%. объём
продаж возрастет на 40197,6.
10Б
У является объем продаж,
независимой Х – количество
покупателей, имеющих
высшее образование
.
Проверка на типичность
n
yy xii 

2
)(

n
xxi
x
 

2
)(


2
00


n
ata

x
a
n
at
*2
11


σε 792865,9
σx 7,9
ta0 4,19016101
ta1 2,185859749
Условие типичности:
ta0>tk<ta1
4,19016101>1,96>2,185859749
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
y = 40198x + 606555
0,00
500000,00
1000000,00
1500000,00
2000000,00
2500000,00
3000000,00
3500000,00
4000000,00
4500000,00
0,00 10,00 20,00 30,00 40,00 50,00
Объемпродаж
Покупатели с высшим образованием
y = 40198x + 606555
0
500000
1000000
1500000
2000000
2500000
0,00 10,00 20,00 30,00 40,00 50,00
Объёмпродаж
Покупатели с высшим образованием
ГРАФИК УРАВНЕНИЯ РЕГРЕССИИ
Оценка практической
значимости модели




















 
 
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,370654999
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь умеренная.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
признается существенной.
tr> tk
2
1
2
r
n
rtr



tr=2,185858369
Вывод
(0,370655)2=0,13734, поэтому только
13,7% общей вариации объёма
продаж объясняется изменением
количества покупателей, имеющих
высшее образование (факторного
признака). Между объёмом продаж
и количеством покупателей,
имеющих высшее образование,
существует умеренная прямая
зависимость. С повышением
количества покупателей, имеющих
высшее образование, объём
продаж увеличивается.
Синтезированная с помощью
уравнения регрессии
математическая модель не может
быть использована для
прогнозирования объёма продаж, а
может быть использована только
для практических расчётов.
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
0 10 20 30 40
Объемпродаж
Средний возраст потребителей
Диаграмма разброса
11А
У является объем продаж,
независимой Х – средний
возраст покупателей
Между средним возрастом
покупателей Х и объемом продаж У
можно предположить наличие
положительной зависимости.
xaya
xnx
yxnxy
a
10
221
)(






Расчёт параметров линейной зависимости
a1 87696,72972
a0 -1275215,661
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение -1275215,661
Переменная X 1 87696,72972
Теоретические объёмы продаж
№ yx № yx
1 1558826,935 17 1381311,215
2 1577664,193 18 1468911,478
3 1481969,521 19 1623143,717
4 1632921,902 20 1613058,593
5 1519994,823 21 1516881,589
6 1654486,528 22 1450346,080
7 1710594,895 23 1546926,489
8 1258158,697 24 1504279,569
9 1891127,383 25 1708779,573
10 1601964,956 26 1770623,307
11 1623494,504 27 1404910,405
12 1662589,706 28 1664229,634
13 1590792,393 29 1565737,437
14 1225596,901 30 1347863,682
15 1609524,414 31 973144,3256
16 1399745,067 32 587059,4730
Экономико-
математическая
модель примет вид:
yx=-1275215,66+87696,73*x.
Это значит, что, если средний
возраст покупателей равен нулю,
объём продаж сократится на
1275215,661. При увеличении
среднего возраста покупателей
на 1 год, объём продаж возрастет
на 87696,7.
11Б
У является объем продаж,
независимой Х – количество
покупателей, имеющих
высшее образование
.
Проверка на типичность
n
yy xii 

2
)(

n
xxi
x
 

2
)(


2
00


n
ata

x
a
n
at
*2
11


σε 819987,8212
σx 2,707486178
ta0 -8,51798484
ta1 1,585998864
Условие типичности:
ta0>tk<ta1
-8,518<1,96>1,586
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
y = 87697x - 1E+06
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
0 5 10 15 20 25 30 35 40
Объемпродаж Средний возраст потребителей
y = 87697x - 1E+06
0
200000
400000
600000
800000
1000000
1200000
1400000
1600000
1800000
2000000
0,00 10,00 20,00 30,00 40,00
Продажи
Средний возраст потребителей
График уравнения регрессии
Оценка практической
значимости модели




















 
 
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,278136748
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь слабая.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
не признается
существенной.
tr<tk
2
1
2
r
n
rtr



tr=1,585998864
Вывод
(0,28)2 = 0,1. По шкале Чеддока
установленная по уравнению
регрессии связь - слабая.
Поэтому около 10% общей
вариации продаж объясняется
изменением среднего возраста.
Между значением среднего
возраста и продажами
существует умеренная связь.
Синтезированная с помощью
уравнения регрессии
математическая модель м.б.
использована для практических
целей.
12А
У является объем продаж,
независимой Х – прирост
покупателей
Между приростом покупателей Х и
объемом продаж У можно
предположить наличие положительной
зависимости.
xaya
xnx
yxnxy
a
10
221
)(






Расчёт параметров линейной зависимости
a1 28862,17747
a0 1454971,685
Проверка через Пакет Анализа
Коэффициенты
Y-пересечение 1454971,685
Переменная X 1 28862,17747
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
-10 0 10 20 30
Объемпродаж
Прирост покупателей
Диаграмма разброса
Теоретические объёмы продаж
№ yx № yx
1 1450420,12 17 1509584,697
2 1465546,787 18 1508848,712
3 1519207,347 19 1506623,438
4 1498720,974 20 1462784,676
5 1459049,911 21 1541930,539
6 1424955,02 22 2132164,955
7 1503564,047 23 1475293,544
8 1523074,879 24 1450443,209
9 1477599,632 25 1475417,651
10 1458331,242 26 1458876,738
11 1488157,417 27 1466077,851
12 1456720,733 28 1476378,762
13 1502126,71 29 1474289,14
14 1487458,952 30 1461136,646
15 1497930,15 31 1458178,273
16 1593328,305 32 1462438,33
Экономико-
математическая
модель примет вид:
yx=1454971,685+28862,17*x
Это значит, что если прирост
покупателей равен нулю, то
объём продаж составит 1454971,7.
А при увеличении прироста
покупателей на 1%. объём
продаж возрастет на 28862,2.
12Б
У является объем продаж,
независимой Х –прирост
покупателей.
Проверка на типичность
n
yy xii 

2
)(

n
xxi
x
 

2
)(


2
00


n
ata

x
a
n
at
*2
11


σε 845582,7586
σx 4,062249943
ta0 9,424515866
ta1 0,759451846
Условие типичности:
ta0>tk<ta1
0,7595<1,96<9,4245
Параметры уравнения регрессии не
признаются типичными, т.к. не
удовлетворяют условию выше.
y = 28862x + 1E+06
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
-5 0 5 10 15 20 25
Объемпродаж Прирост покупателей
Диаграмма разброса
y = 28862x + 1E+06
0
500000
1000000
1500000
2000000
2500000
-10 0 10 20 30
Продажи
Прирост
График уравнения регрессии
Оценка практической
значимости модели




















 
 
n
y
n
x
x
n
yx
xy
r
y
2
2
2
2 )()(
r=0,137342345
r>0, значит, между доходами и
продажами существует прямая
зависимость. По шкале Чеддока:
установленная по уравнению
регрессии связь слабая.
Проверка существенности
линейного коэффициента
Поэтому величина
вычисленного линейного
коэффициента корреляции r
не признается
существенной.
tr<tk
2
1
2
r
n
rtr



tr=0,759451846
Вывод
0,142 = 0,0196. Поэтому менее
10% общей вариации продаж
объясняется изменением
прироста населения. Между
доходом и продажами
существует умеренная связь. С
повышением доходов прирост
стремятся к увеличению.
Синтезированная с помощью
уравнения регрессии
математическая модель м.б.
использована для практических
целей.
Оценка адекватности моделей
100*
//1



i
xii
y
yy
n

Модель 1 2 3 4 5
Задание 1-8 9 10 11 12
Ꜫ 57,48% 48,80% 59,61% 63,18% 69,88%
Вывод. Наиболее адекватной для практических целей
является модель 2 (yx=-2670783,9+55674*x), так как
она имеет наименьшую ошибку аппроксимации.
Оценка адекватности моделей
Модель 1 2 3 4 5
Задание 1-8 9 10 11 12
r 0,45 0,59 0,37 0,28 0,14
Вывод. Линейный коэффициент корреляции больше у модели 2.
(0,59)2 = 0,35. Поэтому более 35% общей вариации продаж объясняется
изменением числа покупателей со средним образованием. Между
количеством покупателей со средним образованием и продажами
существует заметная связь. С повышением числа покупателей со
средним образованием продажи стремятся к увеличению.
Синтезированная с помощью уравнения регрессии математическая
модель м.б. использована для практических целей.
СПАСИБО ЗА
ВНИМАНИЕ!

More Related Content

Featured

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Групповой проект №1

  • 1. ГРУППОВОЙ ПРОЕКТ №1 Подготовили студенты 711 группы Величко Виктория, Гнедёнок Виталий, Кислицын Павел, Литвин Лада, Любецкая Милана, Макаревич Екатерина, Малиновская Полина, Марочканич Ксения, Павловец Елизавета, Фандеева Екатерина, Фурсова Елизавета Можно ли на основе демографической информации предсказать объем продаж в магазинах спортивных товаров?
  • 2. № магазина Продажи Возраст Прирост Доход Среднее образование Высшее образование 1 891822,03 32,32 -0,16 25980,15 70,67 10,98 2 1124967,97 32,53 0,37 18730,88 63,74 13,25 3 909500,98 31,44 2,23 31109,23 76,91 19,55 4 2631166,88 33,16 1,52 35614,12 82,95 20,81 5 882972,65 31,87 0,14 23038,43 65,21 16,98 6 1078573,12 33,41 -1,04 34531,72 73,49 32,99 7 844320,19 34,05 1,68 30350,36 80,22 22,32 8 1849119,03 28,89 2,36 38964,94 87,60 24,57 9 3860007,32 36,11 0,78 49392,77 85,30 30,88 10 826573,88 32,81 0,12 25595,69 65,59 17,45 11 604682,87 33,05 1,15 29622,61 80,62 18,64 12 1903611,60 33,50 0,06 31586,10 80,38 38,32 13 2356808,39 32,68 1,63 39674,56 79,85 23,78 14 2788571,96 28,52 1,13 28878,98 81,24 16,93 15 634878,29 32,89 1,49 24287,08 70,22 19,14 16 2371627,37 30,50 4,79 46711,24 87,10 30,88 17 2627837,96 30,29 1,89 33449,81 80,21 26,56 18 1868116,33 31,29 1,87 31694,45 75,29 28,36 19 2236796,86 33,05 1,79 25459,22 77,62 19,25 20 1318876,23 32,93 0,27 47047,34 85,18 35,50 21 1868097,84 31,84 3,01 26433,24 74,18 18,64 22 1695218,57 31,08 23,46 33396,66 81,70 41,11 23 2700194,42 32,18 0,70 26179,36 73,41 17,86 24 1156049,77 31,69 -0,16 33454,64 73,72 26,54 25 643858,44 34,03 0,71 42271,50 78,65 29,87 26 2188687,36 34,73 0,14 46514,75 80,95 24,54 27 830351,94 30,56 0,38 27030,81 66,81 14,14 28 1226905,57 33,52 0,74 42910,08 77,89 20,83 29 566903,59 32,40 0,67 40561,40 79,36 19,03 30 826518,40 29,91 0,21 22325,96 58,36 10,67 31 506516,12 25,64 0,11 20155,80 53,24 11,36 32 306525,46 21,24 0,26 15963,47 51,90 12,66 Исходные данные Дана информация об объемах продаж за месяц в 32 случайно выбранных магазинах, принадлежащих крупной франчайзинговой сети. Следовательно, все магазины имеют одинаковый размер и торгуют одинаковыми товарами. Округ, в котором находятся магазины, называется потребительской базой. Для каждого из 32 магазинов приводится демографическая информация о потребителях в соответствующих округах. ЗАДАНИЕ
  • 3. 0,00 500000,00 1000000,00 1500000,00 2000000,00 2500000,00 3000000,00 3500000,00 4000000,00 4500000,00 0,00 10000,00 20000,00 30000,00 40000,00 50000,00 60000,00 Объемпродаж Средний доход семьи Диаграмма разброса 1-4 У является объем продаж, независимой Х – средний доход семьи. Между средним доходом семьи Х и объемом продаж У можно предположить наличие положительной зависимости. xaya xnx yxnxy a 10 221 )(       Расчёт параметров линейной зависимости a1 43,9 a2 92959,6 Проверка через Пакет Анализа Коэффициенты Y-пересечение 92959,55014 Переменная X 1 43,88297445
  • 4. Теоретические объёмы продаж № yx № yx 1 1233045,809 17 1560836,708 2 914926,2786 18 1483806,29 3 1458125,095 19 1210185,851 4 1655813,068 20 2157536,769 5 1103954,385 21 1252928,746 6 1608314,137 22 1558504,328 7 1424823,623 23 1241787,736 8 1802857,017 24 1561048,663 9 2260461,214 25 1947958,705 10 1216174,56 26 2134165,136 11 1392887,788 27 1279151,895 12 1479051,569 28 1975981,494 13 1833997,253 29 1872914,43 14 1360255,092 30 1072689,082 15 1158748,861 31 977456,0066 16 2142787,702 32 793484,0963 Экономико- математическая модель примет вид: yx=92959,6+43,9*x. Это значит, что если средний объем дохода равен нулю, то объём продаж составит 92959,6 ден.ед. А при увеличении объёма доходов на 1 ден.ед. объём продаж возрастет на 43,9.
  • 5. y = 43,883x + 92960 0 500000 1000000 1500000 2000000 2500000 3000000 3500000 4000000 4500000 0 10000 20000 30000 40000 50000 60000 Объемпродаж Средний доход семьи График уравнения регрессии y = 43,883x + 92960 0 500000 1000000 1500000 2000000 2500000 0 10000 20000 30000 40000 50000 60000 Продажи Доход График уравнения регрессии 5-8 У является объем продаж, независимой Х – средний доход семьи. Проверка на типичность n yy xii   2 )(  n xxi x    2 )(   2 00   n ata  x a n at *2 11   σε 763553,6 σx 8699,559 ta0 0,66683 ta1 2,73851 Условие типичности: ta0>tk<ta1 0,66683<1,96<2,73851 Параметры уравнения регрессии не признаются типичными, т.к. не удовлетворяют условию выше.
  • 6. Оценка практической значимости модели                         n y n x x n yx xy r y 2 2 2 2 )()( r=0,4472 r>0, значит, между доходами и продажами существует прямая зависимость. По шкале Чеддока: установленная по уравнению регрессии связь умеренная. Проверка существенности линейного коэффициента Поэтому величина вычисленного линейного коэффициента корреляции r признается существенной. tr> tk 2 1 2 r n rtr    tr=2,7385 Вывод (0,45)2 = 0,2025. Поэтому более 20% общей вариации продаж объясняется изменением доходов населения. Между доходом и продажами существует умеренная связь. С повышением доходов продажи стремятся к увеличению. Синтезированная с помощью уравнения регрессии математическая модель м.б. использована для практических целей.
  • 7. 0,00 500000,00 1000000,00 1500000,00 2000000,00 2500000,00 3000000,00 3500000,00 4000000,00 4500000,00 0,00 20,00 40,00 60,00 80,00 100,00 Объемпродаж Количество покупателей со средним образованием Диаграмма разброса 9А У является объем продаж, независимой Х – количество покупателей, имеющих среднее образование Между количеством покупателей со средним образованием Х и объемом продаж У можно предположить наличие положительной зависимости. xaya xnx yxnxy a 10 221 )(       Расчёт параметров линейной зависимости a1 55674,0 a0 -2670783,9 Проверка через Пакет Анализа Коэффициенты Y-пересечение -2670783,9 Переменная X 1 55674,0
  • 8. Теоретические объёмы продаж № yx № yx 1 1263551,755 17 1794586,913 2 877847,9635 18 1520988,255 3 1610873,902 19 1650419,133 4 1947105,792 20 2071264,343 5 959866,8763 21 1459067,651 6 1420942,107 22 1877730,441 7 1795388,619 23 1416465,919 8 2206106,731 24 1433285,029 9 2078435,152 25 1707935,925 10 980783,5919 26 1836041,762 11 1817519,027 27 1048555,532 12 1804235,215 28 1665690,506 13 1774928,43 29 1747625,908 14 1852009,06 30 578405,4424 15 1238888,18 31 293020,6021 16 2178676,159 32 218417,464 Экономико- математическая модель примет вид: yx=-2670783,9+55674*x Это значит, что, если количество покупателей со среднем образованием равно нулю, объём продаж сократится на 2670783,9. А при увеличении числа покупателей со средним образованием на 1%. объём продаж возрастет на 55674.
  • 9. 9Б У является объем продаж, независимой Х – количество покупателей, имеющих среднее образование . Проверка на типичность n yy xii   2 )(  n xxi x    2 )(   2 00   n ata  x a n at *2 11   σε 690710,1 σx 9,010913 ta0 -21,1789 ta1 3,978193 Условие типичности: ta0>tk<ta1 -21,1789 <1,96<3,978193 Параметры уравнения регрессии не признаются типичными, т.к. не удовлетворяют условию выше. y = 55674x - 3E+06 0,00 500000,00 1000000,00 1500000,00 2000000,00 2500000,00 3000000,00 3500000,00 4000000,00 4500000,00 0,00 20,00 40,00 60,00 80,00 100,00 Объемпродаж Количество покупателей со средним образованием y = 55674x - 3E+06 0 500000 1000000 1500000 2000000 2500000 0,00 20,00 40,00 60,00 80,00 100,00 Продажи Покупатели со средним образованием График уравнения регрессии
  • 10. Оценка практической значимости модели                         n y n x x n yx xy r y 2 2 2 2 )()( r=0,587664978 r>0, значит, между доходами и продажами существует прямая зависимость. По шкале Чеддока: установленная по уравнению регрессии связь заметная. Проверка существенности линейного коэффициента Поэтому величина вычисленного линейного коэффициента корреляции r признается существенной. tr> tk 2 1 2 r n rtr    tr=3,978193404 Вывод (0,59)2 = 0,35. Поэтому около 35% общей вариации продаж объясняется изменением числа покупателей со средним образованием. Между количеством покупателей со средним образованием и продажами существует заметная связь. С повышением числа покупателей со средним образованием продажи стремятся к увеличению. Синтезированная с помощью уравнения регрессии математическая модель м.б. использована для практических целей.
  • 11. 0,00 500000,00 1000000,00 1500000,00 2000000,00 2500000,00 3000000,00 3500000,00 4000000,00 4500000,00 0,00 10,00 20,00 30,00 40,00 50,00 Объемпродаж Покупатели с высшим образованием Диаграмма разброса 10А У является объем продаж, независимой Х – количество покупателей, имеющих высшее образование Между количеством покупателей с высшим образованием Х и объемом продаж У можно предположить наличие положительной зависимости. xaya xnx yxnxy a 10 221 )(       Расчёт параметров линейной зависимости a1 40197,6 a0 606554,5 Проверка через Пакет Анализа Коэффициенты Y-пересечение 606554,5382 Переменная X 1 40197,57462
  • 12. Теоретические объёмы продаж № yx № yx 1 1048040,481 17 1674081,527 2 1139003,572 18 1746557,754 3 1392417,122 19 1380317,652 4 1443206,758 20 2033544,319 5 1289093,276 21 1355736,835 6 1932752,92 22 2259197,424 7 1503704,107 23 1324346,549 8 1594088,354 24 1673502,682 9 1847815,445 25 1807392,764 10 1308183,104 26 1592898,506 11 1355660,46 27 1174908,046 12 2147122,566 28 1444030,808 13 1562372,468 29 1371550,561 14 1287099,477 30 1035579,232 15 1376052,689 31 1062997,998 16 1848028,492 32 1115375,438 Экономико- математическая модель примет вид: yx=606554,5+40197,6 Это значит, что если количество покупателей с высшим образованием равно нулю, то объём продаж составит 605554,5. При увеличении числа покупателей со средним образованием на 1%. объём продаж возрастет на 40197,6.
  • 13. 10Б У является объем продаж, независимой Х – количество покупателей, имеющих высшее образование . Проверка на типичность n yy xii   2 )(  n xxi x    2 )(   2 00   n ata  x a n at *2 11   σε 792865,9 σx 7,9 ta0 4,19016101 ta1 2,185859749 Условие типичности: ta0>tk<ta1 4,19016101>1,96>2,185859749 Параметры уравнения регрессии не признаются типичными, т.к. не удовлетворяют условию выше. y = 40198x + 606555 0,00 500000,00 1000000,00 1500000,00 2000000,00 2500000,00 3000000,00 3500000,00 4000000,00 4500000,00 0,00 10,00 20,00 30,00 40,00 50,00 Объемпродаж Покупатели с высшим образованием y = 40198x + 606555 0 500000 1000000 1500000 2000000 2500000 0,00 10,00 20,00 30,00 40,00 50,00 Объёмпродаж Покупатели с высшим образованием ГРАФИК УРАВНЕНИЯ РЕГРЕССИИ
  • 14. Оценка практической значимости модели                         n y n x x n yx xy r y 2 2 2 2 )()( r=0,370654999 r>0, значит, между доходами и продажами существует прямая зависимость. По шкале Чеддока: установленная по уравнению регрессии связь умеренная. Проверка существенности линейного коэффициента Поэтому величина вычисленного линейного коэффициента корреляции r признается существенной. tr> tk 2 1 2 r n rtr    tr=2,185858369 Вывод (0,370655)2=0,13734, поэтому только 13,7% общей вариации объёма продаж объясняется изменением количества покупателей, имеющих высшее образование (факторного признака). Между объёмом продаж и количеством покупателей, имеющих высшее образование, существует умеренная прямая зависимость. С повышением количества покупателей, имеющих высшее образование, объём продаж увеличивается. Синтезированная с помощью уравнения регрессии математическая модель не может быть использована для прогнозирования объёма продаж, а может быть использована только для практических расчётов.
  • 15. 0 500000 1000000 1500000 2000000 2500000 3000000 3500000 4000000 4500000 0 10 20 30 40 Объемпродаж Средний возраст потребителей Диаграмма разброса 11А У является объем продаж, независимой Х – средний возраст покупателей Между средним возрастом покупателей Х и объемом продаж У можно предположить наличие положительной зависимости. xaya xnx yxnxy a 10 221 )(       Расчёт параметров линейной зависимости a1 87696,72972 a0 -1275215,661 Проверка через Пакет Анализа Коэффициенты Y-пересечение -1275215,661 Переменная X 1 87696,72972
  • 16. Теоретические объёмы продаж № yx № yx 1 1558826,935 17 1381311,215 2 1577664,193 18 1468911,478 3 1481969,521 19 1623143,717 4 1632921,902 20 1613058,593 5 1519994,823 21 1516881,589 6 1654486,528 22 1450346,080 7 1710594,895 23 1546926,489 8 1258158,697 24 1504279,569 9 1891127,383 25 1708779,573 10 1601964,956 26 1770623,307 11 1623494,504 27 1404910,405 12 1662589,706 28 1664229,634 13 1590792,393 29 1565737,437 14 1225596,901 30 1347863,682 15 1609524,414 31 973144,3256 16 1399745,067 32 587059,4730 Экономико- математическая модель примет вид: yx=-1275215,66+87696,73*x. Это значит, что, если средний возраст покупателей равен нулю, объём продаж сократится на 1275215,661. При увеличении среднего возраста покупателей на 1 год, объём продаж возрастет на 87696,7.
  • 17. 11Б У является объем продаж, независимой Х – количество покупателей, имеющих высшее образование . Проверка на типичность n yy xii   2 )(  n xxi x    2 )(   2 00   n ata  x a n at *2 11   σε 819987,8212 σx 2,707486178 ta0 -8,51798484 ta1 1,585998864 Условие типичности: ta0>tk<ta1 -8,518<1,96>1,586 Параметры уравнения регрессии не признаются типичными, т.к. не удовлетворяют условию выше. y = 87697x - 1E+06 0 500000 1000000 1500000 2000000 2500000 3000000 3500000 4000000 4500000 0 5 10 15 20 25 30 35 40 Объемпродаж Средний возраст потребителей y = 87697x - 1E+06 0 200000 400000 600000 800000 1000000 1200000 1400000 1600000 1800000 2000000 0,00 10,00 20,00 30,00 40,00 Продажи Средний возраст потребителей График уравнения регрессии
  • 18. Оценка практической значимости модели                         n y n x x n yx xy r y 2 2 2 2 )()( r=0,278136748 r>0, значит, между доходами и продажами существует прямая зависимость. По шкале Чеддока: установленная по уравнению регрессии связь слабая. Проверка существенности линейного коэффициента Поэтому величина вычисленного линейного коэффициента корреляции r не признается существенной. tr<tk 2 1 2 r n rtr    tr=1,585998864 Вывод (0,28)2 = 0,1. По шкале Чеддока установленная по уравнению регрессии связь - слабая. Поэтому около 10% общей вариации продаж объясняется изменением среднего возраста. Между значением среднего возраста и продажами существует умеренная связь. Синтезированная с помощью уравнения регрессии математическая модель м.б. использована для практических целей.
  • 19. 12А У является объем продаж, независимой Х – прирост покупателей Между приростом покупателей Х и объемом продаж У можно предположить наличие положительной зависимости. xaya xnx yxnxy a 10 221 )(       Расчёт параметров линейной зависимости a1 28862,17747 a0 1454971,685 Проверка через Пакет Анализа Коэффициенты Y-пересечение 1454971,685 Переменная X 1 28862,17747 0 500000 1000000 1500000 2000000 2500000 3000000 3500000 4000000 4500000 -10 0 10 20 30 Объемпродаж Прирост покупателей Диаграмма разброса
  • 20. Теоретические объёмы продаж № yx № yx 1 1450420,12 17 1509584,697 2 1465546,787 18 1508848,712 3 1519207,347 19 1506623,438 4 1498720,974 20 1462784,676 5 1459049,911 21 1541930,539 6 1424955,02 22 2132164,955 7 1503564,047 23 1475293,544 8 1523074,879 24 1450443,209 9 1477599,632 25 1475417,651 10 1458331,242 26 1458876,738 11 1488157,417 27 1466077,851 12 1456720,733 28 1476378,762 13 1502126,71 29 1474289,14 14 1487458,952 30 1461136,646 15 1497930,15 31 1458178,273 16 1593328,305 32 1462438,33 Экономико- математическая модель примет вид: yx=1454971,685+28862,17*x Это значит, что если прирост покупателей равен нулю, то объём продаж составит 1454971,7. А при увеличении прироста покупателей на 1%. объём продаж возрастет на 28862,2.
  • 21. 12Б У является объем продаж, независимой Х –прирост покупателей. Проверка на типичность n yy xii   2 )(  n xxi x    2 )(   2 00   n ata  x a n at *2 11   σε 845582,7586 σx 4,062249943 ta0 9,424515866 ta1 0,759451846 Условие типичности: ta0>tk<ta1 0,7595<1,96<9,4245 Параметры уравнения регрессии не признаются типичными, т.к. не удовлетворяют условию выше. y = 28862x + 1E+06 0 500000 1000000 1500000 2000000 2500000 3000000 3500000 4000000 4500000 -5 0 5 10 15 20 25 Объемпродаж Прирост покупателей Диаграмма разброса y = 28862x + 1E+06 0 500000 1000000 1500000 2000000 2500000 -10 0 10 20 30 Продажи Прирост График уравнения регрессии
  • 22. Оценка практической значимости модели                         n y n x x n yx xy r y 2 2 2 2 )()( r=0,137342345 r>0, значит, между доходами и продажами существует прямая зависимость. По шкале Чеддока: установленная по уравнению регрессии связь слабая. Проверка существенности линейного коэффициента Поэтому величина вычисленного линейного коэффициента корреляции r не признается существенной. tr<tk 2 1 2 r n rtr    tr=0,759451846 Вывод 0,142 = 0,0196. Поэтому менее 10% общей вариации продаж объясняется изменением прироста населения. Между доходом и продажами существует умеренная связь. С повышением доходов прирост стремятся к увеличению. Синтезированная с помощью уравнения регрессии математическая модель м.б. использована для практических целей.
  • 23. Оценка адекватности моделей 100* //1    i xii y yy n  Модель 1 2 3 4 5 Задание 1-8 9 10 11 12 Ꜫ 57,48% 48,80% 59,61% 63,18% 69,88% Вывод. Наиболее адекватной для практических целей является модель 2 (yx=-2670783,9+55674*x), так как она имеет наименьшую ошибку аппроксимации.
  • 24. Оценка адекватности моделей Модель 1 2 3 4 5 Задание 1-8 9 10 11 12 r 0,45 0,59 0,37 0,28 0,14 Вывод. Линейный коэффициент корреляции больше у модели 2. (0,59)2 = 0,35. Поэтому более 35% общей вариации продаж объясняется изменением числа покупателей со средним образованием. Между количеством покупателей со средним образованием и продажами существует заметная связь. С повышением числа покупателей со средним образованием продажи стремятся к увеличению. Синтезированная с помощью уравнения регрессии математическая модель м.б. использована для практических целей.