Using of Bayes Belief Networks for Sustainable Development AnalysisSSA KPI
AACIMP 2010 Summer School lecture by Andriy Boldak. "Sustainable Development" stream. "Using of Bayes Belief Networks for Sustainable Development Analysis" course.
More info at http://summerschool.ssa.org.ua
Using of Bayes Belief Networks for Sustainable Development AnalysisSSA KPI
AACIMP 2010 Summer School lecture by Andriy Boldak. "Sustainable Development" stream. "Using of Bayes Belief Networks for Sustainable Development Analysis" course.
More info at http://summerschool.ssa.org.ua
This document discusses sound waves and their properties. Sound waves are compressional waves that travel through air as a series of compressions and rarefactions, transferring energy without transferring matter. The key properties of sound waves are that they require a medium, have a wavelength, amplitude, frequency and pitch related to frequency, and can travel at different speeds depending on the density and temperature of the medium. Sound waves are an example of mechanical waves and are studied in the field of acoustics.
A study on construction of optimal portfolio using sharpe’s single index modelProjects Kart
1. The document discusses constructing an optimal portfolio using Sharpe's single index model. It analyzes stock price movements and index values of companies over 5 years to calculate expected returns, standard deviation, and beta values.
2. The methodology uses secondary data sources and interprets the results using Sharpe's model to select stocks for the optimal portfolio.
3. The scope is limited to 30 Sensex companies over 5 years based only on share prices, indexes, interest rates, and beta values.
This document discusses sound waves and their properties. Sound waves are compressional waves that travel through air as a series of compressions and rarefactions, transferring energy without transferring matter. The key properties of sound waves are that they require a medium, have a wavelength, amplitude, frequency and pitch related to frequency, and can travel at different speeds depending on the density and temperature of the medium. Sound waves are an example of mechanical waves and are studied in the field of acoustics.
A study on construction of optimal portfolio using sharpe’s single index modelProjects Kart
1. The document discusses constructing an optimal portfolio using Sharpe's single index model. It analyzes stock price movements and index values of companies over 5 years to calculate expected returns, standard deviation, and beta values.
2. The methodology uses secondary data sources and interprets the results using Sharpe's model to select stocks for the optimal portfolio.
3. The scope is limited to 30 Sensex companies over 5 years based only on share prices, indexes, interest rates, and beta values.
4. Параметры гистограммы
Длина интервалов влияет на детализацию гистограммы
Histogram of data Histogram of data
2.0
2.0
1.5
1.5
Density
Density
1.0
1.0
0.5
0.5
0.0
0.0
-0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6
y y
5. Параметры гистограммы
Область определения может повлиять на форму
Histogram of data Histogram of data
2.0
2.0
1.5
1.5
Density
Density
1.0
1.0
0.5
0.5
0.0
0.0
-0.5 0.0 0.5 -0.5 0.0 0.5
y y
8. Простая непараметрическая оценка
•
Small h Large h
3.5
3.0
2.5
2.5
2.0
2.0
Density
Density
1.5
1.5
1.0
1.0
0.5
0.5
0.0
0.0
-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0
y y
11. Kernel function Kernel function
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.1 0.2 0.3 0.4
-3
-3
-2
-2
-1
-1
0
0
x
x
Gaussian kernel
Triangular kernel
1
1
2
2
3
3
Kernel function Kernel function
Ядерные функции
0.0 0.1 0.2 0.3 0.4 0.5 0.00 0.05 0.10 0.15 0.20 0.25 0.30
-3
-3
-2
-2
-1
-1
0
0
x
x
Uniform kernel
1
1
Epanechnikov kernel
2
2
3
3
12. Влияние ширины интервала
Тогда как выбор ядра оказывает незначительное влияние на
оценку плотности, выбор ширины интервала имеет
решающее значение
Under-smoothed estimate Over-smoothed estimate
2.5
2.5
2.0
2.0
1.5
1.5
Density
Density
1.0
1.0
0.5
0.5
0.0
0.0
-1.0 -0.5 0.0 0.5 1.0 -1.0 -0.5 0.0 0.5 1.0
y y
13. Выбор ширины интервала
Существует два основных подхода к определению величины
сглаживающего множителя (ширины интервала):
1. Фиксированная ширина интервала на всей выборке. В
рамках этого подхода выделяют:
• правило подстановки (rule of thumb);
• метод перекрёстной проверки (cross-validation)
2. Ширина интервала меняется в зависимости от
локальной концентрации наблюдений. Методы:
• обобщённый метод ближайших соседей (generalized nearest
neighbors);
• адаптивный метод (adaptive nearest neighbors)
25. Адаптивные методы
Распределение данных может иметь различную
концентрацию в центре и на хвостах, поэтому логично
использовать широкий интервал h там, где они
расположены редко (на хвостах), и меньший — в зонах
высоких концентраций (в центре)
Ядерные оценки с постоянной шириной интервала в случае
гетерогенной концентрации данных пересглаживают
распределение в центре и недосглаживают на хвостах:
Fixed bandwidth
2.5
2.0
1.5
Density
1.0
0.5
0.0
-1.0 -0.5 0.0 0.5 1.0
y
32. Пример 1. Острова
Histogram of y
library(datasets)
y <- log(islands)
0.4
Построение гистограммы
0.3
hist(y,nclass=12,probability=TRUE)
Density
• nclass определяет количество
0.2
интервалов
0.1
• probability преобразует количество
наблюдений в интервале в плотность
0.0
2 4 6 8 10
распределения y
С помощью дополнительного параметра breaks=c(y1,…,yk)
задаётся разбиение на интервалы
33. Пример 1. Острова
Простая непараметрическая оценка плотности
L <- 10^4; N <- length(y)
h <- 2 # ширина интервала
# в точках х будет оцениваться плотность
x <- seq(0,12,length=L) # последовательность 0 – 12 длиной L
f.naive <- numeric() # нулевой (пока) вектор оценок
# считаем количество элементов в интервалах xi ± h/2
for (i in 1:L) f.naive[i] <- sum(1*((y>x[i]-h/2)&(y<x[i]+h/2)))
f.naive <- f.naive/(N*h) # нормируем оценку
34. Пример 1. Острова
График простой оценки
plot(x,f.naive,type="l",main="Naive estimate",
xlab="y",ylab="Density")
rug(y,col=3)
• type определяет вид графика
Naive estimate
"l" — линии, "p" — точки, …
0.35
• main — заголовок
0.30
• xlab — подпись на оси х
0.25
• ylab — подпись на оси у
0.20
Density
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12
y
35. Пример 1. Острова
Ядерные оценки
library(np)
f.fix <- npudens(tdat=y,edat=x,
ckertype="gaussian",bwtype="fixed")
• tdat — обучающая выборка
• edat — точки, в которых рассчитывается оценка
• ckertype — вид ядерной функции
"gaussian", "epanechnikov", "uniform"
• bwtype определяет метод расчёта интервала h
"fixed", "generalized_nn", "adaptive_nn"
• f$dens — искомые значения оценок
Пусть f.fix, f.gen и f.ada — оценки плотности с фиксированным
интервалом, по обобщённому методу ближайших соседей и по
адаптивному методу ближайших соседей
40. Пример 1. Острова
Сравнение адаптивной и фиксированной оценок
plot(x,f.fix$dens,type="l",lty="dashed",ylim=c(0,0.4),
main="Fixed and adaptive estimates",
xlab="y",ylab="Density")
lines(x,f) Fixed and adaptive estimates
0.4
• lty — тип линии
"solid", "dashed", "dotted",
0.3
"dotdash", "longdash", …
• ylim — границы по оси
Density
0.2
ординат
• lines — добавление кривых
0.1
на существующий график
0.0
0 2 4 6 8 10 12
y
43. Пример 1. Острова
Генератор случайных чисел
# фиксированный интервал
M <- 10^6
y.fix.sim <- sample(x,prob=f.fix$dens,size=M,replace=TRUE)
q.fix <- sort(y.fix.sim)[alpha*M]
# для адаптивного варианта
y.ada.sim <- sample(x,prob=f,size=M,replace=TRUE)
q.ada <- sort(y.ada.sim)[alpha*M]
q.fix 10.01
q.ada 10.46
44. Домашнее задание
• рассчитать оценки риска для биржевого индекса по всей
совокупности наблюдений
Исходные данные — «EuStockMarkets»
Бонусные задания (необязательные):
• сравнить оценки риска с результатами, полученными с
помощью обобщённого гиперболического распределения,
GARCH-моделей и теории экстремальных значений
• построить кривую VaR и проверить качество оценок риска
60. Пример 2. Старый служака
y <- faithful; N <- nrow(y)
# сетка для расчёта оценок плотности
L <- 50; u <- seq(0,7,length=L); v <- seq(30,110,length=L)
uv <- expand.grid(u,v)
# оценка плотности
f.fix <- npudens(tdat=y,edat=uv,ckertype="gaussian",bwtype="fixed")
# графики оценки
w <- f.fix$dens; dim(w) <- c(L,L)
persp(u,v,w,theta=30,main="Bivariate kernel estimate, 3D plot",
xlab="Eruption time",ylab="Waiting time",zlab="Density")
contour(u,v,w,nlevel=7,
main="Bivariate kernel estimate, contour plot",
xlab="Eruption time",ylab="Waiting time")
61. Пример 2. Старый служака
Bivariate kernel estimate, 3D plot Bivariate kernel estimate, contour plot
100
0.005
0.015
02
0.
0.
03
80
Density
Waiting time
5
0.02
0.01
0.01
60
0.02
0.025
e
tim
5
0.01
g
itin
0.005
Eru
40
Wa
ptio
n tim
e
0 1 2 3 4 5 6 7
Eruption time
63. Пример 2. Старый служака
Adaptive bivariate kernel estimate, 3D plot Adaptive bivariate kernel estimate, contour plot
100
0.02
80
0.04
Waiting time
0.03
Density
0.01
0.01
60
0.03
e
0.0
tim
2
g
itin
Eru
40
Wa
ptio
n tim
e
0 1 2 3 4 5 6 7
Eruption time
64. Пример 2. Старый служака
Значения логарифмической функции правдоподобия
# оценки плотности в точках yi
f.fix.llh <- npudens(tdat=y,ckertype="gaussian",bwtype="fixed")
llh.fix <- sum(log(f.fix.llh$dens))
# для адаптивного метода
f.llh <- rep(0,times=N)
for (i in 1:N) {
for (j in 1:N) f.llh[i] <- f.llh[i]+kern((y[i,]-
y[j,])/(h*lmbd[j]))/lmbd[j]^2
f.llh[i] <- f.llh[i]/(N*h[1]*h[2])
}
llh.ada <- sum(log(f.llh))
llh.fix -1106
llh.ada -1114
65. Пример 2. Старый служака
Расчёт функций распределения
# фиксированный метод
F.fix <- npudist(tdat=y,edat=uv,ckertype="gaussian",bwtype="fixed")
# адаптивный метод CDF estimate, 3D plot
du <- u[2]-u[1]; dv <- v[2]-v[1]
w <- f; dim(w) <- c(L,L)
F <- rep(0,times=L^2)
for (i in 1:L) {
for (j in 1:L) F[j+(i-1)*L] <-
sum(w[1:j,1:i])*du*dv
CDF
}
e
tim
g
itin
Eru
Wa
ptio
n tim
e
66. Пример 2. Старый служака
Генератор случайных чисел
# для адаптивного метода
alpha <- 0.99
M <- 5000
smpl.ind <- sample(1:(L^2),prob=f,size=M,replace=TRUE)
y.ada.sim <- uv[smpl.ind,]
plot(y.ada.sim,xlab="Eruption",ylab="Waiting time")
100
80
Waiting time
60
40
1 2 3 4 5 6
Eruption
67. Пример 2. Старый служака
Рисование графиков с перекрывающими друг друга точками
plot(y.ada.sim,col=rgb(0,0,1,alpha=0.2))
smoothScatter(y.ada.sim)
68. Домашнее задание
• рассчитать оценки риска для портфеля из двух биржевых
индексов
Исходные данные — «EuStockMarkets»
Бонусное задание (необязательное):
• построить кривую VaR для портфеля и проверить качество
оценок