Created personalized product recommendation engine predictive models and Market basket analysis for products to be purchased by existing and new customers. Created Multi output ensemble classifier model with MAP score of 0.39.
Ce cours introduira les étudiants à l'analyse numérique. Il aborde les thèmes suivants :
- Introduction au calcul numérique,
- Résolution des équations numériques,
- Interpolation polynomiale,
- Dérivation et intégration numériques,
- Résolution des équations différentielles ordinaires
- Résolution de systèmes linéaires.
A chaque fois, les notions présentées sont illustrées par des exemples pratiques. Des exercices
et problèmes sont aussi proposés afin de confronter les étudiants aux multiples difficultés du
calcul numérique.
Déjà Vu: The Importance of Time and Causality in Recommender SystemsJustin Basilico
Talk at RecSys 2017 in Como, Italy on 2017-08-29.
Abstract:
Time plays a key role in recommendation. Handling it properly is especially critical when using recommender systems in real-world applications, which may not be as clear when doing research with historical data. In this talk, we will discuss some of the important challenges of handling time in recommendation algorithms at Netflix. We will focus on challenges related to how our users, items, and systems all change over time. We will then discuss some strategies for tackling these challenges, which revolves around proper treatment of causality in our systems.
Created personalized product recommendation engine predictive models and Market basket analysis for products to be purchased by existing and new customers. Created Multi output ensemble classifier model with MAP score of 0.39.
Ce cours introduira les étudiants à l'analyse numérique. Il aborde les thèmes suivants :
- Introduction au calcul numérique,
- Résolution des équations numériques,
- Interpolation polynomiale,
- Dérivation et intégration numériques,
- Résolution des équations différentielles ordinaires
- Résolution de systèmes linéaires.
A chaque fois, les notions présentées sont illustrées par des exemples pratiques. Des exercices
et problèmes sont aussi proposés afin de confronter les étudiants aux multiples difficultés du
calcul numérique.
Déjà Vu: The Importance of Time and Causality in Recommender SystemsJustin Basilico
Talk at RecSys 2017 in Como, Italy on 2017-08-29.
Abstract:
Time plays a key role in recommendation. Handling it properly is especially critical when using recommender systems in real-world applications, which may not be as clear when doing research with historical data. In this talk, we will discuss some of the important challenges of handling time in recommendation algorithms at Netflix. We will focus on challenges related to how our users, items, and systems all change over time. We will then discuss some strategies for tackling these challenges, which revolves around proper treatment of causality in our systems.
Evaluating Your Learning to Rank Model: Dos and Don’ts in Offline/Online Eval...Sease
For more details:
https://sease.io/2020/04/the-importance-of-online-testing-in-learning-to-rank-part-1.html
https://sease.io/2020/05/online-testing-for-learning-to-rank-interleaving.html
Learning to rank (LTR from now on) is the application of machine learning techniques, typically supervised, in the formulation of ranking models for information retrieval systems.
With LTR becoming more and more popular (Apache Solr supports it from Jan 2017 and Elasticsearch has an Open Source plugin released in 2018), organizations struggle with the problem of how to evaluate the quality of the models they train.
This talk explores all the major points in both Offline and Online evaluation.
Setting up correct infrastructures and processes for a fair and effective evaluation of the trained models is vital for measuring the improvements/regressions of a LTR system.
The talk is intended for:
– Product Owners, Search Managers, Business Owners
– Software Engineers, Data Scientists, and Machine Learning Enthusiast
Expect to learn :
the importance of Offline testing from a business perspective
how Offline testing can be done with Open Source libraries
how to build a realistic test set from the original data set in input avoiding common mistakes in the process
the importance of Online testing from a business perspective
A/B testing and Interleaving approaches: details and Pros/ Cons
common mistakes and how they can false the obtained results
Join us as we explore real-world scenarios and dos and don’ts from the e-commerce industry!
Deep Learning: Introduction & Chapter 5 Machine Learning BasicsJason Tsai
Given lecture for Deep Learning 101 study group with Frank Wu on Dec. 9th, 2016.
Reference: https://www.deeplearningbook.org/
Initiated by Taiwan AI Group (https://www.facebook.com/groups/Taiwan.AI.Group/)
Netflix talk at ML Platform meetup Sep 2019Faisal Siddiqi
In this talk at the Netflix Machine Learning Platform Meetup on 12 Sep 2019, Fernando Amat and Elliot Chow from Netflix talk about the Bandit infrastructure for Personalized Recommendations
Tong is a data scientist in Supstat Inc and also a master students of Data Mining. He has been an active R programmer and developer for 5 years. He is the author of the R package of XGBoost, one of the most popular and contest-winning tools on kaggle.com nowadays.
Agenda:
Introduction of Xgboost
Real World Application
Model Specification
Parameter Introduction
Advanced Features
Kaggle Winning Solution
CHAPITRE VIII : Systèmes linéaires Modélisation & SimulationMohammed TAMALI
Dans la réalité des choses, les systèmes qui composent et forment notre univers sont parfaitement non-linéaires. Pour des raisons de prise en considération et d’étude, nous considérons, pour des systèmes donnés, que la région où celui-ci se comporte d’une manière continu et linéaire.
Le caractère de proportionnalité et de superposition est alors significatif pour ce genre de systèmes.
Le système, c’est la composition au sens Bertallanfy. Nous sous-entendons par cette remarque que SYSTÈME LINEAIRE est non totalement compatible à SYSTÈME D’EQUATIONS LINEAIRES.
Une équation est dite linéaire si les variables font apparaître des évolutions indépendantes proportionnelles. Un système d’équations linéaires, est une compositions de telles équations.
Le système est dit LINÉAIRE si la fonction de transfert qui décrit son comportement fonctionnel est elle-même linéaire. Cette dernière vérifie alors les principes de la proportionnalité et de la superposition.
Evaluating Your Learning to Rank Model: Dos and Don’ts in Offline/Online Eval...Sease
For more details:
https://sease.io/2020/04/the-importance-of-online-testing-in-learning-to-rank-part-1.html
https://sease.io/2020/05/online-testing-for-learning-to-rank-interleaving.html
Learning to rank (LTR from now on) is the application of machine learning techniques, typically supervised, in the formulation of ranking models for information retrieval systems.
With LTR becoming more and more popular (Apache Solr supports it from Jan 2017 and Elasticsearch has an Open Source plugin released in 2018), organizations struggle with the problem of how to evaluate the quality of the models they train.
This talk explores all the major points in both Offline and Online evaluation.
Setting up correct infrastructures and processes for a fair and effective evaluation of the trained models is vital for measuring the improvements/regressions of a LTR system.
The talk is intended for:
– Product Owners, Search Managers, Business Owners
– Software Engineers, Data Scientists, and Machine Learning Enthusiast
Expect to learn :
the importance of Offline testing from a business perspective
how Offline testing can be done with Open Source libraries
how to build a realistic test set from the original data set in input avoiding common mistakes in the process
the importance of Online testing from a business perspective
A/B testing and Interleaving approaches: details and Pros/ Cons
common mistakes and how they can false the obtained results
Join us as we explore real-world scenarios and dos and don’ts from the e-commerce industry!
Deep Learning: Introduction & Chapter 5 Machine Learning BasicsJason Tsai
Given lecture for Deep Learning 101 study group with Frank Wu on Dec. 9th, 2016.
Reference: https://www.deeplearningbook.org/
Initiated by Taiwan AI Group (https://www.facebook.com/groups/Taiwan.AI.Group/)
Netflix talk at ML Platform meetup Sep 2019Faisal Siddiqi
In this talk at the Netflix Machine Learning Platform Meetup on 12 Sep 2019, Fernando Amat and Elliot Chow from Netflix talk about the Bandit infrastructure for Personalized Recommendations
Tong is a data scientist in Supstat Inc and also a master students of Data Mining. He has been an active R programmer and developer for 5 years. He is the author of the R package of XGBoost, one of the most popular and contest-winning tools on kaggle.com nowadays.
Agenda:
Introduction of Xgboost
Real World Application
Model Specification
Parameter Introduction
Advanced Features
Kaggle Winning Solution
CHAPITRE VIII : Systèmes linéaires Modélisation & SimulationMohammed TAMALI
Dans la réalité des choses, les systèmes qui composent et forment notre univers sont parfaitement non-linéaires. Pour des raisons de prise en considération et d’étude, nous considérons, pour des systèmes donnés, que la région où celui-ci se comporte d’une manière continu et linéaire.
Le caractère de proportionnalité et de superposition est alors significatif pour ce genre de systèmes.
Le système, c’est la composition au sens Bertallanfy. Nous sous-entendons par cette remarque que SYSTÈME LINEAIRE est non totalement compatible à SYSTÈME D’EQUATIONS LINEAIRES.
Une équation est dite linéaire si les variables font apparaître des évolutions indépendantes proportionnelles. Un système d’équations linéaires, est une compositions de telles équations.
Le système est dit LINÉAIRE si la fonction de transfert qui décrit son comportement fonctionnel est elle-même linéaire. Cette dernière vérifie alors les principes de la proportionnalité et de la superposition.
2. Belangrijkste rekenregels
De rekenregels voor logaritmen zijn gegeven bij het examen.
ap · aq = ap+q
ap
aq = ap−q
(ap )q = ap·q
a0 = 1
a−n = a1n
p √
a q = q ap
3. Algebra¨
ısche vaardigheden
Zorg dat je de volgende herleidingen kunt maken!
Breuken
60V 120aV
V2
= 2ak+V 2
2a
+k
Wortels √
D = 6.9 T − 12 → T = ...
Exponenten en logaritmen
1
g 4 = 182 → g = 182 4 → g = 1820.25
Herleidingen √
√ √
x x + 1 + 2 x + 1 = (x + 2) x + 1
Algemen vormen
−0.003x 2 + 2bx = 0 → x = ...ofx = ...
4. Lineaire en exponenti¨le groei
e
Lineaire groei Exponenti¨le groei
e
y = ax + b N = b·g t
Als x met 1 stijgt, zal y b = beginwaarde
altijd met dezelfde g = groeifactor
constante waarde t = tijdseenheid
stijgen. Als x met 1 stijgt, zal y altijd
stijgen met dezelfde factor.
X 0 1 2 3 4
Y 1 4 7 10 13 t 0 1 2 3 4
Y 50 65 84.5 109.9 142.8
(+ 3)
(65/50) = 1.3 = (84, 5/65) →
→ y = 3x + 1 g = 1.3
5. Oefenen (1)
Stel een formule op van het verband uit de grafiek.
t 0 1 2 3 4
Y 50 65 84.5 109.9 142.8
y = b · g t met b = beginwaarde, die is hier 50. De groeifactor is
65 109.9 142.8
60 = 1.3 of 84.5 = 1.3 of 109.9 = 1.3. Dus g = 1.3. Dat geeft de
formule: y = 50 · 1.3 t
6. Permutaties en combinaties
Permutatie Combinatie
Je kiest r dingen uit n, Je kiest r dingen uit n,
zonder te herhalen zonder te herhalen
Zonder terugleggen Zonder terugleggen
De volgorde is De volgorde is NIET
belangrijk! (ABC is niet belangrijk! (ABC is CBA)
CBA)
n! n
n! r !(n−r )!
r
(n−r )!
Rekenmachine: n nPr r Rekenmachine: n nCr r
7. Permutaties en combinaties (2)
Permutatie Combinatie
Bereken het aantal Bereken het aantal
mogelijkheden om uit de 26 mogelijkheden om uit de 26
letters van het alfabet rijtjes letters van het alfabet 15
neer te leggen van 15 verschillende letters te pakken.
verschillende letters.
De volgorde van pakken speelt
De volgorde van neerleggen is geen rol, dus een combinatie.
belangrijk, dus een permutatie. 26
26! Antwoord:
Antwoord: (2615)! 15
Rekenmachine: 26 nPr 15 Rekenmachine: 26 nCr 15
8. Oefenen (2)
We hebben de volgende verzameling letters:
T E L E F O O N (8 letters, 6 verschillende letters)
Hieruit kiezen we 3 letters. Hoeveel verschillende woorden van 3
letters kunnen we maken?
Is het een permutatie of een combinatie?
Hoe groot is onze hele verzameling? (n)
Hoeveel dingen kiezen we? (r)
9. Oefenen (3)
Een klas bestaat uit 26 leerlingen. Op hoeveel verschillende manier
kun je 5 leerlingen uit deze klas halen?
Is het een permutatie of een combinatie?
Hoe groot is onze hele verzameling? (n)
Hoeveel dingen kiezen we? (r)
10. Oefenen (4)
Een klas bestaat uit 26 leerlingen. Op hoeveel manieren kun je 5
van de 26 leerlingen op een rij zetten?
Is het een permutatie of een combinatie?
Hoe groot is onze hele verzameling? (n)
Hoeveel dingen kiezen we? (r)
11. Kansen
aantal mogelijke uitkomsten van G
P(G ) = totale aantal mogelijke uitkomsten
Kans op een vaste volgorde: vermenigvuldiging
Kans bij verschillende volgorder: tel op
3 3 9
P(MM) = 7 · 7 = 49
9 16 25
P(MMenVV ) = P(MM) + P(VV ) = 49 + 49 = 49
12. Kansen (2)
P(A en B)
P(A|B) = P(B)
P(A of B) = P(A) + P(B) als A en B uitsluitende
gebeurtenissen zijn
P(A en B) = P(A) · P(B) als A en B onafhankelijk
P(A en B) = P(A|B) · P(B) als A en B afhankelijk
Complementregel
P(G ) = 1 − P(niet G )
P(X ≥ 2)
0 1 2 3 4 5 6 7 8 9 10
= 1 − P(X < 2)
13. Oefenen (5)
Je gooit met 5 munten. Wat is de kans op minstens 1 kop?
P(minstens 1 kop) = P(KMMMM) + P(KKMMM) +
P(KKKMM) + ...
Dit zou een erg lange berekening worden, dus:
P(minstens 1 kop) = 1 P(nul kop) = 1 − 0.55 = 0.96875
14. Diffenti¨ren
e
De volgende rekenregels worden gegeven op je examen:
Somregel
Productregel
Quoti¨ntregel
e
kettingregel
f (x) = axf (x) = a
f (x) = x r f (x) = r · x r −1
f (x) = g x f (x) = g x · ln(g )
1 1
f (x) = f (x) = x ·
ln(g )
1
f (x) = ln(x)f (x) =x
15. Oefenen (6)
f (x) = 3x 6
De afgeleide is dan f (x) = 18x 5
5
f (x) = x4
−20
De afgeleide is dan f (x) = x5
Wat is de afgeleide van f (x) = (2x 2 + 2x + 1)2 ?
16. zelf oefenen
f (x) = x 3 − 3x + 3
Stel de vergelijking op van de raaklijn aan de grafiek van f in A
met xA = 1.5
Oplossing
y = ax + b en plot de grafiek! f (x) = 3x 2 − 3
y = f (xA ) = f (1.5) = 1.53 − 3 · 1.5 + 3 = 1.875
a = f (xA ) = f (1.5) = 3.75
Invullen in y = ax + b geeft:
1.875 = 3.75 · 1.5 + b
b = -3.75 → y = 3.75x − 3.75
17. Differenti¨ren(2)
e
f (x) < 0 grafiek van f daalt
f (x) = 0 grafiek van f horizontaal
f (x) > 0 grafiek van f stijgt
Maximum en
minimum
berekenen met
f (x) = 0, of met
rekenmachine
18. Binomiale verdeling
Hetzelfde experiment wordt een aantal keer herhaald
De uitkomst is succes of mislukking
De kans op succes blijft gelijk
Het aantal keren succes wordt geteld
Een steekproef met terugleggen en twee mogelijke uitkomsten. Of
een kleine steekproef zonder terugleggen uit grote populaties met
twee mogelijke uitkomsten.
p = kans op succes, n = aantal herhalingen
n 3
P(X = 3) = p (1 − p)n−3
3
Of, algemener:
n k
P(X = k) = p (1 − p)n−k
k
19. Oefenen (7)
Een vaas bevat 20 witte en 15 zwarte knikkers. Uit de vaas wordt
4 keer met terugleggen een knikker getrokken. Wat is de kans dat
er 2 witte knikkers worden getrokken?
Binomiale verdeling
Wat is X? X is het aantal witte knikkers
Wat is n? n = 4
20
Wat is p? p = 35
Wat moeten we berekenen? P(X = 2)
4 20 2
P(X = 2) = ( ) (1 − 20 )4−2 = 0.3599
3 35 35
Of met binompdf(n,p,k) op de TI
20. Binomiaal TI (zelf)
P(X ≤ k)
kies optie binomcdf( via DISTR voer in aantal n, kans p en
uitkomst k bereken de kans
P(X ≥ k)
kies optie binomcdf( via DISTR voer in aantal n, kans p en
uitkomst k-1 bereken de kans
hiermee bereken je de kans P(X ≤ k − 1) bereken nu de kans
P(X ≥ k) = 1P(X ≤ k − 1)
Gebruik de optie binomcdf als je de kans P(X ≤ k) (of een
variant hiervan) moet berekenen en binompdf als je de kans
P(X = k) moet berekenen.
21. Oefenen (8)
In een schoolklas zitten 15 jongens en 8 meisjes. Om een
klassenavond te organiseren worden door het lot hiervoor vier
leerlingen aangewezen. Bereken de kans dat dit allemaal jongens
zijn.
Dit is een steekproef zonder teruglegging, met een kleine populatie.
p zal heel erg veranderen, dus mogen we deze opgave niet met een
binomiale verdeling behandelen. X = aantal jongens
15 14 13 12
P(X = 4) = 23 · 22 · 21 · 20 = 0.1542
22. Normale verdeling
Gebruik de normale verdeling als:
68% van de data ligt tussen µ − σ en µ + σ
95% van de data ligt tussen µ − 2σ en µ + 2σ
Frequentiepolygoon is klokvormig
Grafiek van het relatief cumulatief frequentiepolygoon is een
rechte lijn op normaalwaarschijnlijkheidspapier
P(X ≥ x) = 1 − P(X < x)
23. Standaardopgaven TI(1)
X is normaal verdeeld
µ = 144, σ = 12, berekenP(X ≤ 140)
kies normalcdf via DISTR
normalcdf(linkergrens, rechtergrens, µ, σ)
normalcdf(−E 99, 140, 144, 12) = 0.3694
Dus
P(X ≤ 140) = 0.3694
24. Standaardopgaven TI(2)
X is normaal verdeeld
µ =?, σ = 12, P(X ≤ 140) = 0.37, berekenµ.
gebruik y=
y1 = normalcdf((-E99, 140, x, 12)
y2 = 0.37
Plot en gebruik optie intersect
µ = 144
25. Standaardopgaven TI(3)
X is normal verdeeld
µ = 144, σ =?, P(X ≤ 140) = 0.37, berekenσ.
gebruik y=
y1 = normalcdf(−E 99, 140, 144, x)
y2 = 0.37
Plot en gebruik optie intersect
σ = 12
26. Standaardopgaven TI(4)
X is normal verdeeld
µ = 0, σ = 1, berekenP(−0.43 < X < 0.23).
kies normalcdf via DISTR
normalcdf(−0, 43, 0, 23, 0, 1) = 0.2574
P(−0, 43 < X < 0, 23) =
0.2574
27. Standaardopgaven TI(5)
X is normal verdeeld
µ = 144, σ = 12, P(X ≤ x) = 0.8, berekenx.
kies invNorm via DISTR
invNorm(0.8, 144, 12) = 154
X = 154
28. √
n-wet
X is normaal verdeeld met parameters µ en σ
Xn = X1 + X2 + + Xn
√
Xn is dan normaal verdeeld met µXn = nµ en σXn = nσ
(X1 +X2 ++Xn )
Xgem = n
σ
Xgem is dan normaal verdeeld met µXgem = µ en σXgem = √
n
29. Oefenen (9)
Het gewicht van pakken koffie is normaalverdeeld met µ = 253
gram en σ = 8 gram. Depakken worden willekeurig met 20 stuks
verpaktin grotere dozen. Wat is de verdeling van hetgemiddelde
gewicht van deze 20 pakken koffie?
√
Met n wet:
µXgem = 253 en σXgem = √8 = 1.7889
20
30. Oefenen (10)
Uit deze pakken koffie wordt nu een aselectesteekproef genomen
van omvang n = 40. Bereken de kans dat het gemiddelde van deze
pakken koffie kleiner is dan 252 gram.
µXgem = 253 en σXgem = √8 = 1.2649
40
P(Xgem ≤ 252) = normalcdf(−E 99, 252, 253, 1.2649) = 0.2146
31. Binomiaal is Normaal
Benaderen binomiale verdeling (n, p) door normale verdeling (µ, σ)
n ≥ 20
np ≥ 5 en (1 − p) ≥ 5
µ = npenσ = np(1 − p)
continu¨
ıteitscorrectie
P(X ≤ k) = P(X ≤ k + 0.5)
P(X ≥ k) = P(X ≥ k − 0.5)
P(X = k) = P(k − 0.5 ≤ X ≤ k + 0.5)
32. Oefenen (11)
X is binomiaal verdeeld met n = 60 en p = 0.35. Bereken
P(X ≤ 18) door een normale verdelingen je rekenmachine.
np = 21, n(1p) = 39 en n ≥ 20, dus we mogen denormale
benadering gebruiken!
√
µ = 21enσ = 60 · 0.35 · 0.65 = 3.6945
P(X ≤ 18) =normalcdf(−E 99, 18.5, 21, 3.9645) = 0, 2642
Direct met de TI geeft:
P(X ≤ 18) =binomcdf(60, 0.35, 18) = 0.2518
33. Standaardiseren (voor CASIO)
−µ
Z = X σ , Z is standaard normaal verdeeld.
De variabele X is normaal verdeeld met gemiddelde 162 en
onbekende spreiding σ.
Verder geldt: P(154 < X < 170) = 0.82. Bepaal σ.
De getallen 154 en 170 liggen evenver van 162. Omdat geldt dat
P(154 < X < 170) = 0.82, geldt dat P(X < 154) = 0.18 = 0.09.
2
De linker overschrijdingskans weten we nu. Gebruik nu:
Inverse Normal
Area = 0.09
σ=1
µ=0
Execute
Je vindt dan Z = −1.3407.
Vul de bekende waarden in in Z = X σ en los op
=µ
Je vindt dan Z = −1.3407.
−µ
Vul de bekende waarden in in Z = X σ en los σ op.
154162
σ = −1.3407, dus σ = 5.9670.
34. Toetsen van gemiddelde µ met normaal verdeelde
grootheid(1)
H0 is de nulhypothese, H1 is de alternatieve hypothese.
Linkseenzijdig
H0 : µ = µ0 en
H1 : µ < µ0
Rechtseenzijdig
H0 : µ = µ0 en
H1 : µ > µ0
Tweezijdig
H0 : µ = µ0 en
H1 : µ = µ 0
35. Oefenen (12)
Een koffiehandelaar beweert dat het gemiddeld gewicht van door
hem verkochte pakken koffie minstens gelijk is aan 250 gram. Uit
metingen is bekend dat de standaardafwijking van de gewichten
gelijk is aan 8 gram. Er mag van uitgegaan worden dat de
gewichten normaal zijn verdeeld. De wareninspectie trekt de
bewering in twijfel en besluit tot een aselecte steekproef van 20
pakken. Na weging blijkt het gemiddelde gewicht van de pakken in
de steekproef 248.1 gram te zijn.
Toets met een significantieniveau van 0.05 of de koffiehandelaar
gelijk kan hebben.
36. Oefenen (13)
H0 : µ = 250
H1 : µ < 250
Toetsingsgrootheid Xgem = gemiddelde in de steekproef
µXgem = 250 en σXgem = √8 = 1.7889
20
Bepaal XL waarvoor geldt: P(Xgem < XL ) ≤ 0.05.
TI geeft: invNorm(0.05, 250, 1.7889) = 247.0575.
248.1 ligt niet in het verwerpingsgebied, dus wordt H0
geaccepteerd. De koffiehandelaar krijgt gelijk.
37. Tekentoets
Vak Rapport Els Rapport Hans Tekens
Nederlands 7 8 +
Latijn 6 7 +
Frans 6 6 0
Duits 7 8 +
Engels 7 8 +
Geschiedenis 9 5 -
Aardrijkskunde 6 7 +
Wiskunde 7 8 +
Natuurkunde 7 7 0
Scheikunde 6 7 +
Tekenen 9 5 -
LO 6 7 +
38. Oefenen (14)
Toets met de tekentoets of het rapport van Hans beter is dan dat
van Els (α = 0.05). Een + als Hans beter is dan Els, een 0 als ze
gelijk zijn en een - als Els beter is dan Hans. 8 keer een +, 2 keer
een -.
H0 : p = 0.5 (rapport van Hans is niet beter)
H1 : p > 0.5 (rapport van Hans is wel beter)
39. Oefenen (15)
Toetsingsgrootheid: X = aantal keer een +. X is binomiaal
verdeeld met n = 10 en p = 0.5.
Bereken k zodat P(X ≥ k) ≤ 0.05. Gewoon proberen!
P(X ≥ 8) = 1 − P(X ≤ 7) = 10.9453 = 0.0547 (> 0.05)
P(X ≥ 9) = 1 − P(X ≤ 8) = 10.9893 = 0.0107 (< 0.05)
Kritieke gebied: 9, 10. 8 ligt daar niet in, dus H0 wordt aanvaard.
Hans heeft geen significant beter rapport dan Els.
40. Niet behandeld, maar belangrijk (1)
Domein
Bereik
Asymptoot
Intervalnotatie (< a, b > en [a, b])
Formule opstellen aan de hand van een grafiek (y = ax + b,
hellingsgetal a en startgetal b)
Transformatie van y = f(x)
4 naar rechts: f(x 4)
3 naar boven: f(x) + 3
vermenigvuldigen met 2 tov de x-as: 2f(x)
vermenigvuldigen met 5 tov de y-as: f(x/5)
Groeifactor veranderen als de tijdseenheid verandert
1
g = 3.56 in weken, g = 3.56 7 in dagen
Verdubbelingstijd
Halveringstijd
41. Niet behandeld, maar belangrijk (2)
Maximum en minimum in GR
Toenamediagrammen
Boomdiagram
Rooster
Wegendiagram
n! = n ∗ (n1) ∗ ... ∗ 4 ∗ 3 ∗ 2 ∗ 1
4! = 4 ∗ 3 ∗ 2 ∗ 1
Het vaasmodel kunnen gebruiken
Empirische kans theoretische kans
Venn-diagram
Verwachtingswaarde en standaardafwijking
X binomiaal verdeeld, verwachtingswaarde is np en
standaardafwijking is np(1-p)
Kunnen werken met normaal-waarschijnlijkheidspapier
42. Niet behandeld, maar belangrijk (3)
Gelote steekproef
Gelaagde steekproef
Systematische steekproef
Turftabel
Frequentietabel
Staafdiagram
Steel- en bladdiagram
Cirkeldiagram
Frequentiepolygoon
Gemiddelde
Modus
Mediaan
Kwartiel
Boxplot
43. Niet behandeld, maar belangrijk (4)
Fout van de eerste/tweede soort
Het toetsen van p bij binomiaal verdeelde grootheid X
linkseenzijdig:
H1 1: p < p0
rechtseenzijdig:
H1 1: p > p0
tweezijdig:
H1 1: p = p0
Toetsen van mediaan van serie waarnemingen (met
tekentoets, noteer het teken bij waarneming mediaan)
44. Niet behandeld, maar belangrijk (5)
Alles met de rekenmachine!
Grafieken plotten
Nulpunten en extremen bepalen
Asymptoten
Snijpunten bepalen
Inverse plotten
Tabel maken
Somtabel/verschiltabel maken en plotten
Vergelijkingen oplossen (door snijpunten)
Permutatie, combinatie, faculteit
P(X = k) en P(X ≤ k) berekenen
Standaardafwijking, gemiddelde bepalen
Toevalsgetallen simuleren
Histogram en boxplot plotten
Afgeleide functie en hellingsco¨ffici¨nt aflezen
e e
Afgeleide functie en raaklijn plotten