This is an introduction of basic theories and skills of probability, statistics, and some examples of Machine Learning algorithms for beginners. The content is written in Chinese.
43. 1.5 事件的独立性
一、 事件独立两
定义 1 设 A 、 B 是 事件,两 P(A) ≠0, 若
P(B) = P(B|A) (1.5.1)
称事件则 A 与 B 相互独立。
式 (1.5.1) 等价于:
P(A∩B) = P(A)P(B) (1.5.2)
44. 二、多个事件的独立
定义 2 、若三个事件 A 、 B 、 C 足:满
(1) P(AB)=P(A)P(B), P(AC)=P(A)P(C),
P(BC)=P(B)P(C),
称事件则 A 、 B 、 C 相互独立两两 ;
若在此基 上 足:础 还满
(2) P(ABC) = P(A)P(B)P(C), (1.5.3)
称事件则 A 、 B 、 C 相互独立。
45. 一般地,设 A1 , A2 ,…, An 是 n 个事件,如果对
任意 k (1<k≤n), 任意的 1≤i1<i2 <… < ik≤ n ,具有等
式
P(A i1 A i2 … A ik) = P(A i1)P(A i2)…P(A ik)
称则 n 个事件 A1 , A2 ,…, An 相互独立。思考
一 骰子颗 掷 4 次至少得一个六点与 骰子两颗 掷
24 次至少得一个双六, 件事, 一个有更这两 哪
多的机会遇到? 答 :0.518,
0.491
49. 机器学 定习 义
• Arthur Samual ( 1959 )
Machine learning : Field of study that gives computers the
ability to learn without being explicitly programmed.
50. 机器学 定习 义
• Tom Mitchell ( 1998 )
Well-posed Learning Problem : A computer program is said to
learn from experience E with respect to some task T and some
performance measure P, if its performance on T, as measured by
P, improves with experience E.
76. K-means 聚类算法
• 入:输
- K (簇的数量)
- 数据集(训练 Training Set ) :
例上除去惯
}...,,{ )()3()2()1( m
xxxx
ni
x R∈)( )0(
x
77. K-means 聚类算法
• 随机初始化 K 个簇的 心:质
• 循 理环处 while 收敛 {
for i = 1 to m
:= 距离 最近的簇的 心的索引(质 1 to K )
for k = 1 to K
:= 从属于索引为 k 的簇中所有 本的平均样 值
}
n
K R∈µµµµ ,...,, 321
)(i
c )(i
x
kµ
kµ