SlideShare a Scribd company logo
1 of 38
Download to read offline
机器学习

                   • 基本知识
                   • 应用实例
                   • 学习资源

                   杨新勇 2012/06/14
Machine Learning   seyo816@gmail.com
                   http://www.lifeba.org
机器学习介绍
•   机器学习概述和定义
•   机器学习发展史
•   机器学习算法分类
机器学习概述和定义
 概述
  机器学习是一门人工智能的科学,是近20多年
   兴起的一门多领域交叉学科,涉及概率论、统
   计学、算法复杂度理论等多门学科。
  机器学习主要关注于开发一些让计算机可以自
   动“学习”的技术,使得计算机具备和人类一
   样的学习能力。
      决策、推理、认知、识别等

      容错性,推广能力(举一反三)
机器学习概述和定义
 定义
  Arthur Samuel (1959). Machine
   Learning: Field of study that gives
   computers the ability to learn without
   being explicitly programmed.
  Tom Mitchell (1998) .A computer
   program is said to learn from
   experience E with respect to some task
   T and some performance measure P, if
   its performance on T, as measured by P,
   improves with experience E.
机器学习发展史
 机器学习的发展史
    发展过程大体上可分为4个时期。
      第一阶段是在50年代中叶到60年代中叶,属于热烈
       时期
      第二阶段是在60年代中叶至70年代中叶,被称为机
       器学习的冷静时期。
      第三阶段是从70年代中叶至80年代中叶,称为复兴
       时期。
      机器学习的最新阶段始于1986年。
机器学习发展史
 机器学习新阶段的重要表现
    相关理论知识逐渐完善。
      机器学习各种基础问题的统一性观点正在形成。

      结合各种学习方法,取长补短的多种形式的集成学
      习系统研究正在兴起。
    研究内容渗透到各个领域,在每个领域中都有
     重要的表现。
      应用例如搜索引擎、医学诊断、证券市场分析、
      DNA序列测序、语音和手写识别、战略游戏和机器
      人运用等
机器学习发展史
机器学习发展史
 机器学习新阶段的重要表现
    机器学习研究活跃
      机器学习已成为新的边缘学科并在高校形成一门课
       程。
      与机器学习有关的学术活动空前活跃。
       国际上除每年一次的机器学习研讨会外,还有计算机学习
        理论会议以及遗传算法会议。
       中国机器学习会议
机器学习发展史
 机器学习未来发展趋势
  发展和完善现有学习方法,同时开展新的学习
   方法的研究
  建立实用的学习系统,特别是开展多种学习方
   法协同工作的集成化系统的研究
  人类学习机制的研究
机器学习算法分类
 监督学习(Supervised   learning)
    对具有概念标记(分类)的训练样本进行学习,
     以尽可能对训练样本集外的数据进行标记(分
     类)预测。这里,所有的标记(分类)是已知
     的。因此,训练样本的岐义性低。
机器学习算法分类
 监督学习(Supervised      learning)
    回归(Regression)和分类(Classification)
      监督学习算法的输出如果是连续的,称为回归,如
      果是离散的,称为分类。
机器学习算法分类
 无监督学习(Unsupervised   learning)
    对没有概念标记(分类)的训练样本进行学习,
     以发现训练样本集中的结构性知识。这里,所
     有的标记(分类)是未知的。因此,训练样本
     的岐义性高。
机器学习算法分类
 无监督学习(Unsupervised   learning)
    聚类就是典型的无监督学习
机器学习算法分类
 无监督学习(Unsupervised                       learning)
    鸡尾酒会效应(COCKTAIL PARTY PROBLEM)




      [W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');
机器学习算法分类
 半监督学习(Semi-supervised   learning)
    利用标注样本和未标注样本进行训练和分类。自动
     地对未标记数据加以利用,学习在整个数据分布上
     具有强泛化能力的模型。整个学习过程无需人工干
     预,完全基于学习系统自身实现对未标记数据的利
     用。
机器学习算法分类
 强化学习(Reinforcement   learning)
    系统从环境到行为映射的学习,以使奖励信号
     (强化信号)函数值最大。即观察后,再采取行
     动。每一个动作,都会对环境产生影响,而后
     环境以奖励的形式提供反馈以便指导学习算法。
机器学习算法分类
 强化学习(Reinforcement   learning)
    在人工智能、机器人领域应用广泛。如:机器
     人、自动驾驶、无人飞机等
机器学习算法分类
 其他算法
  转导(Transduction):在训练集输入,训练
   集的输出和测试输入的基础上,试图预测新的
   输出
  学会学习(Learning to learn):学会自己
   的根据以往的经验归纳偏置 。
  ……
机器学习算法分类
 具体实现方法
    构造条件概率:回归分析和分类
      支持向量机

      人工神经网络

      决策树(Decision   tree)
      高斯过程回归

      线性判别分析

      最近邻居法

      感知器

      放射基函数
机器学习算法分类
 具体实现方法
    通过再生模型构造概率密度函数(Probability
     density function)
      最大期望算法(Expectation-maximization
       algorithm)
      graphical model:包括贝叶斯网络和Markov随
       机域
      Generative Topographic Mapping
机器学习算法分类
 具体实现方法
    近似推断技术
      马尔可夫链(Markov   chain) 蒙特卡罗方法
      变分法
应用实例
•   智能分类系统




•   非结构化信息抽取系统
智能分类系统
 支持向量机(Support   Vector Machine)
  1995年首先提出的,是一种监督式学习的方法,
   它广泛的应用于统计分类以及回归分析中
  支持向量机属于一般化线性分类器
      将向量映射到一个更高维的空间里,在这个空间里
      建立有一个最大间隔超平面
    SVM的关键在于核函数
      线性核函数  多项式核 径向基核(RBF)傅里叶核
       样条核 Sigmoid核函数
      核参数选择
智能分类系统
 学习的基本模型
    应用过程
            特征提取           支持向量机



原始数据    人工分析     训练样本   机器学习    模型
                                     离线过程

                                     在线过程
       决定性步骤              新数据
     尚无有效的理论指导

                                结果
智能分类系统
 样本准备
    数据准备
      保证每个分类下的都有样本数据

      样本数据尽可能的能代表该分类的信息

    特征与特征提取
      使用什么样的特征?如何计算?如何进行预处理?

      特征选择、降维
       并非所有特征都对学习有帮助,过多的特征会带来大量噪声
       消除特征之间的相关性,降低特征维数
智能分类系统
 样本选择
  正负样本数可能严重失衡(1:10,1:100)
  大样本数据导致训练时间指数级别增加

 训练算法
    算法选择
      Libsvm

    参数选择
      算法参数的选择直接决定了训练出的模型的优劣
智能分类系统
 算法验证
    文本分类系统常用的评估标准
      查准率(精度)
        判断的文档中与人工分类结果吻合的文档所占的比率,它
         体现了系统检索结果的准确程度


      查全率(召回率)
        人工分类结果应有的文档中与分类系统吻合的文档所占的
         比率,它体现了系统检索所有相关文档的完备性
智能分类系统
 算法验证
    文本分类系统常用的评估标准
      评估文档样本5千个
智能分类系统
 算法改进
    特征词提取




    主动学习方法,改进样本质量
非结构化信息抽取系统
 隐马尔可夫模型(Hidden        Markov Models)
    HMM,是统计模型,它用来描述一个含有隐含
     未知参数的马尔可夫过程。

    解决三个基本问题
      评估(Evaluation)

      解码( Decoding)
      学习(Learning)
非结构化信息抽取系统
非结构化信息抽取系统
学习资源
 学习建议
  感兴趣的方面,选择一种高级算法
  利用Matlab,WEKA工具

 学术资源
    Matlab
      http://www.mathworks.cn/

    Weka
      Data Mining (ML) software in Java
      http://www.cs.waikato.ac.nz/ml/weka/
学习资源
 学术资源
    Libsvm
     A  Library for Support Vector Machines
      http://www.csie.ntu.edu.tw/~cjlin/libsvm



    Lingpipe
      http://alias-i.com/lingpipe/
学习资源
 学术资源
    AAAI
      http://www.aaai.org/AITopics/html/machine
      .html
    MLC++
     A  library of C++ classes for supervised
       machine learning
      http://www.sgi.com/tech/mlc/

    斯坦福大学Machine Learning
      http://v.163.com/special/opencourse/machi
      nelearning.html
学习资源
 学术资源
   http://www.support-vector-
    machines.org/index.html
   http://archive.ics.uci.edu/ml/

   http://www.kernel-machines.org/

   http://mloss.org/software/

   http://www3.ntu.edu.sg/home/aswduch/

   http://www.chinakdd.com/
学习资源
 思考
  通过机器学习的介绍你能想到实际应用呢?
  机器人能超越人类吗?
Thanks

More Related Content

What's hot

時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?Fumihiko Takahashi
 
合成経路探索 -論文まとめ- (PFN中郷孝祐)
合成経路探索 -論文まとめ-  (PFN中郷孝祐)合成経路探索 -論文まとめ-  (PFN中郷孝祐)
合成経路探索 -論文まとめ- (PFN中郷孝祐)Preferred Networks
 
異常行動検出入門(改)
異常行動検出入門(改)異常行動検出入門(改)
異常行動検出入門(改)Yohei Sato
 
人工知能を用いた医用画像処理技術
人工知能を用いた医用画像処理技術人工知能を用いた医用画像処理技術
人工知能を用いた医用画像処理技術Yutaka KATAYAMA
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)cvpaper. challenge
 
機械学習の理論と実践
機械学習の理論と実践機械学習の理論と実践
機械学習の理論と実践Preferred Networks
 
機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルト機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルトBrainPad Inc.
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイARISE analytics
 
Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識Ken Morishita
 
Efficient Lifelong Learning with A-GEM ( ICLR 2019 読み会 in 京都 20190602)
Efficient Lifelong Learning with A-GEM ( ICLR 2019 読み会 in 京都 20190602)Efficient Lifelong Learning with A-GEM ( ICLR 2019 読み会 in 京都 20190602)
Efficient Lifelong Learning with A-GEM ( ICLR 2019 読み会 in 京都 20190602)YuMaruyama
 
Intro to Deep learning - Autoencoders
Intro to Deep learning - Autoencoders Intro to Deep learning - Autoencoders
Intro to Deep learning - Autoencoders Akash Goel
 
R実践 機械学習による異常検知 01
R実践 機械学習による異常検知 01R実践 機械学習による異常検知 01
R実践 機械学習による異常検知 01akira_11
 
Introduction to Deep learning
Introduction to Deep learningIntroduction to Deep learning
Introduction to Deep learningleopauly
 
ニューラルネットと深層学習の歴史
ニューラルネットと深層学習の歴史ニューラルネットと深層学習の歴史
ニューラルネットと深層学習の歴史Akinori Abe
 
CatBoost on GPU のひみつ
CatBoost on GPU のひみつCatBoost on GPU のひみつ
CatBoost on GPU のひみつTakuji Tahara
 
機械学習概論 講義テキスト
機械学習概論 講義テキスト機械学習概論 講義テキスト
機械学習概論 講義テキストEtsuji Nakai
 
[DL輪読会]マルチエージェント強化学習と⼼の理論 〜Hanabiゲームにおけるベイズ推論を⽤いたマルチエージェント 強化学習⼿法〜
[DL輪読会]マルチエージェント強化学習と⼼の理論 〜Hanabiゲームにおけるベイズ推論を⽤いたマルチエージェント 強化学習⼿法〜 [DL輪読会]マルチエージェント強化学習と⼼の理論 〜Hanabiゲームにおけるベイズ推論を⽤いたマルチエージェント 強化学習⼿法〜
[DL輪読会]マルチエージェント強化学習と⼼の理論 〜Hanabiゲームにおけるベイズ推論を⽤いたマルチエージェント 強化学習⼿法〜 Deep Learning JP
 

What's hot (20)

時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?時系列予測にTransformerを使うのは有効か?
時系列予測にTransformerを使うのは有効か?
 
合成経路探索 -論文まとめ- (PFN中郷孝祐)
合成経路探索 -論文まとめ-  (PFN中郷孝祐)合成経路探索 -論文まとめ-  (PFN中郷孝祐)
合成経路探索 -論文まとめ- (PFN中郷孝祐)
 
異常行動検出入門(改)
異常行動検出入門(改)異常行動検出入門(改)
異常行動検出入門(改)
 
Machine Learning
Machine LearningMachine Learning
Machine Learning
 
人工知能を用いた医用画像処理技術
人工知能を用いた医用画像処理技術人工知能を用いた医用画像処理技術
人工知能を用いた医用画像処理技術
 
自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)自己教師学習(Self-Supervised Learning)
自己教師学習(Self-Supervised Learning)
 
機械学習の理論と実践
機械学習の理論と実践機械学習の理論と実践
機械学習の理論と実践
 
機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルト機械学習システムのアーキテクチャアラカルト
機械学習システムのアーキテクチャアラカルト
 
World model
World modelWorld model
World model
 
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
 
Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識Pythonとdeep learningで手書き文字認識
Pythonとdeep learningで手書き文字認識
 
Efficient Lifelong Learning with A-GEM ( ICLR 2019 読み会 in 京都 20190602)
Efficient Lifelong Learning with A-GEM ( ICLR 2019 読み会 in 京都 20190602)Efficient Lifelong Learning with A-GEM ( ICLR 2019 読み会 in 京都 20190602)
Efficient Lifelong Learning with A-GEM ( ICLR 2019 読み会 in 京都 20190602)
 
Intro to Deep learning - Autoencoders
Intro to Deep learning - Autoencoders Intro to Deep learning - Autoencoders
Intro to Deep learning - Autoencoders
 
continual learning survey
continual learning surveycontinual learning survey
continual learning survey
 
R実践 機械学習による異常検知 01
R実践 機械学習による異常検知 01R実践 機械学習による異常検知 01
R実践 機械学習による異常検知 01
 
Introduction to Deep learning
Introduction to Deep learningIntroduction to Deep learning
Introduction to Deep learning
 
ニューラルネットと深層学習の歴史
ニューラルネットと深層学習の歴史ニューラルネットと深層学習の歴史
ニューラルネットと深層学習の歴史
 
CatBoost on GPU のひみつ
CatBoost on GPU のひみつCatBoost on GPU のひみつ
CatBoost on GPU のひみつ
 
機械学習概論 講義テキスト
機械学習概論 講義テキスト機械学習概論 講義テキスト
機械学習概論 講義テキスト
 
[DL輪読会]マルチエージェント強化学習と⼼の理論 〜Hanabiゲームにおけるベイズ推論を⽤いたマルチエージェント 強化学習⼿法〜
[DL輪読会]マルチエージェント強化学習と⼼の理論 〜Hanabiゲームにおけるベイズ推論を⽤いたマルチエージェント 強化学習⼿法〜 [DL輪読会]マルチエージェント強化学習と⼼の理論 〜Hanabiゲームにおけるベイズ推論を⽤いたマルチエージェント 強化学習⼿法〜
[DL輪読会]マルチエージェント強化学習と⼼の理論 〜Hanabiゲームにおけるベイズ推論を⽤いたマルチエージェント 強化学習⼿法〜
 

Viewers also liked

第一讲 机器学习概述
第一讲 机器学习概述第一讲 机器学习概述
第一讲 机器学习概述juzihua1102
 
第二讲 感知机与Svm
第二讲 感知机与Svm第二讲 感知机与Svm
第二讲 感知机与Svmjuzihua1102
 
第二讲 Python基礎
第二讲 Python基礎第二讲 Python基礎
第二讲 Python基礎juzihua1102
 
機器學習與資料探勘:決策樹
機器學習與資料探勘:決策樹機器學習與資料探勘:決策樹
機器學習與資料探勘:決策樹Xavier Yin
 
連淡水阿嬤都聽得懂的 機器學習入門 scikit-learn
連淡水阿嬤都聽得懂的機器學習入門 scikit-learn 連淡水阿嬤都聽得懂的機器學習入門 scikit-learn
連淡水阿嬤都聽得懂的 機器學習入門 scikit-learn Cicilia Lee
 
機器學習簡報 / 机器学习简报 Machine Learning
機器學習簡報 / 机器学习简报 Machine Learning 機器學習簡報 / 机器学习简报 Machine Learning
機器學習簡報 / 机器学习简报 Machine Learning Will Kuan 官大鈞
 
淺談深度學習
淺談深度學習淺談深度學習
淺談深度學習Mark Chang
 
[系列活動] Machine Learning 機器學習課程
[系列活動] Machine Learning 機器學習課程[系列活動] Machine Learning 機器學習課程
[系列活動] Machine Learning 機器學習課程台灣資料科學年會
 
Deep Learning Computer Build
Deep Learning Computer BuildDeep Learning Computer Build
Deep Learning Computer BuildPetteriTeikariPhD
 
Introduction to Machine Learning
Introduction to Machine LearningIntroduction to Machine Learning
Introduction to Machine LearningLior Rokach
 
[DSC 2016] 系列活動:李宏毅 / 一天搞懂深度學習
[DSC 2016] 系列活動:李宏毅 / 一天搞懂深度學習[DSC 2016] 系列活動:李宏毅 / 一天搞懂深度學習
[DSC 2016] 系列活動:李宏毅 / 一天搞懂深度學習台灣資料科學年會
 
Introduction to Big Data/Machine Learning
Introduction to Big Data/Machine LearningIntroduction to Big Data/Machine Learning
Introduction to Big Data/Machine LearningLars Marius Garshol
 

Viewers also liked (12)

第一讲 机器学习概述
第一讲 机器学习概述第一讲 机器学习概述
第一讲 机器学习概述
 
第二讲 感知机与Svm
第二讲 感知机与Svm第二讲 感知机与Svm
第二讲 感知机与Svm
 
第二讲 Python基礎
第二讲 Python基礎第二讲 Python基礎
第二讲 Python基礎
 
機器學習與資料探勘:決策樹
機器學習與資料探勘:決策樹機器學習與資料探勘:決策樹
機器學習與資料探勘:決策樹
 
連淡水阿嬤都聽得懂的 機器學習入門 scikit-learn
連淡水阿嬤都聽得懂的機器學習入門 scikit-learn 連淡水阿嬤都聽得懂的機器學習入門 scikit-learn
連淡水阿嬤都聽得懂的 機器學習入門 scikit-learn
 
機器學習簡報 / 机器学习简报 Machine Learning
機器學習簡報 / 机器学习简报 Machine Learning 機器學習簡報 / 机器学习简报 Machine Learning
機器學習簡報 / 机器学习简报 Machine Learning
 
淺談深度學習
淺談深度學習淺談深度學習
淺談深度學習
 
[系列活動] Machine Learning 機器學習課程
[系列活動] Machine Learning 機器學習課程[系列活動] Machine Learning 機器學習課程
[系列活動] Machine Learning 機器學習課程
 
Deep Learning Computer Build
Deep Learning Computer BuildDeep Learning Computer Build
Deep Learning Computer Build
 
Introduction to Machine Learning
Introduction to Machine LearningIntroduction to Machine Learning
Introduction to Machine Learning
 
[DSC 2016] 系列活動:李宏毅 / 一天搞懂深度學習
[DSC 2016] 系列活動:李宏毅 / 一天搞懂深度學習[DSC 2016] 系列活動:李宏毅 / 一天搞懂深度學習
[DSC 2016] 系列活動:李宏毅 / 一天搞懂深度學習
 
Introduction to Big Data/Machine Learning
Introduction to Big Data/Machine LearningIntroduction to Big Data/Machine Learning
Introduction to Big Data/Machine Learning
 

Similar to 机器学习

机器学习与深度学习简介.pdf
机器学习与深度学习简介.pdf机器学习与深度学习简介.pdf
机器学习与深度学习简介.pdfCyanny LIANG
 
Hands on data analysis 101
Hands on data analysis 101Hands on data analysis 101
Hands on data analysis 101FEG
 
Lab405ML01
Lab405ML01Lab405ML01
Lab405ML01ChenYo2
 
A brieft introduction of Neural Network
A brieft introduction of Neural NetworkA brieft introduction of Neural Network
A brieft introduction of Neural Networkskant
 
Matlab在系统辨识中的
Matlab在系统辨识中的Matlab在系统辨识中的
Matlab在系统辨识中的guest3e9a21
 
数据结构 总结与复习
数据结构 总结与复习数据结构 总结与复习
数据结构 总结与复习Wang Yizhe
 
信息系统开发平台OpenExpressApp
信息系统开发平台OpenExpressApp信息系统开发平台OpenExpressApp
信息系统开发平台OpenExpressAppzhoujg
 
ee2022-ist-xietao.pptx
ee2022-ist-xietao.pptxee2022-ist-xietao.pptx
ee2022-ist-xietao.pptxYuetang Deng
 
投影片
投影片投影片
投影片Jin Wei
 
教學研討會
教學研討會教學研討會
教學研討會Jin Wei
 
01 课程介绍与计算机系统概述
01 课程介绍与计算机系统概述01 课程介绍与计算机系统概述
01 课程介绍与计算机系统概述Huaijin Chen
 
Clustering
ClusteringClustering
Clusteringwwangmr
 
张韵偲毕业论文
张韵偲毕业论文张韵偲毕业论文
张韵偲毕业论文Yunsi Zhang
 
数据挖掘技术概述及前景展望
数据挖掘技术概述及前景展望数据挖掘技术概述及前景展望
数据挖掘技术概述及前景展望mysqlops
 
软件工程
软件工程软件工程
软件工程bill0077
 
Tensorflow Extended: 端至端機器學習框架: 從概念到實作 (Tensorflow Extended: An end-to-end ML...
Tensorflow Extended: 端至端機器學習框架: 從概念到實作 (Tensorflow Extended: An end-to-end ML...Tensorflow Extended: 端至端機器學習框架: 從概念到實作 (Tensorflow Extended: An end-to-end ML...
Tensorflow Extended: 端至端機器學習框架: 從概念到實作 (Tensorflow Extended: An end-to-end ML...Jian-Kai Wang
 
Mealionaire: A context-aware and ontology-based mobile recommender system for...
Mealionaire: A context-aware and ontology-based mobile recommender system for...Mealionaire: A context-aware and ontology-based mobile recommender system for...
Mealionaire: A context-aware and ontology-based mobile recommender system for...Carter Chen
 
硕士开题答辩 严一格-R4
硕士开题答辩 严一格-R4硕士开题答辩 严一格-R4
硕士开题答辩 严一格-R4严 一格
 

Similar to 机器学习 (20)

机器学习与深度学习简介.pdf
机器学习与深度学习简介.pdf机器学习与深度学习简介.pdf
机器学习与深度学习简介.pdf
 
Hands on data analysis 101
Hands on data analysis 101Hands on data analysis 101
Hands on data analysis 101
 
香港六合彩
香港六合彩香港六合彩
香港六合彩
 
Lab405ML01
Lab405ML01Lab405ML01
Lab405ML01
 
A brieft introduction of Neural Network
A brieft introduction of Neural NetworkA brieft introduction of Neural Network
A brieft introduction of Neural Network
 
Matlab在系统辨识中的
Matlab在系统辨识中的Matlab在系统辨识中的
Matlab在系统辨识中的
 
数据结构 总结与复习
数据结构 总结与复习数据结构 总结与复习
数据结构 总结与复习
 
信息系统开发平台OpenExpressApp
信息系统开发平台OpenExpressApp信息系统开发平台OpenExpressApp
信息系统开发平台OpenExpressApp
 
Dmresearch
DmresearchDmresearch
Dmresearch
 
ee2022-ist-xietao.pptx
ee2022-ist-xietao.pptxee2022-ist-xietao.pptx
ee2022-ist-xietao.pptx
 
投影片
投影片投影片
投影片
 
教學研討會
教學研討會教學研討會
教學研討會
 
01 课程介绍与计算机系统概述
01 课程介绍与计算机系统概述01 课程介绍与计算机系统概述
01 课程介绍与计算机系统概述
 
Clustering
ClusteringClustering
Clustering
 
张韵偲毕业论文
张韵偲毕业论文张韵偲毕业论文
张韵偲毕业论文
 
数据挖掘技术概述及前景展望
数据挖掘技术概述及前景展望数据挖掘技术概述及前景展望
数据挖掘技术概述及前景展望
 
软件工程
软件工程软件工程
软件工程
 
Tensorflow Extended: 端至端機器學習框架: 從概念到實作 (Tensorflow Extended: An end-to-end ML...
Tensorflow Extended: 端至端機器學習框架: 從概念到實作 (Tensorflow Extended: An end-to-end ML...Tensorflow Extended: 端至端機器學習框架: 從概念到實作 (Tensorflow Extended: An end-to-end ML...
Tensorflow Extended: 端至端機器學習框架: 從概念到實作 (Tensorflow Extended: An end-to-end ML...
 
Mealionaire: A context-aware and ontology-based mobile recommender system for...
Mealionaire: A context-aware and ontology-based mobile recommender system for...Mealionaire: A context-aware and ontology-based mobile recommender system for...
Mealionaire: A context-aware and ontology-based mobile recommender system for...
 
硕士开题答辩 严一格-R4
硕士开题答辩 严一格-R4硕士开题答辩 严一格-R4
硕士开题答辩 严一格-R4
 

机器学习

  • 1. 机器学习 • 基本知识 • 应用实例 • 学习资源 杨新勇 2012/06/14 Machine Learning seyo816@gmail.com http://www.lifeba.org
  • 2. 机器学习介绍 • 机器学习概述和定义 • 机器学习发展史 • 机器学习算法分类
  • 3. 机器学习概述和定义  概述  机器学习是一门人工智能的科学,是近20多年 兴起的一门多领域交叉学科,涉及概率论、统 计学、算法复杂度理论等多门学科。  机器学习主要关注于开发一些让计算机可以自 动“学习”的技术,使得计算机具备和人类一 样的学习能力。  决策、推理、认知、识别等  容错性,推广能力(举一反三)
  • 4. 机器学习概述和定义  定义  Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.  Tom Mitchell (1998) .A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
  • 5. 机器学习发展史  机器学习的发展史  发展过程大体上可分为4个时期。  第一阶段是在50年代中叶到60年代中叶,属于热烈 时期  第二阶段是在60年代中叶至70年代中叶,被称为机 器学习的冷静时期。  第三阶段是从70年代中叶至80年代中叶,称为复兴 时期。  机器学习的最新阶段始于1986年。
  • 6. 机器学习发展史  机器学习新阶段的重要表现  相关理论知识逐渐完善。  机器学习各种基础问题的统一性观点正在形成。  结合各种学习方法,取长补短的多种形式的集成学 习系统研究正在兴起。  研究内容渗透到各个领域,在每个领域中都有 重要的表现。  应用例如搜索引擎、医学诊断、证券市场分析、 DNA序列测序、语音和手写识别、战略游戏和机器 人运用等
  • 8. 机器学习发展史  机器学习新阶段的重要表现  机器学习研究活跃  机器学习已成为新的边缘学科并在高校形成一门课 程。  与机器学习有关的学术活动空前活跃。  国际上除每年一次的机器学习研讨会外,还有计算机学习 理论会议以及遗传算法会议。  中国机器学习会议
  • 9. 机器学习发展史  机器学习未来发展趋势  发展和完善现有学习方法,同时开展新的学习 方法的研究  建立实用的学习系统,特别是开展多种学习方 法协同工作的集成化系统的研究  人类学习机制的研究
  • 10. 机器学习算法分类  监督学习(Supervised learning)  对具有概念标记(分类)的训练样本进行学习, 以尽可能对训练样本集外的数据进行标记(分 类)预测。这里,所有的标记(分类)是已知 的。因此,训练样本的岐义性低。
  • 11. 机器学习算法分类  监督学习(Supervised learning)  回归(Regression)和分类(Classification)  监督学习算法的输出如果是连续的,称为回归,如 果是离散的,称为分类。
  • 12. 机器学习算法分类  无监督学习(Unsupervised learning)  对没有概念标记(分类)的训练样本进行学习, 以发现训练样本集中的结构性知识。这里,所 有的标记(分类)是未知的。因此,训练样本 的岐义性高。
  • 13. 机器学习算法分类  无监督学习(Unsupervised learning)  聚类就是典型的无监督学习
  • 14. 机器学习算法分类  无监督学习(Unsupervised learning)  鸡尾酒会效应(COCKTAIL PARTY PROBLEM) [W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');
  • 15. 机器学习算法分类  半监督学习(Semi-supervised learning)  利用标注样本和未标注样本进行训练和分类。自动 地对未标记数据加以利用,学习在整个数据分布上 具有强泛化能力的模型。整个学习过程无需人工干 预,完全基于学习系统自身实现对未标记数据的利 用。
  • 16. 机器学习算法分类  强化学习(Reinforcement learning)  系统从环境到行为映射的学习,以使奖励信号 (强化信号)函数值最大。即观察后,再采取行 动。每一个动作,都会对环境产生影响,而后 环境以奖励的形式提供反馈以便指导学习算法。
  • 17. 机器学习算法分类  强化学习(Reinforcement learning)  在人工智能、机器人领域应用广泛。如:机器 人、自动驾驶、无人飞机等
  • 18. 机器学习算法分类  其他算法  转导(Transduction):在训练集输入,训练 集的输出和测试输入的基础上,试图预测新的 输出  学会学习(Learning to learn):学会自己 的根据以往的经验归纳偏置 。  ……
  • 19. 机器学习算法分类  具体实现方法  构造条件概率:回归分析和分类  支持向量机  人工神经网络  决策树(Decision tree)  高斯过程回归  线性判别分析  最近邻居法  感知器  放射基函数
  • 20. 机器学习算法分类  具体实现方法  通过再生模型构造概率密度函数(Probability density function)  最大期望算法(Expectation-maximization algorithm)  graphical model:包括贝叶斯网络和Markov随 机域  Generative Topographic Mapping
  • 21. 机器学习算法分类  具体实现方法  近似推断技术  马尔可夫链(Markov chain) 蒙特卡罗方法  变分法
  • 22. 应用实例 • 智能分类系统 • 非结构化信息抽取系统
  • 23. 智能分类系统  支持向量机(Support Vector Machine)  1995年首先提出的,是一种监督式学习的方法, 它广泛的应用于统计分类以及回归分析中  支持向量机属于一般化线性分类器  将向量映射到一个更高维的空间里,在这个空间里 建立有一个最大间隔超平面  SVM的关键在于核函数  线性核函数 多项式核 径向基核(RBF)傅里叶核 样条核 Sigmoid核函数  核参数选择
  • 24. 智能分类系统  学习的基本模型  应用过程 特征提取 支持向量机 原始数据 人工分析 训练样本 机器学习 模型 离线过程 在线过程 决定性步骤 新数据 尚无有效的理论指导 结果
  • 25. 智能分类系统  样本准备  数据准备  保证每个分类下的都有样本数据  样本数据尽可能的能代表该分类的信息  特征与特征提取  使用什么样的特征?如何计算?如何进行预处理?  特征选择、降维  并非所有特征都对学习有帮助,过多的特征会带来大量噪声  消除特征之间的相关性,降低特征维数
  • 26. 智能分类系统  样本选择  正负样本数可能严重失衡(1:10,1:100)  大样本数据导致训练时间指数级别增加  训练算法  算法选择  Libsvm  参数选择  算法参数的选择直接决定了训练出的模型的优劣
  • 27. 智能分类系统  算法验证  文本分类系统常用的评估标准  查准率(精度)  判断的文档中与人工分类结果吻合的文档所占的比率,它 体现了系统检索结果的准确程度  查全率(召回率)  人工分类结果应有的文档中与分类系统吻合的文档所占的 比率,它体现了系统检索所有相关文档的完备性
  • 28. 智能分类系统  算法验证  文本分类系统常用的评估标准  评估文档样本5千个
  • 29. 智能分类系统  算法改进  特征词提取  主动学习方法,改进样本质量
  • 30. 非结构化信息抽取系统  隐马尔可夫模型(Hidden Markov Models)  HMM,是统计模型,它用来描述一个含有隐含 未知参数的马尔可夫过程。  解决三个基本问题  评估(Evaluation)  解码( Decoding)  学习(Learning)
  • 33. 学习资源  学习建议  感兴趣的方面,选择一种高级算法  利用Matlab,WEKA工具  学术资源  Matlab  http://www.mathworks.cn/  Weka  Data Mining (ML) software in Java  http://www.cs.waikato.ac.nz/ml/weka/
  • 34. 学习资源  学术资源  Libsvm A Library for Support Vector Machines  http://www.csie.ntu.edu.tw/~cjlin/libsvm  Lingpipe  http://alias-i.com/lingpipe/
  • 35. 学习资源  学术资源  AAAI  http://www.aaai.org/AITopics/html/machine .html  MLC++ A library of C++ classes for supervised machine learning  http://www.sgi.com/tech/mlc/  斯坦福大学Machine Learning  http://v.163.com/special/opencourse/machi nelearning.html
  • 36. 学习资源  学术资源  http://www.support-vector- machines.org/index.html  http://archive.ics.uci.edu/ml/  http://www.kernel-machines.org/  http://mloss.org/software/  http://www3.ntu.edu.sg/home/aswduch/  http://www.chinakdd.com/
  • 37. 学习资源  思考  通过机器学习的介绍你能想到实际应用呢?  机器人能超越人类吗?