SlideShare a Scribd company logo
1 of 27
http://www.ypppt.com/
面向超参数估计的贝叶斯优化算法研究
答辩人:李亚茹 学 号:221909252062
专 业:应用统计 时 间:2021.12.9
指导老师:张宇来
The Relationship Between Cell Phone Use and Academic Performance in Traditional Classroom: the
Mediating Role of Self-control
目 录
3 展望
2 研究内容
1 研究背景及意义
4 研究成果
研究背景及意义
人工智能发展迅速,使得机器学习模型和技术被广泛的应用。超参数对
模型的最终预测效果至关重要。而实践中对模型超参数的选择,常常用
人工的方式寻找最佳值,不仅成本高,而且最终确定的超参数可能不是
最优的。
贝叶斯优化算法的使用使得这个问题得到了缓解。
对面向超参数估计的贝叶斯优化算法研究的意义在于:
1.减少机器学习过程中人力的投入;
2.节约机器学习中计算资源的消耗;
3.提高机器学习模型的最终性能。
研究现状
对算法实施改进的研究
1、停止条件的确定
问题
2、初始化超参数的
选择问题
3、带约束的超参数
空间
对采集函数的研究
1、基于信息熵搜索
的采集函数
2、多采集函数的并
行与集成估计
3、采集函数最优值
的近似估计
对代理模型的研究
1、具有复合函数结
构的代理模型
2、具有线性可加结
构的代理模型
3、具有子空间结构
的代理模型
4、基于自适应代理
模型
研究内容
针对优化采集函数寻找待评估点时,计算
复杂的问题做研究
针对优化整数型超参数时,次优化以及
重复搜索的问题做研究
01
02
03 针对优化算法时间成本高的问题做研究
以往对贝叶斯优
化算法的研究中,
存在计算复杂度
高、次优化等问
题。
本文以降低计算
复杂度,避免次
优化问题为目的,
对贝叶斯优化算
法在超参数优化
领域的应用进行
研究。
01 采集函数优化
问题分析
问题
在现有的贝叶斯优化算法
中,基于梯度下降的方法
涉及到大量矩阵计算,计
算过程复杂且需要大量的
内存资源。
策略
引入粒子群优化算法,提出
BO-PSO算法。
在不同的数据集上,用BO-
PSO方法对三个常用模型的
超参数进行选择,并且与基
于梯度下降的另外两种贝叶
斯优化算法作比较,验证算
法有效性。
BO-PSO算法框架
实验对比结果
超参数信息(RF)
Accuracy值比较(10次预测效果平均结果)
模型
训练
超
参
数
预
测
效
果
数据
Digits
实验对比结果
超参数信息(XGBoost)
Accuracy值比较
模型
训练
超
参
数
预
测
效
果
数据
Digits
实验对比结果
超参数信息(AdaBoost)
R2值比较
模型
训练
超
参
数
预
测
效
果
数据
Boston
Housing
02 整数型超参数优化
问题分析
问题
当超参数为整数时,现有的
贝叶斯优化方法可能会造成
采集函数最值点与实际评估
点不匹配,形成次优化问题,
甚至会造成重复评估。
策略
在将变量输入高斯过程协
方差函数前,先做取整变
换,再输入核函数,提出
IBO-PSO算法。
在 深 度 学 习 模 型 上 , 用
IBO-PSO方法优化模型的整
数型超参数,通过实例验
证算法的可靠性。
开始
随机初始化
输出结果:(x*,y*)
构建代理模型:
对于整数型变量,先做
I(x)变换,再输入核函数
是否初始化
是
否
否
训练
是
是否满足停止条件
最大化采集函数,
获得评估点(x,y)
IBO-PSO流程图
IBO-PSO算法
1 2 3 4
0
1 2 3 4
0
GPs
采集函数
(b)
(a)
GPs
采集函数
IBO-PSO效果图
粉色区域为置信区间,黑色实线为目标
值。从图(a)可以看出,在相同的输入
区间,目标函数值是一个常数,并且不
确定性也是相同的。
从图(a)到图(b)的变化可以看出,
在每个区间做一次搜索后,该区间的函
数不确定性趋于0,之后不会再在该区域
重复无效的寻优。
实验数据处理
华东某地区一年的电力负荷时间序列数据集作为实验数据。
数据趋势图 数据自相关图
实验数据处理
数据差分后趋势图
白噪声检验
实验对比结果
NMSE值和NMDSE值对比(RNN)
R2值对比(RNN)
实验对比结果
NMSE值和NMDSE值对比(LSTM)
R2值对比(LSTM)
实验对比结果
RNN模型拟合效果 LSTM模型拟合效果
03 算法并行
问题分析
问题
在优化过程中,目标函数的每次评
估都需要训练模型,模型的训练可
能需要数天,甚至数周的时间,深
度学习训练过程更为复杂,训练很
耗时。
策略
利用当前计算机多核处理的特性,
通过对超参数搜索空间进行切分的
方式,改进IBO-PSO算法。
在深度学习模型上,利用并行的
IBO-PSO方法对模型的超参数进行优
化。通过对比算法运行的时间和最
终优化结果,验证算法的效率。
算法并行框架
1
4
3
2
5
8
7
6
C1
C2
C3
C4
子区域1
子区域2
子区域k
...
代理模型1
...
代理模型2
代理模型k
采集函数2
采集函数k
采集函数1
...
目标函数
后验概率
更新
同步并行示意图
算法并行
IBO-PSO算法并行结构
实验对比结果
运行时间对比(LSTM模型) NMSE值对比(LSTM模型)
展望
贝叶斯优化算法依旧还面临众多挑战,包括高维度扩展、多任务
扩展、并行化扩展等等。对于这些问题,计划在之后的工作中进
行探索研究。
研究成果
1. 李亚茹,张宇来,王佳晨.面向超参数估计的贝叶斯优化方法综述.计算机科
学 。(中文核心)------与论文第一章内容相关
2. Yaru Li, Yulai Zhang, Gongxue Zhou and Yifei Gong, “Bayesian Optimization
with Particle Swarm,” 2021 International Joint Conference on Neural
Networks (IJCNN), 2021.(CCF-C)------与论文第三章内容相关
3. Yaru Li, Yulai Zhang and Yongping Cai. “A New Hyper-Parameter
Optimization Method for Power Load Forecast Based on Recurrent Neural
Networks.” Algorithms ,2021.(EI) ------与论文第四章内容相关
4. Zhou G X, Ma W F, Gong Y F, Wang L D, Li Y R, Zhang Y L. “Nested Causality
Extraction on Traffic Accident Texts as Question Answering”,NLPCC
2021.(CCF-C)
感 谢 老 师 的 指 导

More Related Content

Featured

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

science.pptx

Editor's Notes

  1. 我将从4个方面进行我的陈述
  2. 通过查阅国内外对贝叶斯优化算法研究的文献, 依据研究方向的不同,我将当前对贝叶斯优化算法的研究分为三大类,分别为 并且对每个类型进行了进一步的细分
  3. 针对这一问题,本文采取的策略是
  4. 主要的改进就是通过PSO算法最大化采集函数,寻找下一个评估点。
  5. 接下来是对算法有效性的验证 首先是基于三种优化方法进行RF模型的训练。 第一个表格是要优化的超参数信息,实验数据是手写数字,用基于5折交叉验证的Accuracy值做评价指标 实验均重复训练模型10次,最终对比十次预测效果的平均结果, 红色框内是基于BO-PSO算法确定的模型预测效果,可以看出指标值是最优的。
  6. 然后是基于三种优化方法进行XGBoost模型的训练, 实验数据还是手写数字,实验设定以及评价指标与上一个实验一样, 表格中红色虚线框内,是十次预测效果的平均结果,可以看出,基于BO-PSO的模型预测效果,优于其它两种对比方法
  7. 最后是基于三种优化方法进行AdaBoost模型训练, 实验数据是波士顿房价,选用拟合优度值做评价指标 同样进行10次实验,通过比较模型预测平均指标值,红色框内,基于BO-PSO算法的模型预测效果是最优的
  8. 针对这一问题,本文采取的策略是
  9. 接下来验证算法的有效性, 本小节实验用的是时序数据,开始模型训练前,先对数据进行分析处理。 首先结合数据趋势图和假设检验,发现数据非平稳
  10. 对数据做差分处理,使其平稳 然后对平稳数据做白噪声检验,得出结果是非白噪声 说明数据有待提取的信息,值得进一步挖掘
  11. 首先,基于三种超参数优化方法训练RNN模型, 用标准均方误差、标准中位误差、拟合优度值做评价指标 分别进行10次模型训练,比较十次模型预测效果的平均值, 图中红色箭头、表中红色框标出的,都是基于IBO-PSO算法确定的模型预测效果 对比可以看出,模型效果好于其它模型。
  12. 对LSTM模型在同样的设定下训练, 用同样的三个指标做对比 从对比结果可以看出,基于IBO-PSO算法确定的模型效果好于其它模型。
  13. 基于IBO-PSO算法确定的RNN模型和LSTM模型后,对真实值的拟合效果 从图中可以看出,真实值和预测值基本重合,说明模型效果很好。
  14. 对于这一问题,本文采取的策略是
  15. 首先将搜索区域划分为k个子区域,然后k个IBO-PSO算法进程同时运行
  16. 本文选择同步并行的方式,左边的图为示意图 浅蓝色的条表示当前迭代中每个优化进程完成的时间, 深蓝色的条表示当前迭代中完成优化后等待同批次最后一个优化进程完成的时间。 右图为并行算法子区域划分的结构图。
  17. 接下来通过实验验证算法的有效性 首先将LSTM模型的超参数区域平均划分为4个子区域。 然后,基于单进程IBO-PSO算法和四进程IBO-PSO算法训练LSTM模型, 用10次实验运行的平均时间比值和模型预测标准均方误差做评价指标。 从红色虚线框内可以看出,单进程和四进程运行时间比值大于一, 说明4进程运行时间效率至少提升了一倍以上。 以上就是我的所有研究内容。
  18. 接下来是我的展望
  19. 最后是我的研究成果