For the EFL teachers' training in China.
thanks for Andy's presentation version in English. the Chinese version translated by John Wu, from Shaoguan, China
johnwuchina@gmail.com
For the EFL teachers' training in China.
thanks for Andy's presentation version in English. the Chinese version translated by John Wu, from Shaoguan, China
johnwuchina@gmail.com
3. 3
我们面对的网络结构……
AI
OSS
EMS
Orche-
strator BSS ...
Cloud OS
Server Switch
Operation Center
Storage
CloudAIR
RAN(D
U/CU)
BBU
X-Haul
X-Haul
Swtich
Swtich
Mobile Connection
Enterprise Connection
Home Connection
Agile Controler
MxU
ONT
PremiumHomeBroadband
Core Network
CPE
OLT
SW
WDM
BRAS/PE
WDM
WDM
DCI&CloudOptix
Backbone
WDM
P Router P RouterAI
Network
Cloud
Engine
RAN vBNG Core
(CU) …
5G
CP/UP
APPs
...
Cloud OS
Server Switch Storage
AI
Video
IoT
…
Network
Cloud
Engine
IMS
MME Core
…
5G
(CP)
APPs
...
Cloud OS
Server Switch Storage
AI
RAN 5G Core APPs
(CU) (UP) ...
Cloud OS
Server Switch Storage
AI SD-WAN Agile Private Line
Cloud-based
BNG
CloudAIR
CloudCampus
CloudFAN
(Joint Innovation)
CloudEdge/CloudCore
NFVI CloudFabric
Aggregation
&Metro
Campus
Swtich
Orchestrator &
MANO
CloudRAN
(Joint Innovation)
Metro as a
Fabric (Joint
Innovation)
CloudBackbone
AP
AP
Edge Network Cloud
5. 5
业界的解决方案:AIOps
Source:Gartner Report
IT Operations Analytics Must Be Placed Withinan AIOps
Context.
通过AI增强IT运维能力
利用大数据、机器学习和其他分析技
术,通过预防预测、个性化和动态分
析,直接和间接增强IT业务的相关技术
能力,实现所维护产品或服务的更高
质量、合理成本及高效支撑。
AIOps:Algorithmic IT
Operations
算法替代人为规则
侧重算法,强调学件
Metis 智能运维学件平台
无人运维
基于AIOps的无人运维
侧重于通过AI服务于运维目标
Monitoring
(Observe)
Service Desk
(Engage)
Automation
(Act)
应用服务监控
Big Data
Business Value
7. 7
AI使能的网络自动驾驶……
…
Analytics
function
Intelligence
function
Automation
function
云上智能
Applications in the cloud
边缘智能
Smart sensors and data collection
with real-time awareness
本地智能
Low latency control loops (TTI < 0.5ms)
Massive live streaming data
(200GB/day/site)
Full mobile network data and status,
all-scenarioautomation
Control & management
convergence
智能服务
Cross-domain and global
experience
智能边缘
Embedded AI
capabilities
云上智能 推理 模型训练
本地智能
边缘智能
意图引擎
自动化引擎
智能引擎
分析引擎
智能引擎
分析引擎自动化引擎
MR
data
RU
location
SLA
data
KPI
data
Hardware
status
Network
load
10. 10
精准告警:告警数量减少95.9%,准确率97.2%
告警的可压缩的种类包括:闪断/震荡类冗余告警,已知关联衍生告警抑制、外部共因告警抑制和未知告警,不同类型采用不同算法。
实现某运营商95.9%告警压缩率
无需调优
需要调优
频闪振荡探测
规则应用
Alarms
Rules
关键点:
• “频闪、振荡探
测”机制自动甄
别是否需要调优
• 月度老化重新计
算,自我更新
告警序列切分
对象种类分隔
动态算法主流程
时间关联矩
阵
对象关联抑
制矩阵结束
效果验证
时域合并
拐点拟合
时间和对象关联矩阵
1 2 3 … 30
ALM1 435 546 578 … 643
ALM2 528 634 697 … 724
ALM3 261 325 365 … 471
ALM4 142 267 375 … 794
时域合并拐点拟合
对象种类分隔
告警序列切分
告警1 告警2 相关度
A B 0.7
B C 0.98
B D 0.82
关键算法:基于频繁项挖掘的告警相关性挖掘
关键算法:基于随机森林的告警根因挖掘
A CA B C C B D
相关不相关
Time window
*颜色相同代表有公共参数
运行系统
硬件系统
信令系统
D
A B
C
CellRRU
Board
基于已知告警关系推断对象类型关系和告警类型关系,进一步利用随机森
林得到告警之间的根因关系
告警类型X dataset
N1 features N2 features N3 features N4 features
TREE #1 TREE #2 TREE #3 TREE #4
CLASS C CLASS D CLASS B CLASS C
MAJORITY VOTING
FINAL CLASS
基于时序动态自适应技术 基于频繁项挖掘和随机森林的告警根因诊断
MAJORITY VOTING
FINAL CLASS