野⽥ 真
デベロッパーリレーションズ/エバンジェリスト (Telco AI & 5G/B5G)
テレコムのビッグデータ解析 & AIサイバーセキュリティ
2
テレコムのビッグデータ解析
3
WIRELESS NETWORK OPERATIONS USE CASES
テレコム事業者のネットワーク解析
ワイヤレスネットワークのユースケース
ワイヤレス インフラの
リアルタイム可⽤性確認
デバイス
障害検出
ユーザーの動向
ヒートマップ
⾃然災害などによる
影響の可視化
不正デバイス
アクセスポイント発⾒
トランスポート レイヤーとの間での
各種メトリックの相関分析
RANの最適化
*セル/ハンドオーバー
ネットワーク状況の予測
4
APACHE SPARK
16,000 以上の企業の数⼗万のデータサイエンティストが⽤いるデファクト ツール
Hadoop での処理と⽐較し 100 倍以上の⾼速化も可能
250 以上の企業から 1,000 を超えるコントリビューター
分散/スケールアウト型のデータ処理を実⾏するリーディング フレームワーク
2020
2010
2000
データ処理要求
5
SPARK の活⽤
消費者向けインターネット ⾦融サービス テレコム 公共・政府
レコメンデーション
広告分析
視聴者の区分
不正⾏為の検知
リスク分析
ポートフォリオ管理
ネットワーク品質向上
ユーザー エクスペリエンス改善
IoT 分析
脅威の検知
各種解析
多くの業界のデータ解析で⽤いられ、テレコムでも広く使われる
6
SPARK の進化
前処理 トレーニング
ストレージ
CPU Powered Cluster GPU Powered Cluster
データ
ソース
Spark 2.x Spark 3.0
データ
ソース
Spark
XGBoost | TensorFlow
| PyTorch
GPU Powered Cluster
前処理 トレーニング
Spark
XGBoost | TensorFlow
| PyTorch
Spark オーケストレーション Spark オーケストレーション
• データの前処理からトレーニングまで、
1 パイプラインで実⾏可能に
• 前処理も GPU で⾼速化が可能に
• インフラが統⼀、簡素化
Spark 3.0 の特⻑
7
SPARK 3.0におけるNVIDIAの⾰新
Spark 3.0向けRAPIDS アクセラレータ
SQLおよびDataFrame操作をインターセプトして⾼速化し、
ETLパフォーマンスを⼤幅に向上
Spark コンポーネントの変更
Catalystのクエリ オプティマイザで列挙型処理をサポート
Sparkプロセス間のデータ転送を最適化するSpark の
Shuffleの実装
SparkにおけるGPUを利⽤したスケジューリング
Spark 3.0は、GPUによって加速化されたワークロードを、必
要なGPUリソースを含むサーバーに直接配置する
Sparkスタンドアロン、YARN、Kubernetesクラスタ
コードを変更せずにデータ サイエンス パイプラインを⾼速化
エンドツーエンド APACHE SPARK 3.0 パイプライン
⾼速化した ML/DL フレームワーク
RAPIDS
⾼速化したAPACHE SPARK コンポーネント
分散型、スケールアウト型のデータサイエンスとAIアプリケーション
Spark SQL XGBoost TensorFlow
PyTorch
DataFrames
Apache Spark 向けRAPIDSアクセラレータ
GPU アクセラレーテッド インフラストラクチャ
Horovod
8
SPARK ⾼速化の為の RAPIDS ACCELERATOR
UCX Libraries
RAPIDS libcudf
(C++ Libraries)
CUDA
JNI bindings
Mapping From Java/Scala to C++
RAPIDS Accelerator
for Spark
DISTRIBUTED SCALE-OUT SPARK APPLICATIONS
Spark SQL API Spark Shuffle
DataFrame API
if gpu_enabled(operation, data_type)
call-out to RAPIDS
else
execute standard Spark operation
JNI bindings
Mapping From Java/Scala to C++
●Custom Implementation of Spark
Shuffle
●Optimized to use RDMA and GPU-
to-GPU direct communication
APACHE SPARK CORE
RAPIDS –データ分析およびマシンラーニングを GPU ⾼速化する為のオープンソース
https://developer.nvidia.com/rapids
9
GTC21: Deep-Learning Data-Pipeline Optimization for Network Data Analysis in
SK Telecom by Employing Spark Rapids for Custom Data Source
https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s31400/
ユースケース
10
GTC21: Deep-Learning Data-Pipeline Optimization for Network Data Analysis in
SK Telecom by Employing Spark Rapids for Custom Data Source
https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s31400/
ユースケース
11
8X
better
ネットワーク品質解析
検索パフォーマンス
4.5X
better
リアルタイム
不動⼈⼝予測 (DL)
GPU によるネットワーク解析導⼊後のパフォーマンス
より少ないコンピューティング リソースで、⾼速な解析を実現し、タイムリーなネットワーク可視化と最適化が可能に
GTC21: Deep-Learning Data-Pipeline Optimization for Network Data Analysis in
SK Telecom by Employing Spark Rapids for Custom Data Source
https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s31400/
ユースケース
12
テレコムのAIサイバーセキュリティ
13
現代のテレコム網には境界線がない
マイクロサービス イーストウエスト トラフィック
(セントラルDC内、エッジ間)
不確定なへトロ環境
(ハイブリッド、NR-Unlicensed)
ゼロトラスト セキュリティが必須
14
NVIDIA MORPHEUS 概要
最適化された AI パイプラインと学習済み AI 機能により、
テレコム データセンター ファブリック全体の IP トラフィックを
リアルタイムで瞬時に分析 NVIDIA MORPHEUS
データ 推論 ポストプロセス フィードバック
確認
EGX スタック
(アーリーアクセス中)
15
Triton
サイバーログ
アクセラレー
ション
RAPIDS Tensor RT
Pub/Sub
リアルタイム テレメトリ
セキュリティ ポリシー
EGX スタック
DOCA テレメトリ
DOCA フロー ポリシー エンジン
センサー側
ペナルティフリーの可視化
マイクロセグメント化されたセキュリティ
オーケストレーション側
⾃動化されたリアルタイムの脅威の
検知と対応
前処理 推論
アクション
形成
ポスト
プロセス
MORPHEUS AI フレームワーク DPU
*NVIDIA BlueFieldなど
MORPHEUS AI サイバーセキュリティ SDK
サイバーエコシステムに向けたオープン AI フレームワーク
NVIDIA 認証サーバー
16
⽇本語字幕付きのデモビデオ
https://www.youtube.com/watch?v=9figuE_LJPo
17
MORPHEUS にパッケージされる AI モデル
モデル名 アプリケーション 提供時期
Leaked Sensitive Data 漏洩した認証情報、キー、パスワード、クレジットカード番号、銀⾏⼝座番号などを検索し、分類
提供中
Anomalous Behavioral Profiling
69% の企業が、悪意ある DNS トラフィックやコンピューティング リソースの吸い上げを引き起こすクリプト マイニング マルウェアを
経験。このモデルで調整可能な⾏動プロファイルの1つ
Phishing Detection メールのペイロードを解析し、スパムやフィッシングを検知
近⽇中に
提供開始予定
Predictive Maintenance 既存のルールではフラグが⽴たないようなサーバーログのエラーを、NLPの⼿法を⽤いて特定
Network Mapping リアルタイムのネットワーク グラフで変化を分析 - 複雑な設定ミスや動作の異常を特定するために使⽤
Asset Classification ネットワーク上のアセットをどのように利⽤しているかに応じて分類
Domain Generating Algorithm
Detection (DGA)
軽量 (リアルタイム) での DGA 検知を⾏うことができるモデル
Generic Lightweight Online
Detection of Anomalies (LODA)
LODA は、多くの異なるテレメトリ ストリームに展開され、異常を監視。逐次データ(時系列を含む)にも対応
18
https://ai.googleblog.com/2018/11/open-sourcing-bert-state-
of-art-pre.html
GTC21: Morpheus: AI Inferencing for Cybersecurity Pipelines
https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s33291/
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
https://arxiv.org/abs/1810.04805
最先端の⾃然⾔語処理 をサイバーセキュリティのログ分析に応⽤
19
GTC21: Morpheus: AI Inferencing for Cybersecurity Pipelines
https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s33291/
CLOUDFLARE WORKERS を MORPHEUS で強化
ユースケース
20
AWS DEVKIT (P0)
EGX スタック
CLX/
Streamz
Triton
Tensor
RT
RAPIDS
前処理 推論
ポスト プロセ
ス/ 検証
アクション
形成
Pub
/
Sub
(Kafka)
Streamz MLFlow
クラウドやその他のソース
NVIDIA Morpheus 開発キットのリリース
⾃動化されたリアルタイムの脅威の検出と対応
MORPHEUS AI フレームワーク
AWS G4 インスタンス (GPU)
アーリーアクセス中、詳細はこちらをご参照下さい。 -> https://developer.nvidia.com/morpheus-early-access
テレコムのビッグデータ解析 & AI サイバーセキュリティ

テレコムのビッグデータ解析 & AI サイバーセキュリティ

  • 1.
    野⽥ 真 デベロッパーリレーションズ/エバンジェリスト (TelcoAI & 5G/B5G) テレコムのビッグデータ解析 & AIサイバーセキュリティ
  • 2.
  • 3.
    3 WIRELESS NETWORK OPERATIONSUSE CASES テレコム事業者のネットワーク解析 ワイヤレスネットワークのユースケース ワイヤレス インフラの リアルタイム可⽤性確認 デバイス 障害検出 ユーザーの動向 ヒートマップ ⾃然災害などによる 影響の可視化 不正デバイス アクセスポイント発⾒ トランスポート レイヤーとの間での 各種メトリックの相関分析 RANの最適化 *セル/ハンドオーバー ネットワーク状況の予測
  • 4.
    4 APACHE SPARK 16,000 以上の企業の数⼗万のデータサイエンティストが⽤いるデファクトツール Hadoop での処理と⽐較し 100 倍以上の⾼速化も可能 250 以上の企業から 1,000 を超えるコントリビューター 分散/スケールアウト型のデータ処理を実⾏するリーディング フレームワーク 2020 2010 2000 データ処理要求
  • 5.
    5 SPARK の活⽤ 消費者向けインターネット ⾦融サービステレコム 公共・政府 レコメンデーション 広告分析 視聴者の区分 不正⾏為の検知 リスク分析 ポートフォリオ管理 ネットワーク品質向上 ユーザー エクスペリエンス改善 IoT 分析 脅威の検知 各種解析 多くの業界のデータ解析で⽤いられ、テレコムでも広く使われる
  • 6.
    6 SPARK の進化 前処理 トレーニング ストレージ CPUPowered Cluster GPU Powered Cluster データ ソース Spark 2.x Spark 3.0 データ ソース Spark XGBoost | TensorFlow | PyTorch GPU Powered Cluster 前処理 トレーニング Spark XGBoost | TensorFlow | PyTorch Spark オーケストレーション Spark オーケストレーション • データの前処理からトレーニングまで、 1 パイプラインで実⾏可能に • 前処理も GPU で⾼速化が可能に • インフラが統⼀、簡素化 Spark 3.0 の特⻑
  • 7.
    7 SPARK 3.0におけるNVIDIAの⾰新 Spark 3.0向けRAPIDSアクセラレータ SQLおよびDataFrame操作をインターセプトして⾼速化し、 ETLパフォーマンスを⼤幅に向上 Spark コンポーネントの変更 Catalystのクエリ オプティマイザで列挙型処理をサポート Sparkプロセス間のデータ転送を最適化するSpark の Shuffleの実装 SparkにおけるGPUを利⽤したスケジューリング Spark 3.0は、GPUによって加速化されたワークロードを、必 要なGPUリソースを含むサーバーに直接配置する Sparkスタンドアロン、YARN、Kubernetesクラスタ コードを変更せずにデータ サイエンス パイプラインを⾼速化 エンドツーエンド APACHE SPARK 3.0 パイプライン ⾼速化した ML/DL フレームワーク RAPIDS ⾼速化したAPACHE SPARK コンポーネント 分散型、スケールアウト型のデータサイエンスとAIアプリケーション Spark SQL XGBoost TensorFlow PyTorch DataFrames Apache Spark 向けRAPIDSアクセラレータ GPU アクセラレーテッド インフラストラクチャ Horovod
  • 8.
    8 SPARK ⾼速化の為の RAPIDSACCELERATOR UCX Libraries RAPIDS libcudf (C++ Libraries) CUDA JNI bindings Mapping From Java/Scala to C++ RAPIDS Accelerator for Spark DISTRIBUTED SCALE-OUT SPARK APPLICATIONS Spark SQL API Spark Shuffle DataFrame API if gpu_enabled(operation, data_type) call-out to RAPIDS else execute standard Spark operation JNI bindings Mapping From Java/Scala to C++ ●Custom Implementation of Spark Shuffle ●Optimized to use RDMA and GPU- to-GPU direct communication APACHE SPARK CORE RAPIDS –データ分析およびマシンラーニングを GPU ⾼速化する為のオープンソース https://developer.nvidia.com/rapids
  • 9.
    9 GTC21: Deep-Learning Data-PipelineOptimization for Network Data Analysis in SK Telecom by Employing Spark Rapids for Custom Data Source https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s31400/ ユースケース
  • 10.
    10 GTC21: Deep-Learning Data-PipelineOptimization for Network Data Analysis in SK Telecom by Employing Spark Rapids for Custom Data Source https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s31400/ ユースケース
  • 11.
    11 8X better ネットワーク品質解析 検索パフォーマンス 4.5X better リアルタイム 不動⼈⼝予測 (DL) GPU によるネットワーク解析導⼊後のパフォーマンス より少ないコンピューティングリソースで、⾼速な解析を実現し、タイムリーなネットワーク可視化と最適化が可能に GTC21: Deep-Learning Data-Pipeline Optimization for Network Data Analysis in SK Telecom by Employing Spark Rapids for Custom Data Source https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s31400/ ユースケース
  • 12.
  • 13.
  • 14.
    14 NVIDIA MORPHEUS 概要 最適化されたAI パイプラインと学習済み AI 機能により、 テレコム データセンター ファブリック全体の IP トラフィックを リアルタイムで瞬時に分析 NVIDIA MORPHEUS データ 推論 ポストプロセス フィードバック 確認 EGX スタック (アーリーアクセス中)
  • 15.
    15 Triton サイバーログ アクセラレー ション RAPIDS Tensor RT Pub/Sub リアルタイムテレメトリ セキュリティ ポリシー EGX スタック DOCA テレメトリ DOCA フロー ポリシー エンジン センサー側 ペナルティフリーの可視化 マイクロセグメント化されたセキュリティ オーケストレーション側 ⾃動化されたリアルタイムの脅威の 検知と対応 前処理 推論 アクション 形成 ポスト プロセス MORPHEUS AI フレームワーク DPU *NVIDIA BlueFieldなど MORPHEUS AI サイバーセキュリティ SDK サイバーエコシステムに向けたオープン AI フレームワーク NVIDIA 認証サーバー
  • 16.
  • 17.
    17 MORPHEUS にパッケージされる AIモデル モデル名 アプリケーション 提供時期 Leaked Sensitive Data 漏洩した認証情報、キー、パスワード、クレジットカード番号、銀⾏⼝座番号などを検索し、分類 提供中 Anomalous Behavioral Profiling 69% の企業が、悪意ある DNS トラフィックやコンピューティング リソースの吸い上げを引き起こすクリプト マイニング マルウェアを 経験。このモデルで調整可能な⾏動プロファイルの1つ Phishing Detection メールのペイロードを解析し、スパムやフィッシングを検知 近⽇中に 提供開始予定 Predictive Maintenance 既存のルールではフラグが⽴たないようなサーバーログのエラーを、NLPの⼿法を⽤いて特定 Network Mapping リアルタイムのネットワーク グラフで変化を分析 - 複雑な設定ミスや動作の異常を特定するために使⽤ Asset Classification ネットワーク上のアセットをどのように利⽤しているかに応じて分類 Domain Generating Algorithm Detection (DGA) 軽量 (リアルタイム) での DGA 検知を⾏うことができるモデル Generic Lightweight Online Detection of Anomalies (LODA) LODA は、多くの異なるテレメトリ ストリームに展開され、異常を監視。逐次データ(時系列を含む)にも対応
  • 18.
    18 https://ai.googleblog.com/2018/11/open-sourcing-bert-state- of-art-pre.html GTC21: Morpheus: AIInferencing for Cybersecurity Pipelines https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s33291/ BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding https://arxiv.org/abs/1810.04805 最先端の⾃然⾔語処理 をサイバーセキュリティのログ分析に応⽤
  • 19.
    19 GTC21: Morpheus: AIInferencing for Cybersecurity Pipelines https://www.nvidia.com/en-us/on-demand/session/gtcspring21-s33291/ CLOUDFLARE WORKERS を MORPHEUS で強化 ユースケース
  • 20.
    20 AWS DEVKIT (P0) EGXスタック CLX/ Streamz Triton Tensor RT RAPIDS 前処理 推論 ポスト プロセ ス/ 検証 アクション 形成 Pub / Sub (Kafka) Streamz MLFlow クラウドやその他のソース NVIDIA Morpheus 開発キットのリリース ⾃動化されたリアルタイムの脅威の検出と対応 MORPHEUS AI フレームワーク AWS G4 インスタンス (GPU) アーリーアクセス中、詳細はこちらをご参照下さい。 -> https://developer.nvidia.com/morpheus-early-access