Development of Software for scalable anomaly detection modeling of time-series data using Apache Spark.
私たちはこれまで、様々な機器類を監視するセンサーの時系列データを分析し、異常を検知する手法およびソフトウェアの研究開発を行ってきた。
今回紹介するソフトウェアでは、バッチ処理で複数のセンサーから得られた高次元の時系列データから線形のLASSO回帰により学習、モデル化し、異常時を識別する。
しかし学習時間やメモリー使用量の増大が課題になってきたため、Sparkを活用し並列分散化を行った。
SparkにはMLlibという汎用的な機械学習ライブラリが存在するが、今回は使用するアルゴリズムの特殊性を考慮し、既存実装を基に新規に開発した。
本講演では当開発におけるデザインチョイスや性能計測結果について報告する。
a
Development of Software for scalable anomaly detection modeling of time-series data using Apache Spark.
私たちはこれまで、様々な機器類を監視するセンサーの時系列データを分析し、異常を検知する手法およびソフトウェアの研究開発を行ってきた。
今回紹介するソフトウェアでは、バッチ処理で複数のセンサーから得られた高次元の時系列データから線形のLASSO回帰により学習、モデル化し、異常時を識別する。
しかし学習時間やメモリー使用量の増大が課題になってきたため、Sparkを活用し並列分散化を行った。
SparkにはMLlibという汎用的な機械学習ライブラリが存在するが、今回は使用するアルゴリズムの特殊性を考慮し、既存実装を基に新規に開発した。
本講演では当開発におけるデザインチョイスや性能計測結果について報告する。
a
How to Make Awesome SlideShares: Tips & TricksSlideShare
Turbocharge your online presence with SlideShare. We provide the best tips and tricks for succeeding on SlideShare. Get ideas for what to upload, tips for designing your deck and more.
SlideShare is a global platform for sharing presentations, infographics, videos and documents. It has over 18 million pieces of professional content uploaded by experts like Eric Schmidt and Guy Kawasaki. The document provides tips for setting up an account on SlideShare, uploading content, optimizing it for searchability, and sharing it on social media to build an audience and reputation as a subject matter expert.
The document discusses the benefits of exercise for mental health. Regular physical activity can help reduce anxiety and depression and improve mood and cognitive function. Exercise causes chemical changes in the brain that may help protect against mental illness and improve symptoms.
This document provides an introduction and overview of an upcoming hands-on session for using open source software for scientific data analysis. It will include demonstrations of importing different data formats into QGIS, performing spatial analysis and data visualization, and briefly introducing other open source software like GDAL/OGR, GMT, R, and GRASS GIS. The presentation slides, hands-on data, software website links, and a reference are available at a provided URL. The hands-on session will focus on using the open source GIS software QGIS to work with various scientific data formats from remote sensing and perform basic spatial analysis and mapping.
This document summarizes new features and changes between GRASS 6.4.3 and the upcoming GRASS 7 release. Key changes include making the graphical modeler stable, adding the ability to add web map service layers, and adding new raster, imagery, volumes, and temporal analysis modules. The major updates in open source GIS software indicate that GRASS will likely release a new version in the next year to keep up with projects like QGIS and GMT.
6. はじめに 時系列データの前準備 時系列データの可視化 おわりに
GRASS GIS 7 での時系列データの扱い
strds: Spatial time raster data set
stvds: Spatial time vector data set
str3ds: Spatial time 3D raster data set
6 / 20
7. はじめに 時系列データの前準備 時系列データの可視化 おわりに
時系列データ処理のための前準備
元の気象・気候データ
(NetCDFなど)
GRASS GISに
インポート可能なデータ
(GeoTIFFなど)
GDAL
r.in.gdal
GRASSラスター形式
(GeoTIFFなど)
Space time DB
(実態はデータへのリンク)
t.create
t.regist
7 / 20
8. はじめに 時系列データの前準備 時系列データの可視化 おわりに
時系列データ処理のための前準備
t.create: 空の Space time DB を用意
type: strds/stvds/str3ds
temporaltype:absolute/relative
output: Space time DB 名
title: データのタイトル
description: データの説明
*title や description も入力が必須
8 / 20