Submit Search
Upload
オープンソースのデータ分析ソフト3製品「RapidMiner」「NYSOL」「Revolution R Enterprise (RRE) ※Rの商用版」のご紹介
•
Download as PPTX, PDF
•
20 likes
•
13,538 views
Satoshi Kitajima
Follow
東京大学経済学研究科棟3階 第2教室(C会場) 13:00~15:00 2014年度 統計関連学会連合大会 株式会社KSKアナリティクス 北島 聡
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 87
Download now
Recommended
SASより高速なRevolution R Enterprise
SASより高速なRevolution R Enterprise
Satoshi Kitajima
Revolution R Enterprise(レボリューション R エンタープライズ)がSASより高速であることをベンチマークテスト結果で示しています。
レボリューションR(RRE)のご紹介
レボリューションR(RRE)のご紹介
Satoshi Kitajima
レボリューションRエンタープライズ(英語表記:Revolution R Enterprise, RRE)のご紹介です。
【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -
【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -
KSK Analytics Inc.
XML形式のデータから頻出パターンを発見し可視化する方法
ビッグデータ分析基盤を支えるOSSたち
ビッグデータ分析基盤を支えるOSSたち
Toru Takahashi
オープンソースカンファレンス 2015 Tokyo/Spring 2日目:ライトニングトーク
#TokyoR 39 高速に前処理するNYSOL
#TokyoR 39 高速に前処理するNYSOL
Satoshi Kitajima
高速に前処理するNYSOLについて、#TokyoR 39で発表しました。 主にMコマンド(MCMD)をご紹介しています。
【KSKアナリティクス】 RapidMiner 紹介 (short)
【KSKアナリティクス】 RapidMiner 紹介 (short)
KSK Analytics Inc.
オープンソース分析ソフトRapidMinerのご紹介(ショート版)
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
Insight Technology, Inc.
ビッグデータを高速に検索処理できる全文検索エンジン「Elasticsearch」。近年ではデータ分析プラットフォームとしての活用が注目を集めています。本セッションではデータ分析の観点から、Elasticsearchについての簡単な紹介と、特徴や利用のコツ、そして事例紹介を行います。また、ElasticsearchのプラグインであるGraphを用いて、実際に販売データを分析して得られた知見を、Graphの使い方や分析方法と共にお話しします。
【KSKアナリティクス】 NYSOL 使い方 データ準備編
【KSKアナリティクス】 NYSOL 使い方 データ準備編
KSK Analytics Inc.
NYSOLの使い方(データ準備編)
Recommended
SASより高速なRevolution R Enterprise
SASより高速なRevolution R Enterprise
Satoshi Kitajima
Revolution R Enterprise(レボリューション R エンタープライズ)がSASより高速であることをベンチマークテスト結果で示しています。
レボリューションR(RRE)のご紹介
レボリューションR(RRE)のご紹介
Satoshi Kitajima
レボリューションRエンタープライズ(英語表記:Revolution R Enterprise, RRE)のご紹介です。
【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -
【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -
KSK Analytics Inc.
XML形式のデータから頻出パターンを発見し可視化する方法
ビッグデータ分析基盤を支えるOSSたち
ビッグデータ分析基盤を支えるOSSたち
Toru Takahashi
オープンソースカンファレンス 2015 Tokyo/Spring 2日目:ライトニングトーク
#TokyoR 39 高速に前処理するNYSOL
#TokyoR 39 高速に前処理するNYSOL
Satoshi Kitajima
高速に前処理するNYSOLについて、#TokyoR 39で発表しました。 主にMコマンド(MCMD)をご紹介しています。
【KSKアナリティクス】 RapidMiner 紹介 (short)
【KSKアナリティクス】 RapidMiner 紹介 (short)
KSK Analytics Inc.
オープンソース分析ソフトRapidMinerのご紹介(ショート版)
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
[data analytics showcase] B11: ビッグデータを高速に検索・分析する「Elasticsearch」~新プラグイン「Graph」...
Insight Technology, Inc.
ビッグデータを高速に検索処理できる全文検索エンジン「Elasticsearch」。近年ではデータ分析プラットフォームとしての活用が注目を集めています。本セッションではデータ分析の観点から、Elasticsearchについての簡単な紹介と、特徴や利用のコツ、そして事例紹介を行います。また、ElasticsearchのプラグインであるGraphを用いて、実際に販売データを分析して得られた知見を、Graphの使い方や分析方法と共にお話しします。
【KSKアナリティクス】 NYSOL 使い方 データ準備編
【KSKアナリティクス】 NYSOL 使い方 データ準備編
KSK Analytics Inc.
NYSOLの使い方(データ準備編)
【KSKアナリティクス】 NYSOL 使い方 顧客数の確認編
【KSKアナリティクス】 NYSOL 使い方 顧客数の確認編
KSK Analytics Inc.
NYSOLの使い方(顧客数の確認編)
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤
Google Cloud Platform - Japan
2017-11-22 wed. 第 2 回 Google Cloud INSIDE Games & Apps 株式会社リクルートライフスタイル データエンジニア 南谷 和毅 氏の登壇スライドです。
【KSKアナリティクス】会社案内・事例紹介
【KSKアナリティクス】会社案内・事例紹介
KSK Analytics Inc.
会社案内&事例紹介
The Design for Serverless ETL Pipeline (48:9)
The Design for Serverless ETL Pipeline (48:9)
Shoji Shirotori
Serverlessconf Tokyo 2018で発表したスライドです。 リクルートライフスタイルのデータ分析基盤のサーバーレスなバッチシステム、リプレースの話。 アスペクト比はまさかの 48:9 。後ほど16:9もアップロードします。
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
Yosuke Katsuki
クラスメソッド社イベント"Developers.IO 2019 Tokyo"実施セッション https://dev.classmethod.jp/news/developers-io-2019-tokyo/ AWSが提供するサービスは多岐に渡ります。AWS上にデータ分析基盤を構築する場合、どのAWSサービスを組み合わせるか、沢山の選択肢があります。どのAWSサービスがどういう要件に適しているか、弊社で担当した多くの案件を元にお伝えします。
OSSを活用したダッシュボード の紹介
OSSを活用したダッシュボード の紹介
BigData Sios
2013年8月22日のダッシュボード勉強会の資料です。
【KSKアナリティクス】製品・サービス案内
【KSKアナリティクス】製品・サービス案内
KSK Analytics Inc.
製品&サービス案内
Elasticsaerch Runtime Field
Elasticsaerch Runtime Field
Nomura Yuta
第41回Elasticsearch勉強会発表資料 「Runtime Fieldを利用して、データ分析サイクルを高速に回す」
Renewed using elasticsearchonaspnet-core5
Renewed using elasticsearchonaspnet-core5
Shotaro Suzuki
.NETラボ 勉強会 2020年12月 https://dotnetlab.connpass.com/event/197706/ 「改訂新版:ASP.NET Core で Elasticsearch を統合する方法」 Elastic Technical Product Marketing Manager/Evangelist 内閣官房IT 総合戦略室政府 CIO 補佐官 鈴木 章太郎 10月に実施した内容の改訂新版です。Elastic は超高速な OSS の検索エンジンで、どこにでもデプロイができ、様々なパブリッククラウド上でも稼働、多くの部分が無償で使えます。検索の力を活かして監視、セキュリティソリューションも提供しています。Elastic 概要、Azure への Elastic Cloud デプロイ、データ投入、Visual Studio Code の Elastic プラグイン、.NET 用クライアントライブラリをご紹介して、次に CQRS パターンとの連携について触れつつ、基本的な概念、アーキテクチャ、クエリ等をおさらいします。そして前回よりさらに単純化した .NET Core アプリを使って、全文検索、用語クエリ、マッチクエリ、集計、範囲集計、カテゴリ集計、などの具体的な実装を一つずつご紹介していきます。
Spring Cloud Data Flow で構成される IIJ IoTサービス
Spring Cloud Data Flow で構成される IIJ IoTサービス
Kenji Kondo
JSUG勉強会 2018年その7 Spring Cloud Data FlowとSpring Bootで実装するエンタープライズ統合パターン 第2部 講演資料 https://jsug.doorkeeper.jp/events/84184
Oisix勉強会 google analiticsapiを使用したサイト開発例
Oisix勉強会 google analiticsapiを使用したサイト開発例
oistudy
20200324 ms open-tech-elastic
20200324 ms open-tech-elastic
Koji Kawamura
Microsoft Open Tech Night #9 w/ Elastic の発表資料です。 https://msdevjp.connpass.com/event/169431/
SmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォーム
SmartNews, Inc.
第48回データマイニング+ WEB @東京(#TokyoWebminig 48th)- AWS上での分析基盤アーキテクチャ最前線祭り-「SmartNews の Webmining を支えるプラットフォーム」 speaker: Yuhei Nishioka @SmartNews
Apm enables python app observability
Apm enables python app observability
Shotaro Suzuki
https://www.elastic.co/jp/webinars/instrument-and-monitor-a-python-application-using-apm
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
VirtualTech Japan Inc.
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) 講師:大谷 純 (Elastic) アジェンダ: - Elastic stack紹介 --- Logstash - Log収集 --- Elasticsearch - 検索・解析 --- Kibana - 可視化 • 事例紹介 - Searchlight
【KSKアナリティクス】 NYSOL 使い方 顧客を男女別に分割編
【KSKアナリティクス】 NYSOL 使い方 顧客を男女別に分割編
KSK Analytics Inc.
NYSOLの使い方(顧客を男女別に分割編)
Learn, build, and scale with elastic - realizing great programming experience...
Learn, build, and scale with elastic - realizing great programming experience...
Shotaro Suzuki
Learn, Build, and Scale with Elastic - Elastic Cloud で快適なアプリ開発を実現しよう!-https://event.shoeisha.jp/devsumi/20210218/session/3062/
[Cloud OnAir] ケーススタディから学ぶ GCP で行うデータ エンジニアリング 2019年6月6日 放送
[Cloud OnAir] ケーススタディから学ぶ GCP で行うデータ エンジニアリング 2019年6月6日 放送
Google Cloud Platform - Japan
分析すべきデータが大量にあるにも関わらず、データをどうやって分析して意思決定、経営判断に役に立つのが知りたい。この回では、ケーススタディを通じて、Google Cloud で行うデータ エンジニアリング: データの変換、クリーニング、可視化、分散処理、機械学習モデルの作成について紹介します。
オープンデータプラグイン紹介資料
オープンデータプラグイン紹介資料
Naokazu Nohara
opendata plugin PR
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
Insight Technology, Inc.
延べ900万人以上に利用されている、日本最大級の自動車保険比較サイト「インズウェブ」では、多くの企業が実現したい『業務DBから必要な情報を抜きだし蓄積。BIツールで分析する』機能を、OSSを組み合わせて実現しました。TalendやMariaDB(SpiderEngine)を用いた構築時の工夫や苦労、導入後の効果を余すことなくお伝えします!
RapidMinerのインストール【Windows 7】
RapidMinerのインストール【Windows 7】
Satoshi Kitajima
RapidMiner Studio 6をWindows 7へインストールする方法
RapidMinerのインストール【CentOS 6.5】
RapidMinerのインストール【CentOS 6.5】
Satoshi Kitajima
RapidMiner Studio 6をCentOS 6.5 へインストールする方法
More Related Content
What's hot
【KSKアナリティクス】 NYSOL 使い方 顧客数の確認編
【KSKアナリティクス】 NYSOL 使い方 顧客数の確認編
KSK Analytics Inc.
NYSOLの使い方(顧客数の確認編)
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤
Google Cloud Platform - Japan
2017-11-22 wed. 第 2 回 Google Cloud INSIDE Games & Apps 株式会社リクルートライフスタイル データエンジニア 南谷 和毅 氏の登壇スライドです。
【KSKアナリティクス】会社案内・事例紹介
【KSKアナリティクス】会社案内・事例紹介
KSK Analytics Inc.
会社案内&事例紹介
The Design for Serverless ETL Pipeline (48:9)
The Design for Serverless ETL Pipeline (48:9)
Shoji Shirotori
Serverlessconf Tokyo 2018で発表したスライドです。 リクルートライフスタイルのデータ分析基盤のサーバーレスなバッチシステム、リプレースの話。 アスペクト比はまさかの 48:9 。後ほど16:9もアップロードします。
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
Yosuke Katsuki
クラスメソッド社イベント"Developers.IO 2019 Tokyo"実施セッション https://dev.classmethod.jp/news/developers-io-2019-tokyo/ AWSが提供するサービスは多岐に渡ります。AWS上にデータ分析基盤を構築する場合、どのAWSサービスを組み合わせるか、沢山の選択肢があります。どのAWSサービスがどういう要件に適しているか、弊社で担当した多くの案件を元にお伝えします。
OSSを活用したダッシュボード の紹介
OSSを活用したダッシュボード の紹介
BigData Sios
2013年8月22日のダッシュボード勉強会の資料です。
【KSKアナリティクス】製品・サービス案内
【KSKアナリティクス】製品・サービス案内
KSK Analytics Inc.
製品&サービス案内
Elasticsaerch Runtime Field
Elasticsaerch Runtime Field
Nomura Yuta
第41回Elasticsearch勉強会発表資料 「Runtime Fieldを利用して、データ分析サイクルを高速に回す」
Renewed using elasticsearchonaspnet-core5
Renewed using elasticsearchonaspnet-core5
Shotaro Suzuki
.NETラボ 勉強会 2020年12月 https://dotnetlab.connpass.com/event/197706/ 「改訂新版:ASP.NET Core で Elasticsearch を統合する方法」 Elastic Technical Product Marketing Manager/Evangelist 内閣官房IT 総合戦略室政府 CIO 補佐官 鈴木 章太郎 10月に実施した内容の改訂新版です。Elastic は超高速な OSS の検索エンジンで、どこにでもデプロイができ、様々なパブリッククラウド上でも稼働、多くの部分が無償で使えます。検索の力を活かして監視、セキュリティソリューションも提供しています。Elastic 概要、Azure への Elastic Cloud デプロイ、データ投入、Visual Studio Code の Elastic プラグイン、.NET 用クライアントライブラリをご紹介して、次に CQRS パターンとの連携について触れつつ、基本的な概念、アーキテクチャ、クエリ等をおさらいします。そして前回よりさらに単純化した .NET Core アプリを使って、全文検索、用語クエリ、マッチクエリ、集計、範囲集計、カテゴリ集計、などの具体的な実装を一つずつご紹介していきます。
Spring Cloud Data Flow で構成される IIJ IoTサービス
Spring Cloud Data Flow で構成される IIJ IoTサービス
Kenji Kondo
JSUG勉強会 2018年その7 Spring Cloud Data FlowとSpring Bootで実装するエンタープライズ統合パターン 第2部 講演資料 https://jsug.doorkeeper.jp/events/84184
Oisix勉強会 google analiticsapiを使用したサイト開発例
Oisix勉強会 google analiticsapiを使用したサイト開発例
oistudy
20200324 ms open-tech-elastic
20200324 ms open-tech-elastic
Koji Kawamura
Microsoft Open Tech Night #9 w/ Elastic の発表資料です。 https://msdevjp.connpass.com/event/169431/
SmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォーム
SmartNews, Inc.
第48回データマイニング+ WEB @東京(#TokyoWebminig 48th)- AWS上での分析基盤アーキテクチャ最前線祭り-「SmartNews の Webmining を支えるプラットフォーム」 speaker: Yuhei Nishioka @SmartNews
Apm enables python app observability
Apm enables python app observability
Shotaro Suzuki
https://www.elastic.co/jp/webinars/instrument-and-monitor-a-python-application-using-apm
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
VirtualTech Japan Inc.
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) 講師:大谷 純 (Elastic) アジェンダ: - Elastic stack紹介 --- Logstash - Log収集 --- Elasticsearch - 検索・解析 --- Kibana - 可視化 • 事例紹介 - Searchlight
【KSKアナリティクス】 NYSOL 使い方 顧客を男女別に分割編
【KSKアナリティクス】 NYSOL 使い方 顧客を男女別に分割編
KSK Analytics Inc.
NYSOLの使い方(顧客を男女別に分割編)
Learn, build, and scale with elastic - realizing great programming experience...
Learn, build, and scale with elastic - realizing great programming experience...
Shotaro Suzuki
Learn, Build, and Scale with Elastic - Elastic Cloud で快適なアプリ開発を実現しよう!-https://event.shoeisha.jp/devsumi/20210218/session/3062/
[Cloud OnAir] ケーススタディから学ぶ GCP で行うデータ エンジニアリング 2019年6月6日 放送
[Cloud OnAir] ケーススタディから学ぶ GCP で行うデータ エンジニアリング 2019年6月6日 放送
Google Cloud Platform - Japan
分析すべきデータが大量にあるにも関わらず、データをどうやって分析して意思決定、経営判断に役に立つのが知りたい。この回では、ケーススタディを通じて、Google Cloud で行うデータ エンジニアリング: データの変換、クリーニング、可視化、分散処理、機械学習モデルの作成について紹介します。
オープンデータプラグイン紹介資料
オープンデータプラグイン紹介資料
Naokazu Nohara
opendata plugin PR
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
Insight Technology, Inc.
延べ900万人以上に利用されている、日本最大級の自動車保険比較サイト「インズウェブ」では、多くの企業が実現したい『業務DBから必要な情報を抜きだし蓄積。BIツールで分析する』機能を、OSSを組み合わせて実現しました。TalendやMariaDB(SpiderEngine)を用いた構築時の工夫や苦労、導入後の効果を余すことなくお伝えします!
What's hot
(20)
【KSKアナリティクス】 NYSOL 使い方 顧客数の確認編
【KSKアナリティクス】 NYSOL 使い方 顧客数の確認編
データプロダクトを支えるビッグデータ基盤
データプロダクトを支えるビッグデータ基盤
【KSKアナリティクス】会社案内・事例紹介
【KSKアナリティクス】会社案内・事例紹介
The Design for Serverless ETL Pipeline (48:9)
The Design for Serverless ETL Pipeline (48:9)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
データ分析基盤、どう作る?システム設計のポイント、教えます - Developers.IO 2019 (20191101)
OSSを活用したダッシュボード の紹介
OSSを活用したダッシュボード の紹介
【KSKアナリティクス】製品・サービス案内
【KSKアナリティクス】製品・サービス案内
Elasticsaerch Runtime Field
Elasticsaerch Runtime Field
Renewed using elasticsearchonaspnet-core5
Renewed using elasticsearchonaspnet-core5
Spring Cloud Data Flow で構成される IIJ IoTサービス
Spring Cloud Data Flow で構成される IIJ IoTサービス
Oisix勉強会 google analiticsapiを使用したサイト開発例
Oisix勉強会 google analiticsapiを使用したサイト開発例
20200324 ms open-tech-elastic
20200324 ms open-tech-elastic
SmartNews の Webmining を支えるプラットフォーム
SmartNews の Webmining を支えるプラットフォーム
Apm enables python app observability
Apm enables python app observability
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
【KSKアナリティクス】 NYSOL 使い方 顧客を男女別に分割編
【KSKアナリティクス】 NYSOL 使い方 顧客を男女別に分割編
Learn, build, and scale with elastic - realizing great programming experience...
Learn, build, and scale with elastic - realizing great programming experience...
[Cloud OnAir] ケーススタディから学ぶ GCP で行うデータ エンジニアリング 2019年6月6日 放送
[Cloud OnAir] ケーススタディから学ぶ GCP で行うデータ エンジニアリング 2019年6月6日 放送
オープンデータプラグイン紹介資料
オープンデータプラグイン紹介資料
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
[db tech showcase OSS 2017] A27: Talend + MariaDB(SpiderEngine)+ TableauでBI基盤...
Viewers also liked
RapidMinerのインストール【Windows 7】
RapidMinerのインストール【Windows 7】
Satoshi Kitajima
RapidMiner Studio 6をWindows 7へインストールする方法
RapidMinerのインストール【CentOS 6.5】
RapidMinerのインストール【CentOS 6.5】
Satoshi Kitajima
RapidMiner Studio 6をCentOS 6.5 へインストールする方法
RapidMinerのインストール【Ubuntu 14.04 LTS】
RapidMinerのインストール【Ubuntu 14.04 LTS】
Satoshi Kitajima
RapidMiner Studio 6をUbuntu 14.04 LTS へインストールする方法
RapidMinerのインストール【Mac OSX Mavericks】
RapidMinerのインストール【Mac OSX Mavericks】
Satoshi Kitajima
RapidMiner Studio 6をMac OSX Mavericksへインストールする方法
RapidMinerのご紹介(ラピッドマイナーの5つの重要ポイント)2013年12月
RapidMinerのご紹介(ラピッドマイナーの5つの重要ポイント)2013年12月
ossanalytics
RapidMinerを初めてご覧になる方に、その特徴を5つのポイントに絞ってご紹介します。
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
Satoshi Kitajima
データサイエンティスト必見! M-1グランプリ 前処理の頂点は誰だ!? 出場者はRのdplyr、PostgreSQL、NYSOLのMコマンドなど。
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
NYSOL
大規模データ解析用ソフトウェア NYSOL のご紹介です。 NYSOL はオープンソースソフトウェアですので、どなたでも自由にお使いいただけます。
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
Hiroshi Shimizu
Excelで動くフリーの統計分析プログラム、HADの解説です。 プログラムは、以下のサイトからダウンロードできます。 http://norimune.net/had エクセルで統計分析 HADについて http://slidesha.re/10ARA0k エクセルで統計分析2 HADの使い方 http://slidesha.re/RsVBp7 エクセルで統計分析3 回帰分析のやり方 http://slidesha.re/XVATPV エクセルで統計分析4 因子分析のやり方 http://slidesha.re/YWUGNY
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
Recruit Technologies
2016/07/15 db tech showcase Tokyo 2016での渡部の講演資料になります
バンディットアルゴリズム入門と実践
バンディットアルゴリズム入門と実践
智之 村上
Tokyowebmining発表用資料です。複数の選択肢がある場合に、どのように選択を行うのが効率的なのか?という問題を解決するためのアルゴリズムです。
決定木学習
決定木学習
Mitsuo Shimohata
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
Recruit Technologies
2015/11/20 数理システムユーザーコンファレンス 2015での、池田の講演資料になります
今日から使える! みんなのクラスタリング超入門
今日から使える! みんなのクラスタリング超入門
toilet_lunch
第2回さくさくテキストマイニング勉強会で発表したk-meansに関する資料です。
機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレスト
Teppei Baba
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33
horihorio
一般向けのDeep Learning
一般向けのDeep Learning
Preferred Networks
PFI 全体セミナーで発表した、専門家向けではなく一般向けのDeep Learning(深層学習)の解説です。どのような場面で活躍しているのか、今までの学習手法と何が違うのかを解説しています。
トピックモデルを用いた 潜在ファッション嗜好の推定
トピックモデルを用いた 潜在ファッション嗜好の推定
Takashi Kaneda
Fashion Tech meetup #1 の発表資料です!
パターン認識 第10章 決定木
パターン認識 第10章 決定木
Miyoshi Yuya
SVMについて
SVMについて
mknh1122
SVMについて自分なりにまとめて,授業でプレゼンしたもの.時間的に間に合わなかったりして内容が不完全だったりするけども,読めば線形SVMの実装ぐらいはできるかも.独学なので間違いがある可能性も.
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
Naoki Yanai
Viewers also liked
(20)
RapidMinerのインストール【Windows 7】
RapidMinerのインストール【Windows 7】
RapidMinerのインストール【CentOS 6.5】
RapidMinerのインストール【CentOS 6.5】
RapidMinerのインストール【Ubuntu 14.04 LTS】
RapidMinerのインストール【Ubuntu 14.04 LTS】
RapidMinerのインストール【Mac OSX Mavericks】
RapidMinerのインストール【Mac OSX Mavericks】
RapidMinerのご紹介(ラピッドマイナーの5つの重要ポイント)2013年12月
RapidMinerのご紹介(ラピッドマイナーの5つの重要ポイント)2013年12月
データサイエンティスト必見!M-1グランプリ
データサイエンティスト必見!M-1グランプリ
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
【NYSOL】ビッグデータをシンプル・高速に!日本発の大規模データ解析用OSS
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
バンディットアルゴリズム入門と実践
バンディットアルゴリズム入門と実践
決定木学習
決定木学習
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
今日から使える! みんなのクラスタリング超入門
今日から使える! みんなのクラスタリング超入門
機会学習ハッカソン:ランダムフォレスト
機会学習ハッカソン:ランダムフォレスト
ロジスティック回帰の考え方・使い方 - TokyoR #33
ロジスティック回帰の考え方・使い方 - TokyoR #33
一般向けのDeep Learning
一般向けのDeep Learning
トピックモデルを用いた 潜在ファッション嗜好の推定
トピックモデルを用いた 潜在ファッション嗜好の推定
パターン認識 第10章 決定木
パターン認識 第10章 決定木
SVMについて
SVMについて
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
はじめてでもわかるベイズ分類器 -基礎からMahout実装まで-
Similar to オープンソースのデータ分析ソフト3製品「RapidMiner」「NYSOL」「Revolution R Enterprise (RRE) ※Rの商用版」のご紹介
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめ
Ohyama Masanori
pgconf.asia 2016 チュートリアルの資料です。
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
NTT DATA OSS Professional Services
■PostgreSQLでpg_bigmを使って日本語全文検索 ~pg_bigmで全文検索するときに知っておくべき8のこと~ (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料) NTTデータ 澤田 雅彦
Splunkを使ってKubernetesクラスターとコンテナのログ・メトリクスを可視化
Splunkを使ってKubernetesクラスターとコンテナのログ・メトリクスを可視化
Kunihiko Ikeyama
流動的なコンテナ環境をSplunkでリアルタイムにモニタリングしてシームレスな開発・運用を実現
Pentaho+mongo db勉強会20150416
Pentaho+mongo db勉強会20150416
Yoshiteru Morimoto
2015日4月16日に行ったPentaho+MongoDBによるIoT勉強会の資料です。
Realize tokyo2019 yrglm
Realize tokyo2019 yrglm
Katsuya Uehara
Realize tokyo 20191010の発表資料です Verticaの活用事例を話しています
トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9
Treasure Data, Inc.
トレジャーデータサービスをリリースして一年あまり、今年の最後に目玉となる新サービスのお披露目を東京にて行いました。創業者・CTO 太田 一樹によるプレゼンテーションを公開させていただきます。 トレジャーデータの概要から、新サービスである、Treasure Query Accelerator(当社比従来の10-50倍高速化しました)、 Treasure Viewer(ドラッグアンドドロップで簡単にクロス集計などのグラフが作成できる)、新サービス価格体系についてのご案内も盛り込んでいます。 当日ご来場いただけた方はもちろん、ご都合で欠席された方もぜひご覧ください。 また、今後同内容のWebinarも開催していく予定です。
CLOUDIAN at Support Engineer Night
CLOUDIAN at Support Engineer Night
CLOUDIAN KK
2015年7月2日開催、「サポートエンジニアNight」におけるクラウディアンのプレゼン資料です。
【KSKアナリティクス】Pentaho紹介
【KSKアナリティクス】Pentaho紹介
KSK Analytics Inc.
【KSKアナリティクス】Pentaho紹介
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
Insight Technology, Inc.
今話題のIoTをキーワードにビッグデータに注目が集まる昨今。そんなあらゆるモノから時々刻々と発生するビッグデータを分析し、現実世界の変化を捉えることができるのがCEPです。 本セッションでは、日立のCEPについて最新事例を多数交えて基礎から解説し、ビッグデータ利活用の「今」をご紹介します。
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
Recruit Technologies
ビッグデータ&データマネジメント展での講演資料
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
Yasuyuki Sugai
2014年4月期 AITCオープンラボ
Hadoopカンファレンス2013
Hadoopカンファレンス2013
Recruit Technologies
Jsai2018
Jsai2018
MLSE
2018年度 人工知能学会全国大会 企画セッションKS-1 『機械学習工学とは − 機械学習システムを創り上げるための工学的課題 −』 ポジショントーク:太田満久(ブレインパッド)
Klocworkのご紹介
Klocworkのご紹介
Masaru Horioka
2016年9月15日株式会社シーイーシー様セミナーでのKlocwork紹介資料です。
stapy_028_talk1
stapy_028_talk1
Takeshi Akutsu
Talk 1: 「データインテグレーションとは何か」 小野和俊(セゾン情報システムズ / アプレッソ) 当時から今に至るまで一貫してプログラマーである私は、2000年に起業してDataSpiderという製品を作りました。データの連携に関する処理を担うこの分野の製品は、EAI、ETL、最近ではDI(Data Integration)と呼ばれていますが、そもそも一体どんなものなのか?そしてPythonとどのように組み合わせることができ、Pythonistaから見てどんな利点があるのか?等について紹介します。
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
Recruit Technologies
2015/07/15 IIJ Lead Initiative 2015での、野村の講演資料になります
Building Software Reliability through Distributed Tracing.pdf
Building Software Reliability through Distributed Tracing.pdf
Shotaro Suzuki
分散トレーシングによるソフトウェアの信頼性構築 https://www.elastic.co/jp/virtual-events/building-software-reliability-with-distributed-tracing
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
Kimihiko Kitase
2016-10-16 Open Cloud Innovation Festa 2016 @電気通信大学 #ocif16 Hortonworks 北瀬公彦 データの活用方法と事例の紹介、Hortonworksのデータ収集、分析、蓄積プラットフォームの紹介
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
オラクルエンジニア通信
2016/5/11に実施したGoldenGateテクニカルセミナーの資料です。 1「市場のトレンドと最新事例のご紹介」←本資料 2「Oracle GoldenGate 新機能情報」 3「Oracle GoldenGate Technical Deep Dive」 4「テクニカルコンサルタントが語るOracle GoldenGate現場で使える極意」
Spring I/O 2016 報告 Test / Cloud / Other Popular Sessions
Spring I/O 2016 報告 Test / Cloud / Other Popular Sessions
Takuya Iwatsuka
2016年6月22日のJSUGで発表した資料です.
Similar to オープンソースのデータ分析ソフト3製品「RapidMiner」「NYSOL」「Revolution R Enterprise (RRE) ※Rの商用版」のご紹介
(20)
PostgreSQLによるデータ分析ことはじめ
PostgreSQLによるデータ分析ことはじめ
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
PostgreSQLでpg_bigmを使って日本語全文検索 (MySQLとPostgreSQLの日本語全文検索勉強会 発表資料)
Splunkを使ってKubernetesクラスターとコンテナのログ・メトリクスを可視化
Splunkを使ってKubernetesクラスターとコンテナのログ・メトリクスを可視化
Pentaho+mongo db勉強会20150416
Pentaho+mongo db勉強会20150416
Realize tokyo2019 yrglm
Realize tokyo2019 yrglm
トレジャーデータ新サービス発表 2013/12/9
トレジャーデータ新サービス発表 2013/12/9
CLOUDIAN at Support Engineer Night
CLOUDIAN at Support Engineer Night
【KSKアナリティクス】Pentaho紹介
【KSKアナリティクス】Pentaho紹介
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
[db tech showcase Tokyo 2014] D25: 今を分析する日立の「CEP」、知るなら今でしょ! by 株式会社日立製作所 村上順一
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
第2回 R言語で始めよう、データサイエンス(ハンズオン勉強会) 〜相関分析による需要予測編〜
Hadoopカンファレンス2013
Hadoopカンファレンス2013
Jsai2018
Jsai2018
Klocworkのご紹介
Klocworkのご紹介
stapy_028_talk1
stapy_028_talk1
変わる!? リクルートグループのデータ解析基盤
変わる!? リクルートグループのデータ解析基盤
Building Software Reliability through Distributed Tracing.pdf
Building Software Reliability through Distributed Tracing.pdf
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
最新事例から学ぶビッグデータの活用法 #ocif16 #hortonworks
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
GoldenGateテクニカルセミナー1「市場のトレンドと最新事例のご紹介」(2016/5/11)
Spring I/O 2016 報告 Test / Cloud / Other Popular Sessions
Spring I/O 2016 報告 Test / Cloud / Other Popular Sessions
オープンソースのデータ分析ソフト3製品「RapidMiner」「NYSOL」「Revolution R Enterprise (RRE) ※Rの商用版」のご紹介
1.
オープンソース データ分析ソフト3製品 2014年度統計関連学会連合大会@
東京大学 株式会社KSKアナリティクス 北島聡 (2014年9月14日〜16日) (データマイニング・機械学習)
2.
本日の資料はにアップしております。 よろしければ検索サイトで以下のキーワードなどを入力してご覧ください。 統計関連学会連合大会オープンソース検索
3.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html © KSK
Analytics Inc., RapidMiner Japan Partner
4.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html 2014年6月、世界で最も有名な データマイニング系情報サイト
「kdnuggets.com」が調査 © KSK Analytics Inc., RapidMiner Japan Partner
5.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html 過去1年、実際の分析プロジェクトで 活用した分析ソフトはなんですか?
© KSK Analytics Inc., RapidMiner Japan Partner
6.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html © KSK
Analytics Inc., RapidMiner Japan Partner
7.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html © KSK
Analytics Inc., RapidMiner Japan Partner
8.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html 世界で最も使われている RapidMiner
をご紹介 © KSK Analytics Inc., RapidMiner Japan Partner
9.
無料で利用することが出来るため、 ビジネス・アカデミックを問わず強力に支援 ©
KSK Analytics Inc., RapidMiner Japan Partner
10.
© KSK Analytics
Inc., RapidMiner Japan Partner 豊富な分析アルゴリ ズムに加え、モデル 評価やデータ加工 (ETL)など幅広い機 能を保有
11.
他のオープンソースも活用できるため、 さらに幅広いアルゴリズムで分析可能 パッケージ数5,800以上
最先端アルゴリズムも多い 追加モデル数、約100個 これらはRapidMinerでエクステンション(無料)を インストールして頂くことでご利用できます © KSK Analytics Inc., RapidMiner Japan Partner RapidMinerの画面
12.
© KSK Analytics
Inc., RapidMiner Japan Partner エクステンション(無料) は、リコメンデーションや、 時系列分析、Webマイ ニングなどにも対応
13.
分かりやすい操作画面(GUI) データ分析が初めての方・学生の方にも 分析の楽しさを伝えることができます
© KSK Analytics Inc., RapidMiner Japan Partner
14.
強力なビジュアライゼーション データから視覚的に関連性や 仮説を発見できます
© KSK Analytics Inc., RapidMiner Japan Partner
15.
高度な分析もノンプログラミングで簡単操作 プログラムと 向き合う時間
Data と 向き合う時間< © KSK Analytics Inc., RapidMiner Japan Partner
16.
• 分かりやすい操作画面(GUI)でデータ分 析が初めての学生にも簡単にデータ分析
の楽しさを伝えることができます <デモ> • 強力なビジュアライゼーションで、データか ら早期に関連性や仮説などを発見すること が出来実ま際にすその操作画面とビジュアライゼーション、 ノンプログラミングでできる分析をご覧ください
17.
RapidMiner Studio 6のご利用は、以下のWebページから、必要箇所に入
力してください。ダウンロードURLとログイン用のユーザー名とパスワードが メールで届きます。無料でご利用頂けます(期間の制限はありません)
18.
RapidMiner Studio 6のご利用は、以下のWebページから、必要箇所に入
力してください。ダウンロードURLとログイン用のユーザー名とパスワードが メールで届きます。無料でご利用頂けます(期間の制限はありません) http://www.rapidminer.jp/downloa d/software/
19.
RapidMinerのトレーニング 商品名RapidMinerによるデータマイニングトレーニング (ベーシック&
アドバンスド) 対象者ビジネスユーザー、データサイエンスチーム 形式お客さま指定日(2日間、あるいは4日間) ※オンサイト(講師派遣)コース こんな方に オススメ RapidMinerの使い方・機能について素早く理解したい RapidMinerを使用した予測モデルの作成や評価を行いたい RapidMinerを使用した高度な予測分析手法を学びたい RapidMinerで相関ルール作成やマーケットバスケット分析を行いたい RapidMinerで顧客のセグメンテーション、クラスター分析を行いたい 価格基本料金15万円+ 受講者数× 5万円(ベーシックコース) 基本料金15万円+ 受講者数× 5万円(アドバンスドコース) 定員1名~5名まで ※RapidMinerの無料版のご利用を検討されている方にもオススメのトレーニングです ※オープンコース 2014年11月12日(水)ー13日(木) 、12月17日(水)ー18日(木) 料金はオンサイトコースに比べお得です!(ベーシックコース:14万円/1名) 詳細はこちらまで:http://www.rapidminer.jp/service/training/ © KSK Analytics Inc.
20.
21.
Rは素晴らしい! しかし、Rユーザーが 口をそろえて言うのが・・・
© KSK Analytics Inc., Revolution Analytics Japan Partner
22.
重い © KSK
Analytics Inc., Revolution Analytics Japan Partner
23.
かなり必死 重い ©
KSK Analytics Inc., Revolution Analytics Japan Partner
24.
実行速度が重い 大規模データが重い ・・・というか扱えない
© KSK Analytics Inc., Revolution Analytics Japan Partner
25.
Rユーザーの多くはドクターストップ(限界)もよく知っている © KSK
Analytics Inc., Revolution Analytics Japan Partner
26.
一方、世の中のデータ量は・・・ © KSK
Analytics Inc., Revolution Analytics Japan Partner
27.
http://www.datacenterjournal.com/it/birth-death-big-data/ © KSK
Analytics Inc., Revolution Analytics Japan Partner
28.
http://www.datacenterjournal.com/it/birth-death-big-data/ © KSK
Analytics Inc., Revolution Analytics Japan Partner
29.
ひたすら増えていく・・・ © KSK
Analytics Inc., Revolution Analytics Japan Partner
30.
ひたすら増えていく・・・ 2010年の体重が123kgだとすれば、 2020年には4000kg(4トン)になる
© KSK Analytics Inc., Revolution Analytics Japan Partner
31.
分析者や分析業務も増えてきたのに・・・ © KSK
Analytics Inc., Revolution Analytics Japan Partner
32.
分析に革命が起こる
33.
大規模データを高速に実行できる レボリューションRをご紹介 <-
+ 革命
34.
R vs レボリューションR(ScaleR)のパフォーマンス比較
※GLM:一般化線形モデル データ件数 時間(秒) © KSK Analytics Inc., Revolution Analytics Japan Partner
35.
R vs レボリューションR(ScaleR)のパフォーマンス比較
※GLM:一般化線形モデル データ件数 時間(秒) © KSK Analytics Inc., Revolution Analytics Japan Partner
36.
R vs レボリューションR(ScaleR)のパフォーマンス比較
※GLM:一般化線形モデル オープンソースRはデータ件数が25万件で約80秒 データ件数 時間(秒) © KSK Analytics Inc., Revolution Analytics Japan Partner
37.
R vs レボリューションR(ScaleR)のパフォーマンス比較
※GLM:一般化線形モデル データ件数 時間(秒) © KSK Analytics Inc., Revolution Analytics Japan Partner
38.
R vs レボリューションR(ScaleR)のパフォーマンス比較
※GLM:一般化線形モデル レボリューションRはデータ件数が500万件で10秒以下 データ件数 時間(秒) © KSK Analytics Inc., Revolution Analytics Japan Partner
39.
R vs レボリューションR(ScaleR)のパフォーマンス比較
※GLM:一般化線形モデル レボリューションRはデータ件数が500万件で10秒以下 データ件数 時間(秒) © KSK Analytics Inc., Revolution Analytics Japan Partner
40.
R vs レボリューションR(ScaleR)のパフォーマンス比較
※GLM:一般化線形モデル レボリューションRはデータ件数が500万件で10秒以下 データ件数 時間(秒) しかも、メモリ8GBの普通のノートPCで © KSK Analytics Inc., Revolution Analytics Japan Partner
41.
Rユーザーであれば移行はスムーズ オープンソースRの記載例 レボリューションRの記載例
42.
Hadoop vs サーバー1台
分析したいデータ量が100GBだとすると・・・ © KSK Analytics Inc., Revolution Analytics Japan Partner サーバー1台(8コア) Hadoopクラスタ8台
43.
Hadoop vs サーバー1台
分析したいデータ量が100GBだとすると・・・ Hadoopクラスタ8台 © KSK Analytics Inc., Revolution Analytics Japan Partner < サーバー1台(8コア) 概ね、サーバー1台の方が8倍〜10倍の速度で早いです。 (※データ量が1TB以上だとHadoopをオススメします)
44.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html © KSK
Analytics Inc., RapidMiner Japan Partner
45.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html 商用ソフト(緑色)としても人気が高い 特にRユーザーからの移行が多く、
利用者は急速に拡大中 © KSK Analytics Inc., RapidMiner Japan Partner
46.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html © KSK
Analytics Inc., RapidMiner Japan Partner
47.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html © KSK
Analytics Inc., RapidMiner Japan Partner
48.
http://www.kdnuggets.com/2014/06/kdnuggets-annual-software-poll-rapidminer-continues-lead.html しかも、ソフト単体の利用者は、 RapidMiner(35.1%)に次いで
2番目に高い(13.3%) © KSK Analytics Inc., RapidMiner Japan Partner
49.
でも、お高いんでしょう? © KSK
Analytics Inc., Revolution Analytics Japan Partner
50.
でも、お高いんでしょう? いえ、アカデミックは・・・ ©
KSK Analytics Inc., Revolution Analytics Japan Partner
51.
© KSK Analytics
Inc., Revolution Analytics Japan Partner
52.
© KSK Analytics
Inc., Revolution Analytics Japan Partner
53.
無料です! © KSK
Analytics Inc., Revolution Analytics Japan Partner
54.
http://i無nfo.re料volutioでnanalすytics.c!om/free -academic.html
55.
http://i無nfo.re料volutioでnanalすytics.c!om/free -academic.html 株式会社KSKアナリティクスはビジネスにおけるサポートを事業
にしており、アカデミックにおけるサポートは取り扱っておりません。 アカデミック利用に関してご不明な点があれば、恐れ入りますが 上記サイトよりRevolution Analytics社へ直接問い合わせ下さい。
56.
データ分析のプロセス 実は8割以上は前処理(データ加工) 様々なデータ形式
膨大なデータ量 複雑なデータ構造 社外データ EXCE L 業務システム 分析用 データ クラス 分類 回帰 分析 パターン 解析 クラスタ リング 繰り返しの データ加工 CS V © KSK Analytics Inc., NYSOL Partner
57.
データ分析のプロセス 実は8割以上は前処理(データ加工) 様々なデータ形式
膨大なデータ量 複雑なデータ構造 社外データ EXCE L 業務システム 分析用 データ クラス 分類 回帰 分析 パターン 解析 クラスタ リング 繰り返しの データ加工 CS V 前処理 © KSK Analytics Inc., NYSOL Partner
58.
http://www.slideshare.net/SatoshiKitajima2/m1-38513054 © KSK
Analytics Inc., NYSOL Partner デーサイエンティスト必見 M-1グランプリ 漫才前処理の頂点は誰だ!? Maeshori より詳細はこちらをご覧ください
59.
M-1グランプリ出場者のご紹介 1. 2.
3. 4. パッケージを使わずに勝負します! (R_baseと表記) 最強と名高い”dplyr”と”data.table” パッケージを使います! (R_pkgと表記) データベースを代表して 出場します! 「にそる」と読みます。日本で誕生した オープンソースで、無料で使えます! © KSK Analytics Inc., NYSOL Partner
60.
前処理は5つ 列選択行選択列計算並び替え複合 データは6つ
1 2 3 4 5 6 データ件数千件一万件十万件百万件一千万件一億件 データ量約100KB 約1MB 約10MB 約100MB 約1GB 約10GB © KSK Analytics Inc., NYSOL Partner
61.
データ件数千件一万件十万件百万件一千万件一億件 データ量約100KB 約1MB
約10MB 約100MB 約1GB 約10GB 0.5秒 1 2 3 4 5 6 R_base R_pkg PostgreSQL NYSOL
62.
データ件数千件一万件十万件百万件一千万件一億件 データ量約100KB 約1MB
約10MB 約100MB 約1GB 約10GB 1秒 1 2 3 4 5 6 R_base R_pkg PostgreSQL NYSOL
63.
データ件数千件一万件十万件百万件一千万件一億件 データ量約100KB 約1MB
約10MB 約100MB 約1GB 約10GB 5秒 1秒 1 2 3 4 5 6 R_base R_pkg PostgreSQL NYSOL
64.
データ件数千件一万件十万件百万件一千万件一億件 データ量約100KB 約1MB
約10MB 約100MB 約1GB 約10GB 45秒 5秒 1 2 3 4 5 6 R_base R_pkg PostgreSQL NYSOL
65.
データ件数千件一万件十万件百万件一千万件一億件 データ量約100KB 約1MB
約10MB 約100MB 約1GB 約10GB 5分 1分 1 2 3 4 5 6 R_base R_pkg PostgreSQL NYSOL
66.
1 2 3
4 5 6 データ件数千件一万件十万件百万件一千万件一億件 データ量約100KB 約1MB 約10MB 約100MB 約1GB 約10GB R_base R_pkg PostgreSQL NYSOL 1時間 30分 10分 Rは一部の前処理が メモリエラーで計測不可
67.
(R_pkg) 結果発表!
68.
データ分析のプロセス 実は8割以上は前処理(データ加工) 様々なデータ形式
膨大なデータ量 複雑なデータ構造 社外データ EXCE L 業務システム 分析用 データ クラス 分類 回帰 分析 パターン 解析 クラスタ リング 繰り返しの データ加工 CS V 前処理 © KSK Analytics Inc., NYSOL Partner
69.
データ分析のプロセス 実は8割以上は前処理(データ加工) 様々なデータ形式
膨大なデータ量 複雑なデータ構造 社外データ EXCE L 業務システム 分析用 データ クラス 分類 回帰 分析 パターン 解析 クラスタ リング 繰り返しの データ加工 CS V 前処理 © KSK Analytics Inc., NYSOL Partner の「Mコマンド」
70.
仕組みはシンプル Mコマンド ・UNIXコマンド
・約70種類 ・CSVデータ 組み合わせは無限大 ・各コマンドを 「パイプ」で接続 © KSK Analytics Inc., NYSOL Partner
71.
© KSK Analytics
Inc., NYSOL Partner
72.
© KSK Analytics
Inc., NYSOL Partner 約70種類
73.
Mコマンドの他にも「頻出パターンマイニング」や「データマイニ ング・機械学習」「テキストマイニング」「可視化」などさまざま
74.
データ分析のプロセス 実は8割以上は前処理(データ加工) 様々なデータ形式
膨大なデータ量 複雑なデータ構造 社外データ EXCE L 業務システム 分析用 データ クラス 分類 回帰 分析 パターン 解析 クラスタ リング 繰り返しの データ加工 CS V 前処理 © KSK Analytics Inc., NYSOL Partner の「Mコマンド」
75.
データ分析のプロセス 実は8割以上は前処理(データ加工) 様々なデータ形式
膨大なデータ量 複雑なデータ構造 社外データ EXCE L 業務システム 分析用 データ クラス 分類 回帰 分析 パターン 解析 クラスタ リング 繰り返しの データ加工 CS V 前処理 © KSK Analytics Inc., NYSOL Partner の「Mコマンド」
76.
パズルに似た新しい知的感覚 NYSOLはコマンドが主役。一つのコマンドの役 割は、入力したCSVデータに対して、一つの処
理をし、CSVデータを出力するだけ。このシンプ ルなコマンドをパズルのように組み合わせるだ けで広い分野でのデータ活用を可能にします。 移植性の高いCSVデータ NYSOLはCSVデータの扱いに特化しています。 ExcelやDBからCSVデータを出力すれば、簡単 にNYSOLで扱うことができます。さらにNYSOL から出力されるCSVデータは、RやRapidMiner、 DBなど外部ソフトとの連携も移植性が高く柔軟 に機能します。 © KSK Analytics Inc., NYSOL Partner
77.
一台でも大規模データ NYSOLで扱えるデータはメモリ量ではなくHDD に依存します。一般的にHadoopなどで分散処
理が必要とされる数百GB〜数TB(数千万件〜 数億件程度)の大規模なデータでも一台のサー バーで処理することも可能です。 驚きの高速処理 これまで商用版のデータベースで20時間以上か かっていた7億件のデータ処理が、ノートPCで1 時間以内に終了したケースもあります。NYSOL は主にC++言語で開発され、各コマンドは一つ の機能を高速に処理するよう設計されています。 © KSK Analytics Inc., NYSOL Partner
78.
最先端アルゴリズム NYSOLは大学や研究機関などの学術界で生み 出された最新・最高峰のデータ解析/データマ
イニングのコマンドおよびアルゴリズムを採用し ています。洗練されたアルゴリズムはビジネス現 場でも広く活躍しています。 フリーソフトウェア NYSOLは大学などの研究成果を広く産業界に 還元する目的で設立されました。そのため、 NYSOLが提供するソフトウェアは無料でご利用 頂くことができます。また、ご希望の企業様には、 NYSOLのビジネスサポートも提供しています。 © KSK Analytics Inc., NYSOL Partner
79.
安心のビジネスサポート ビジネスとしてデータを活用するには、ソフトウェ アのサポートや分析支援などが必要になる場合
があります。また社内に分析人材を育成したい ニーズも高まってきました。詳しくはKSKアナリ ティクスまで問い合わせ下さい。 © KSK Analytics Inc., NYSOL Partner
80.
© KSK Analytics
Inc., NYSOL Partner
81.
© KSK Analytics
Inc., NYSOL Partner
82.
http://www.nysol.jp/ © KSK
Analytics Inc., NYSOL Partner
83.
NYSOLのトレーニング 商品名NYSOLによるデータマイニングトレーニング (データ加工編:1日コース)
対象者ビジネスユーザー、データサイエンスチーム 形式お客さま指定日(1日間) こんな方に オススメ データ加工が必要なデータがたくさんある さまざまなデータ加工が必要 SQLスクリプトを得意としている人材が少ない データベースでは速度のパフォーマンスが出ない データベースでは大規模データを扱えない 価格基本料金15万円+ 受講者数× 5万円 定員1名~5名程度 ※オンサイト(講師派遣)コース ※Windowsユーザーにもオススメです ※NYSOLソフトウェアの商用サポートもご提供しております。 © KSK Analytics Inc., NYSOL Partner
84.
KSKアナリティクスのデータ分析サービス 使用ソフトウェアは主にオープンソース 初期トレーニング&
スキルトランスファーで早期成果 必要であればビジネスサポート 20XX年 1月2月3月4月5月6月7月以降 データ加工、データ分析 トレーニング データ分析 スタートダッシュサービス お客さま内 データ分析 データ分析 サポートサービス お客様 弊社 © KSK Analytics Inc.
85.
東京大学経済学研究棟1F受付右側でブース出展しています。 ご不明な点がございましたらお気軽にお越しください。 出展期間:2014年9月14日〜16日
9:00〜18:00 (最終日は15:00まで) このポスターが目印です
86.
3製品を使った無料ハンズオンセミナーも開催中 http://www.rapidminer.jp/service/seminar/#sei2
87.
株式会社KSKアナリティクス セールス& マーケティング本部
www.ksk-anl.com sales@ksk-anl.com お気軽に問い合わせ下さい
Editor's Notes
1ゼタバイトは10億テラバイト
GLMはGeneralised Linear Model(一般化線形モデル)の略。General Linear Modelの場合もある。 ここで、glm、rxGlmというファンクション名が違うこと、R利用者であれば、同じ文法/仕様でRREを使えることを説明しておく
GLMはGeneralised Linear Model(一般化線形モデル)の略。General Linear Modelの場合もある。 ここで、glm、rxGlmというファンクション名が違うこと、R利用者であれば、同じ文法/仕様でRREを使えることを説明しておく
GLMはGeneralised Linear Model(一般化線形モデル)の略。General Linear Modelの場合もある。 ここで、glm、rxGlmというファンクション名が違うこと、R利用者であれば、同じ文法/仕様でRREを使えることを説明しておく
GLMはGeneralised Linear Model(一般化線形モデル)の略。General Linear Modelの場合もある。 ここで、glm、rxGlmというファンクション名が違うこと、R利用者であれば、同じ文法/仕様でRREを使えることを説明しておく
GLMはGeneralised Linear Model(一般化線形モデル)の略。General Linear Modelの場合もある。 ここで、glm、rxGlmというファンクション名が違うこと、R利用者であれば、同じ文法/仕様でRREを使えることを説明しておく
GLMはGeneralised Linear Model(一般化線形モデル)の略。General Linear Modelの場合もある。 ここで、glm、rxGlmというファンクション名が違うこと、R利用者であれば、同じ文法/仕様でRREを使えることを説明しておく
GLMはGeneralised Linear Model(一般化線形モデル)の略。General Linear Modelの場合もある。 ここで、glm、rxGlmというファンクション名が違うこと、R利用者であれば、同じ文法/仕様でRREを使えることを説明しておく
Download now