Submit Search
Upload
データサイエンスことはじめ
•
Download as PPTX, PDF
•
3 likes
•
4,410 views
大
大貴 末廣
Follow
Python のインストールなど
Read less
Read more
Education
Report
Share
Report
Share
1 of 66
Download now
Recommended
Python基礎その1
Python基礎その1
大貴 末廣
if文,for文など
Python基礎その2
Python基礎その2
大貴 末廣
各種数値計算など
画像処理応用
画像処理応用
大貴 末廣
画像処理の応用
統計分析
統計分析
大貴 末廣
統計分析 t検定など
画像処理基礎
画像処理基礎
大貴 末廣
画像処理の基礎
相関分析と回帰分析
相関分析と回帰分析
大貴 末廣
相関分析と回帰分析
データサイエンス概論第一=3-2 主成分分析と因子分析
データサイエンス概論第一=3-2 主成分分析と因子分析
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義.
主成分分析
主成分分析
大貴 末廣
主成分分析
Recommended
Python基礎その1
Python基礎その1
大貴 末廣
if文,for文など
Python基礎その2
Python基礎その2
大貴 末廣
各種数値計算など
画像処理応用
画像処理応用
大貴 末廣
画像処理の応用
統計分析
統計分析
大貴 末廣
統計分析 t検定など
画像処理基礎
画像処理基礎
大貴 末廣
画像処理の基礎
相関分析と回帰分析
相関分析と回帰分析
大貴 末廣
相関分析と回帰分析
データサイエンス概論第一=3-2 主成分分析と因子分析
データサイエンス概論第一=3-2 主成分分析と因子分析
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義.
主成分分析
主成分分析
大貴 末廣
主成分分析
距離とクラスタリング
距離とクラスタリング
大貴 末廣
距離とクラスタリング
データサイエンス概論第一=1-1 データとは
データサイエンス概論第一=1-1 データとは
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=4-2 確率と確率分布
データサイエンス概論第一=4-2 確率と確率分布
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=0 まえがき
データサイエンス概論第一=0 まえがき
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義.
0 データサイエンス概論まえがき
0 データサイエンス概論まえがき
Seiichi Uchida
データサイエンス概論Ⅰ & Ⅱ(全15単元)の目的と全体像.
データサイエンス概論第一=3-1 線形代数に基づくデータ解析の基礎
データサイエンス概論第一=3-1 線形代数に基づくデータ解析の基礎
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=2-2 クラスタリング
データサイエンス概論第一=2-2 クラスタリング
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義」
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
shima o
2 データのベクトル表現と集合
2 データのベクトル表現と集合
Seiichi Uchida
「データのベクトル表現と集合」に関する初歩
4 データ間の距離と類似度
4 データ間の距離と類似度
Seiichi Uchida
「データ間の距離と類似度」の初歩
データサイエンス概論第一=1-2 データのベクトル表現と集合
データサイエンス概論第一=1-2 データのベクトル表現と集合
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Satoshi Kato
All sample codes are available at: https://github.com/katokohaku/tSNE_and_UMAP_using_R_packages
マハラノビス距離とユークリッド距離の違い
マハラノビス距離とユークリッド距離の違い
wada, kazumi
相関のある多変量データで距離を測る場合、我々が通常「距離」と呼ぶユークリッド距離よりも、マハラノビス距離の方が都合がよい。多変量データを変数ごとに標準化してユークリッド距離をとる場合は標準化により変数間の関係性が変わる上に相関関係は考慮されないが、マハラノビス距離を使えば変数間の相関関係も考慮した多変量標準化尺度として使用できる。Rでのデモつき。 このメモでは、説明のために、比較的きれいなデータを用いて、距離の大きさで便宜上外れ値を判定してはいるが、ロバスト性のない平均値ベクトルや共分散行列から計算されるマハラノビス距離はやはり全くロバスト性をもたないため、外れ値検出の目的で使用してはいけない。逆に言えば、マハラノビス距離を用いて外れ値検出を行うためには、平均値ベクトルと共分散行列の代わりに、ロバスト推計した位置と尺度指標を用いれば良い。
MICの解説
MICの解説
logics-of-blue
だいぶ前に大学で発表したMICの解説スライドです。 サイト作ってます。 http://logics-of-blue.com/
Recent Advances on Transfer Learning and Related Topics Ver.2
Recent Advances on Transfer Learning and Related Topics Ver.2
Kota Matsui
転移学習のサーベイ資料(改定版)
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
宏喜 佐野
第31回Tokyo.Rで発表した資料です。Rを用いて主成分分析について解説しています。
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
2014.06.08 「ベイズ推定による多変量解析入門」@広島大学 ベイズ推定とマルコフ連鎖モンテカルロ法について解説しています。 当日動かしたギブスサンプリングのアニメーションは, 以下のサイトで紹介されたコードを参考にしています。 http://qiita.com/yagays/items/5bde6addf228b1fe24e6
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
Okamoto Laboratory, The University of Electro-Communications
今井 俊輔, 岡本 一志: Rによるベイジアンネットワーク入門, パーティクルフィルタ研究会1月実践セミナー, 2017.01.07
DS Exercise Course 1
DS Exercise Course 1
大貴 末廣
Practical data science course at Kyushu University. 九州大学 大学院システム情報科学府の講義「データサイエンス概論第二」,「データサイエンス演習第一」で使用している資料です.
【技術情報協会】人工知能を使ったR&D業務効率化・生産性向上のシステム作り
【技術情報協会】人工知能を使ったR&D業務効率化・生産性向上のシステム作り
Hajime Fujita
1.講演趣旨: 本講演では、研究開発業務の効率化・生産性向上のために人工知能を活用する際の考え方や注意点を、最近の動向、技術的な特性、実際の活用事例などを踏まえて説明します。 人工知能の成果は過熱するブームに便乗して喧伝されることが多いため、「何がどこまで実現できるか」を正確に理解することは、事実を整理しても難しい状況と言えます。そのため、人工知能に対して過大な期待を寄せたまま、対象業務の特性や要素技術の得意・不得意を把握せずに企画を進め、導入に失敗するケースが見られます。 本講演では、研究開発の現場に人工知能を導入する際の取り組み方や、現在の人工知能関連技術の特性に基づく導入検討ステップを順番に説明します。 2.講演項目: ・いま人工知能が注目されている理由 ・人工知能=ビッグデータに対する機械学習の適用 ・ハイプサイクルに沿った「人工知能」のフェーズ ・今回の「人工知能ブーム」の傾向と今後の動向 ・現在の人工知能でいま何がどこまでできるのか ・人工知能の活用事例 ・人工知能ビジネス業界におけるプレイヤー ・人工知能の導入のための注意点 ・知財関連業務に対する人工知能のインパクト ・特許調査と人工知能
More Related Content
What's hot
距離とクラスタリング
距離とクラスタリング
大貴 末廣
距離とクラスタリング
データサイエンス概論第一=1-1 データとは
データサイエンス概論第一=1-1 データとは
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=4-2 確率と確率分布
データサイエンス概論第一=4-2 確率と確率分布
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=0 まえがき
データサイエンス概論第一=0 まえがき
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義.
0 データサイエンス概論まえがき
0 データサイエンス概論まえがき
Seiichi Uchida
データサイエンス概論Ⅰ & Ⅱ(全15単元)の目的と全体像.
データサイエンス概論第一=3-1 線形代数に基づくデータ解析の基礎
データサイエンス概論第一=3-1 線形代数に基づくデータ解析の基礎
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=2-2 クラスタリング
データサイエンス概論第一=2-2 クラスタリング
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義」
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
shima o
2 データのベクトル表現と集合
2 データのベクトル表現と集合
Seiichi Uchida
「データのベクトル表現と集合」に関する初歩
4 データ間の距離と類似度
4 データ間の距離と類似度
Seiichi Uchida
「データ間の距離と類似度」の初歩
データサイエンス概論第一=1-2 データのベクトル表現と集合
データサイエンス概論第一=1-2 データのベクトル表現と集合
Seiichi Uchida
九州大学大学院システム情報科学研究院「データサイエンス実践特別講座」が贈る,数理・情報系『でない』学生さんのための「データサイエンス講義
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Satoshi Kato
All sample codes are available at: https://github.com/katokohaku/tSNE_and_UMAP_using_R_packages
マハラノビス距離とユークリッド距離の違い
マハラノビス距離とユークリッド距離の違い
wada, kazumi
相関のある多変量データで距離を測る場合、我々が通常「距離」と呼ぶユークリッド距離よりも、マハラノビス距離の方が都合がよい。多変量データを変数ごとに標準化してユークリッド距離をとる場合は標準化により変数間の関係性が変わる上に相関関係は考慮されないが、マハラノビス距離を使えば変数間の相関関係も考慮した多変量標準化尺度として使用できる。Rでのデモつき。 このメモでは、説明のために、比較的きれいなデータを用いて、距離の大きさで便宜上外れ値を判定してはいるが、ロバスト性のない平均値ベクトルや共分散行列から計算されるマハラノビス距離はやはり全くロバスト性をもたないため、外れ値検出の目的で使用してはいけない。逆に言えば、マハラノビス距離を用いて外れ値検出を行うためには、平均値ベクトルと共分散行列の代わりに、ロバスト推計した位置と尺度指標を用いれば良い。
MICの解説
MICの解説
logics-of-blue
だいぶ前に大学で発表したMICの解説スライドです。 サイト作ってます。 http://logics-of-blue.com/
Recent Advances on Transfer Learning and Related Topics Ver.2
Recent Advances on Transfer Learning and Related Topics Ver.2
Kota Matsui
転移学習のサーベイ資料(改定版)
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
宏喜 佐野
第31回Tokyo.Rで発表した資料です。Rを用いて主成分分析について解説しています。
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
2014.06.08 「ベイズ推定による多変量解析入門」@広島大学 ベイズ推定とマルコフ連鎖モンテカルロ法について解説しています。 当日動かしたギブスサンプリングのアニメーションは, 以下のサイトで紹介されたコードを参考にしています。 http://qiita.com/yagays/items/5bde6addf228b1fe24e6
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
Okamoto Laboratory, The University of Electro-Communications
今井 俊輔, 岡本 一志: Rによるベイジアンネットワーク入門, パーティクルフィルタ研究会1月実践セミナー, 2017.01.07
What's hot
(20)
距離とクラスタリング
距離とクラスタリング
データサイエンス概論第一=1-1 データとは
データサイエンス概論第一=1-1 データとは
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=2-1 データ間の距離と類似度
データサイエンス概論第一=4-2 確率と確率分布
データサイエンス概論第一=4-2 確率と確率分布
データサイエンス概論第一=0 まえがき
データサイエンス概論第一=0 まえがき
0 データサイエンス概論まえがき
0 データサイエンス概論まえがき
データサイエンス概論第一=3-1 線形代数に基づくデータ解析の基礎
データサイエンス概論第一=3-1 線形代数に基づくデータ解析の基礎
データサイエンス概論第一=2-2 クラスタリング
データサイエンス概論第一=2-2 クラスタリング
データサイエンス概論第一=8 パターン認識と深層学習
データサイエンス概論第一=8 パターン認識と深層学習
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
2 データのベクトル表現と集合
2 データのベクトル表現と集合
4 データ間の距離と類似度
4 データ間の距離と類似度
データサイエンス概論第一=1-2 データのベクトル表現と集合
データサイエンス概論第一=1-2 データのベクトル表現と集合
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
マハラノビス距離とユークリッド距離の違い
マハラノビス距離とユークリッド距離の違い
MICの解説
MICの解説
Recent Advances on Transfer Learning and Related Topics Ver.2
Recent Advances on Transfer Learning and Related Topics Ver.2
はじめよう多変量解析~主成分分析編~
はじめよう多変量解析~主成分分析編~
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
Similar to データサイエンスことはじめ
DS Exercise Course 1
DS Exercise Course 1
大貴 末廣
Practical data science course at Kyushu University. 九州大学 大学院システム情報科学府の講義「データサイエンス概論第二」,「データサイエンス演習第一」で使用している資料です.
【技術情報協会】人工知能を使ったR&D業務効率化・生産性向上のシステム作り
【技術情報協会】人工知能を使ったR&D業務効率化・生産性向上のシステム作り
Hajime Fujita
1.講演趣旨: 本講演では、研究開発業務の効率化・生産性向上のために人工知能を活用する際の考え方や注意点を、最近の動向、技術的な特性、実際の活用事例などを踏まえて説明します。 人工知能の成果は過熱するブームに便乗して喧伝されることが多いため、「何がどこまで実現できるか」を正確に理解することは、事実を整理しても難しい状況と言えます。そのため、人工知能に対して過大な期待を寄せたまま、対象業務の特性や要素技術の得意・不得意を把握せずに企画を進め、導入に失敗するケースが見られます。 本講演では、研究開発の現場に人工知能を導入する際の取り組み方や、現在の人工知能関連技術の特性に基づく導入検討ステップを順番に説明します。 2.講演項目: ・いま人工知能が注目されている理由 ・人工知能=ビッグデータに対する機械学習の適用 ・ハイプサイクルに沿った「人工知能」のフェーズ ・今回の「人工知能ブーム」の傾向と今後の動向 ・現在の人工知能でいま何がどこまでできるのか ・人工知能の活用事例 ・人工知能ビジネス業界におけるプレイヤー ・人工知能の導入のための注意点 ・知財関連業務に対する人工知能のインパクト ・特許調査と人工知能
やはりデータ設計は大切です 藤原紀章
やはりデータ設計は大切です 藤原紀章
Noriaki Fujiwara
data management,modeling,EA
機械学習システム開発案件の事例紹介
機械学習システム開発案件の事例紹介
BrainPad Inc.
「ブレインパッドとエウレカが語る、データ分析と機械学習の活用」資料
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
Shunsuke Nakamura
2017-07-17 サポーターズ@京都で使ったスライド
20181219_全部見せます、データサイエンティストの仕事
20181219_全部見せます、データサイエンティストの仕事
Shunsuke Nakamura
以下サポーターズイベントで登壇した際のスライド https://supporterzcolab.com/event/657/
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
Dell TechCenter Japan
2014年10月15日開催 デル株式会社主催「Dell Solutions Roadshow (DSR) 2014 Tokyo」講演資料 タイトル: ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション 講師: 伊藤忠テクノソリューションズ株式会社 ビックデータアナリティクス部 シニアエンジニア 小平 啓一 氏 内容: ビックデータを統計解析の手法を使って分析・予測・モデリングするビジネスアナリティクスによって新しいビジネスチャンスが生まれている。 BAシステムとしてSAS Visual Analyticsの機能とそれを支えるDELL PowerEdge VRTXの実力に迫る。
ジャストシステムの形態素解析技術 その2 機械学習編
ジャストシステムの形態素解析技術 その2 機械学習編
JustSystems Corporation
ジャストシステムの形態素解析技術 その2 機械学習編
データ分析を武器にしたエンジニアの道の拓き方
データ分析を武器にしたエンジニアの道の拓き方
mayu tech
データ分析の知識と技術を活かしてエンジニアとしてのスキルやキャリアをどのように築いていくかなどをまとめています
やはりデータ設計は大切です 藤原紀章
やはりデータ設計は大切です 藤原紀章
Noriaki Fujiwara
データモデリングについて簡単に整理した。
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
Shunsuke Nakamura
2017-10-02 マイクロソフトセミナーで使用したスライド
確率統計-機械学習その前に
確率統計-機械学習その前に
Hidekatsu Izuno
2021/11/20 内容や記載を大幅に拡充しました(合わせて SpeakerDeckに移動しました) https://speakerdeck.com/hidekatsu_izuno/que-lu-tong-ji-ji-jie-xue-xi-sofalseqian-ni 社内勉強会に流用予定の資料です。変なところがあったら連絡いただきたく。
20190922_6_設備保全におけるディープラーニングの活用
20190922_6_設備保全におけるディープラーニングの活用
IoTビジネス共創ラボ
IoTビジネス共創ラボ 第5回勉強会
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
Masatsugu Matsushita
下記の会の感想 https://kichijojipm.connpass.com/event/315276/presentation/
Code for Japan Summit 2019 --- BAD OpenData Kuyodera
Code for Japan Summit 2019 --- BAD OpenData Kuyodera
ssuserc75473
Code for Japan Summit 2019 の BADオープンデータ供養寺<一周忌>のセッションのスライド資料のひとつです。
ITエンジニアのためのAI基礎2020
ITエンジニアのためのAI基礎2020
Keisuke Tameyasu
ITシステムの開発を主にやっています。為安圭介です。 数年間、リーダという役割をいただいて、数十名のチーム運営を経験してきました。 今回は、自分でも未だにちゃんと理解していないような気がするAIの基礎について、あらためてまとめてみました。 このスライドをまとめる間に、令和1年が令和2年になってしまいました。
RandExcel
RandExcel
Takanori Omote
エクセルとRを使った分析講座の資料一部抜粋
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
HironoriTAKEUCHI1
JST未来社会 未来社会創造事業 機械学習を用いたシステムの高品質化・実用化を加速する”Engineerable AI”(eAI)プロセスパターンチーム による機械学習応用システムのアーキテクチャ・デザインパターンの整理
非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長
Keiko Inagaki
リブセンスのプロダクトマネージャーが普段どのようにSQLを活用しているか・またSQL活用で事業成長にどんな嬉しいことがあるかを具体例を交えてご紹介します。
深層学習よもやま話
深層学習よもやま話
Hiroshi Maruyama
Deep Learning Labでお話したよもやま話です。
Similar to データサイエンスことはじめ
(20)
DS Exercise Course 1
DS Exercise Course 1
【技術情報協会】人工知能を使ったR&D業務効率化・生産性向上のシステム作り
【技術情報協会】人工知能を使ったR&D業務効率化・生産性向上のシステム作り
やはりデータ設計は大切です 藤原紀章
やはりデータ設計は大切です 藤原紀章
機械学習システム開発案件の事例紹介
機械学習システム開発案件の事例紹介
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで V e-1
20181219_全部見せます、データサイエンティストの仕事
20181219_全部見せます、データサイエンティストの仕事
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
ジャストシステムの形態素解析技術 その2 機械学習編
ジャストシステムの形態素解析技術 その2 機械学習編
データ分析を武器にしたエンジニアの道の拓き方
データ分析を武器にしたエンジニアの道の拓き方
やはりデータ設計は大切です 藤原紀章
やはりデータ設計は大切です 藤原紀章
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
データサイエンティストに聞く!今更聞けない機械学習の基礎から応用まで Vm 1
確率統計-機械学習その前に
確率統計-機械学習その前に
20190922_6_設備保全におけるディープラーニングの活用
20190922_6_設備保全におけるディープラーニングの活用
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
本の感想共有会「データモデリングでドメインを駆動する」本が突きつける我々の課題について
Code for Japan Summit 2019 --- BAD OpenData Kuyodera
Code for Japan Summit 2019 --- BAD OpenData Kuyodera
ITエンジニアのためのAI基礎2020
ITエンジニアのためのAI基礎2020
RandExcel
RandExcel
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
機械学習応用システムのアーキテクチャ・デザイパターン(2020-07 ドラフトバージョン))
非エンジニアのSQL活用が加速させる事業成長
非エンジニアのSQL活用が加速させる事業成長
深層学習よもやま話
深層学習よもやま話
データサイエンスことはじめ
1.
九州大学 大学院システム情報科学研究院 情報知能工学部門 データサイエンス実践特別講座 備瀬竜馬,Diego Thomas,
末廣 大貴 「DSことはじめ」
2.
データサイエンスに必要なスキル 2 データ解析スキル 検定、クラスタリング、回帰、 主成分分析、・・・ 概論一で学習 プログラミングスキル 解析のための具体的なデータ加工処理を コンピュータに指示 データを集めて後、実際にこれらの分析を行うには? 概論二・演習一 で学習
3.
Excel じゃダメ? 「まずは Excel
で見てみる」は大事 データの集計,簡単な可視化 Excel で完結するのであればそれでヨシ もっと高度な分析がしたい! 統計分析,機械学習, エクセルじゃ開けない! 3
4.
本日の講義内容 データサイエンス技術のプログラム実践前の準備 プログラムの基本的な内容を勉強する pythonのインストール コンピュータに命令する:コンソール上のコマンド コンピュータにまとめて命令:プログラムコード 演習問題 4
5.
プログラムの準備 Pythonのインストール 5
6.
プログラムとは コンピュータに対する命令の記述 命令は何語? C Java R Python 6
7.
Python のインストール 7 https://docs.continuum.io/anaconda/install 以下の web
site へ
8.
Python のインストール 8 Windows の人 macの人
9.
Python のインストール 9 64 bit 3.7
version を使います
10.
Python のインストール 10 たぶんいらない
11.
Python のインストール 11 ダウンロードしたファイルを開く
12.
12 Mac の人
13.
13 Windows の人
14.
Anaconda 1/3 Anaconda Navigator
を起動 14 こんなやつ
15.
Anaconda 2/3 15 右(「わかった,二度と見せるな」)を押そう 左を押すと,起動するたびに現れます
16.
Anaconda 3/3 16 とりあえずここをクリック 「Spyder」が起動します
17.
Welcome to Python! 17
18.
Welcome to Python! 18
19.
ここだけは必ずチェック! 19 番号が違うと違う動作をする
20.
コンピュータに指示を出す Python で あそんでみよう
21.
まずはここに注目 (コンソールと呼ばれる部分) 21 狭いので 広げよう!
22.
まずはここに注目 (コンソールと呼ばれる部分) 22
23.
大事な「おまじない」 今後,spyder を起動したらまずはじめに 必ずやること! import numpy
as np と打って enter キーを押す 23
24.
コンピュータに指示を出す 文字の表示 お約束のHello World! 24
25.
Hello World コンソールのところで Print(“Hello
World”) と入力 return キーを押す(実行) 25
26.
練習1:文字を変えてみよう! コンソールのところで 好きな言葉を“
”に入れて表示させよう Print(“ ”) と入力 return キーを押す(実行) 26
27.
コンピュータに指示を出す 四則演算 たす,ひく,かける,わる 27
28.
足し算 + 例 28
29.
引き算 - 例 29
30.
掛け算 * (アスタリスク)を使う 例 30
31.
割り算 / (スラッシュ)を使う 例 31
32.
括弧 ()内を優先的に計算 (1-4)*5 32
33.
練習2:四則演算 小学生の問題) A君が八百屋で100円のリンゴを5個と400円のイチゴを買いました。
合計にいくらになるかプログラムで計算させてみよう! 自分の BMI をプログラムで計算してみよう ヒント:BMI は 体重 ÷ (身長×身長) 33 ※体重は kg, 身長は m
34.
変数 34
35.
変数 (1) 変数:お好きな数を保存する「箱」 =を使って保存 (左側が「箱の名前」,右側がお好きな数) a=5 b=“Monday” 実は文字列でも
OK ! 35 5 a
36.
変数:演算 (2) 変数同士の演算 a=5 b=3 36 5 a 3 b a b
?
37.
変数 :代入(2) 変数同士の演算 a=5, b=3 37 a
b 5 3 a = b とすると、 a の中身を捨てて、 b の中身をa に入れる
38.
変数 (3) 変数の中身を変える a=5 a=20 b=3
b=10 38 直接数字を書いて演算すると、毎回書き換える必要がある 変数で演算すると、同じ式でO.K.
39.
変数 (4) データ1 a=5, b=4,
c=1, d=6, e=29, f=12 (5+4)*(1+6)/29 + 12*5*4*(6-1) データ2 a=8, b=3, c=2, d=7, e=20, f=18 (8+3)*(2+7)/20 + 18*8*3*(7-2) 毎回すべて書き換える? 式で記述すれば、中身を変えるだけでO.K. (a+b)*(c+d)/e + f*a*b*(d-c) 39 プログラムの大きなメリット! 同じ命令文が違うデータに 使える
40.
変数 (5):名前の付け方 例: name=“John” age=30 weight=56 height=1.68 BMI=weight/(height*height) print( name
) print( age ) print( weight ) print( height ) print( BMI ) 40 箱の名前はわかるよう につけよう!
41.
変数 (6) 良くない例: a=“John” b=30 c=56 d=1.68 えっと BMI
の計算式は・・・e=c/(d*d) 41 アドバイス:変数名はなんでもいいけど, できる限り意味がわかりやすいように用意する a name
42.
練習3:変数 変数を使って、自分の BMI
をプログラムで計算し てみよう ヒント:BMI は 体重 ÷ (身長×身長) weight = 自分の体重 height = 自分の身長 42 ※体重は kg, 身長は m
43.
コンピュータに指示を出す 関数 43
44.
「材料」と「道具」(1) 44 材料(変数) 道具(関数) 切る 皮をむく 煮る print や +や-も 道具の一種
45.
関数(1) 45 例) 平方根( )を計算する関数(道具) sqrt (平方根は、英語で’square
root’でその略) 道具を使うためのおまじない import math ライブラリ 道具はまとめて整理されている 調理する道具は台所、 トンカチ等の工具は工具箱 mathにsqrtがある 仕舞っている処から出して、 道具を使える状態にしている
46.
関数(2) 46 他にもいろいろなライブラリ、関数がある import numpy
numpy.round(3.8) 小数点以下を四捨五入 毎回ライブラリ名をフルネームで書くのは面倒:短縮しちゃえ! import numpy as np
47.
練習4:関数の利用 関数を使って計算しよう! 81の平方根を計算しよう
256の平方根を計算しよう 9.4を四捨五入しよう 9.7を四捨五入しよう 自分で関数をWebで調べて使ってみよう! 絶対値を求める関数を調べてみよう -5の絶対値を関数を使って計算しよう 47 ヒント)Python 絶対値 でGoogleで検索してみよう
48.
基本注意事項 ※知ってる人は遠慮なく飛ばしてください
49.
全角文字,日本語入力を避ける 49 日本語入力するとエラーが出る a + b 全角スペース
50.
全角文字,日本語入力を避ける(2) できる限り全角文字,日本語は使わない 全角の空白(スペース)に注意! (エラーになる&見つけづらい) ファイル名も半角英数字にしよう OK:shincho_taiju.xlsx, height_weight.csv NG:身長体重データ.csv 半角カタカナ(アイウ)とかもやめよう 50
51.
コピー & ペースト(コピペ) 手順1 文章を選択(マウス,トラックパッド) 右クリック
→ 「コピー」 貼りつけたいところで右クリック→「ペースト」 手順 2 文章を選択(shift押したまま矢印キー) Ctrl+c (Windows), command+c (Mac) 貼りつけたいところで Ctrl+v (Windows), command+v(Mac) 51
52.
カット & ペースト 手順1 文章を選択(マウス,トラックパッド) 右クリック
→ 「カット」 貼りつけたいところで右クリック→「ペースト」 手順 2 文章を選択(shift押したまま矢印キー) Ctrl+x (Windows), command+x (Mac) 貼りつけたいところで Ctrl+v (Windows), command+v(Mac) 52
53.
プログラムにまとめて支持を出す コードの書き方 一回一回命令するんじゃなくてまとめて 53
54.
こんどはこっち(エディタ) 54 命令集を書く!
55.
エディタの使い方(開く,保存) 55 ① ファイルを開く 左:新しいファイル 右:既存のファイル (拡張子が
.py のファイル) ② ファイルを保存する リマインド:ファイル名は半角英数で!
56.
エディタの使い方(実行) 56 ③ 開いているファイルの命令文を全部実行 ④ 選択している部分を実行 (マウスでもよいし, shift
押しっぱなしで矢印キーでもOK)
57.
エディタの使い方(実行) ③ 開いているファイルの命令文を全部実行 57 editor_ex.py を参照
58.
エディタの使い方(実行) ④ 選択している部分を実行 58 実行したい部分を選択(青くなる)
59.
コメントアウト メモ書き 書いたけど一時的に実行したくない場合 行頭に # で一行コメントアウト ’’’
または “““ で囲んだ部分をコメントアウト 59
60.
演習 60
61.
演習1:BMI 変数を使ってBMIを計算するコードを書いてみよう ヒント:BMI は 体重
÷ (身長×身長) 変数の値を変えて、それぞれ計算してみよう A君:1.7m, 62kg B君:1.6m, 75kg C君:1.8m, 73kg 61 ※体重は kg, 身長は m
62.
演習2:関数の呼び出し 求めたBMIを四捨五入してみよう ヒント:round 求めたBMIを切り捨ててみよう ヒント:「python
切り捨て」でGoogleで検索 求めたBMIを切り上げてみよう 変数の値を変えて、それぞれ計算してみよう A君:1.7m, 62kg B君:1.6m, 75kg C君:1.8m, 73kg 62
63.
演習3:関数の呼び出し 演習2のコードをエディタに書いてまとめて実行してみよう! 求めたBMIを四捨五入してみよう ヒント:round 求めたBMIを切り捨ててみよう ヒント:「python
切り捨て」でGoogleで検索 求めたBMIを切り上げてみよう 変数の値を変えて、それぞれ計算してみよう A君:1.7m, 62kg B君:1.6m, 75kg C君:1.8m, 73kg 63
64.
演習:進みが早い人用 64
65.
演習4:print文の応用 変数aに5を代入して、 print文で「aの中身は5です。」と表示してみよう。 ヒント)「print format python」で検索 65
66.
演習5:print文の応用 演習3で作成したエディタファイルに以下のprint文 を追加してまとめて実行してみよう。 「A君のBMIはxxxです。」と表示 「B君のBMIはxxxです。」と表示 「C君のBMIはxxxです。」と表示 ※)xxxの部分はそれぞれ計算したBMIが入る 66
Download now