Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
西岡 賢一郎
PPTX, PDF
471 views
東大生向けデータ解析講座 第1回 2017/12/27
解析初心者の東大生向けの講座の第一回。Pythonの基礎を演習形式で講義。
Data & Analytics
◦
Related topics:
Data Science Insights
•
Data Analysis Insights
•
Read more
3
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 15
2
/ 15
3
/ 15
4
/ 15
5
/ 15
6
/ 15
7
/ 15
8
/ 15
9
/ 15
10
/ 15
11
/ 15
12
/ 15
13
/ 15
14
/ 15
15
/ 15
More Related Content
PPTX
東大生向けデータ解析講座 第4回 2018/01/05
by
西岡 賢一郎
PPTX
東大生向けデータ解析講座 第3回 2018/01/04
by
西岡 賢一郎
PPTX
東大生向けデータ解析講座 第2回 2017/12/29
by
西岡 賢一郎
PPTX
TokyoWebmining
by
Ryoji Yanashima
PDF
IA14
by
mfumi
PDF
データベースシステム論14 - 総復習!
by
Shohei Yokoyama
PDF
TokyoR42_around_chaining
by
TokorosawaYoshio
PDF
Introduction of neo4j
by
Ito Kunihiko
東大生向けデータ解析講座 第4回 2018/01/05
by
西岡 賢一郎
東大生向けデータ解析講座 第3回 2018/01/04
by
西岡 賢一郎
東大生向けデータ解析講座 第2回 2017/12/29
by
西岡 賢一郎
TokyoWebmining
by
Ryoji Yanashima
IA14
by
mfumi
データベースシステム論14 - 総復習!
by
Shohei Yokoyama
TokyoR42_around_chaining
by
TokorosawaYoshio
Introduction of neo4j
by
Ito Kunihiko
What's hot
PDF
データベースシステム論15 - 関係データモデル以外のデータベース
by
Shohei Yokoyama
PPTX
HTML5 Conference LT TensorFlow
by
isaac-otao
PDF
Code for Japan Summit 2019 --- BAD OpenData Kuyodera
by
ssuserc75473
PDF
時系列データ型(Int4)をつくってみた
by
Toshi Harada
PPTX
Introduction of network analysis with Google Colaboratory -- Network Metrics
by
tm1966
PPTX
Rゼミ 1
by
tarokun3
PDF
競技プログラミング練習会2015 Normal 第4回
by
Hideaki Nagamine
PDF
競技プログラミング練習会2015 Normal 第2回
by
Hideaki Nagamine
PDF
データベースシステム論01 - ガイダンス
by
Shohei Yokoyama
PDF
データベースシステム論05 - PostgreSQLのインストール
by
Shohei Yokoyama
PDF
二階堂愛と二階堂藍の違いについて
by
show you
PDF
池袋物理学勉強会第一回の予習に関して
by
GM3D
PDF
トポロジカルデータ解析(仮)
by
Takahiro Yoshinaga
PPTX
A Road map of Data Analysis for Visualization with D3.js
by
博三 太田
PDF
ReNom 2016 ~ 2018振り返り
by
ReNom User Group
PDF
機械学習ライブラリ : TensorFlow
by
エンジニア勉強会 エスキュービズム
PPTX
Findings from visualizing_massive_data
by
Toshiyuki Shimono
PDF
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
by
Eric Sartre
PDF
データベースシステム論06 - SQL基礎演習1 データの定義と操作
by
Shohei Yokoyama
PDF
論文読み 20170525
by
Taichi Iki
データベースシステム論15 - 関係データモデル以外のデータベース
by
Shohei Yokoyama
HTML5 Conference LT TensorFlow
by
isaac-otao
Code for Japan Summit 2019 --- BAD OpenData Kuyodera
by
ssuserc75473
時系列データ型(Int4)をつくってみた
by
Toshi Harada
Introduction of network analysis with Google Colaboratory -- Network Metrics
by
tm1966
Rゼミ 1
by
tarokun3
競技プログラミング練習会2015 Normal 第4回
by
Hideaki Nagamine
競技プログラミング練習会2015 Normal 第2回
by
Hideaki Nagamine
データベースシステム論01 - ガイダンス
by
Shohei Yokoyama
データベースシステム論05 - PostgreSQLのインストール
by
Shohei Yokoyama
二階堂愛と二階堂藍の違いについて
by
show you
池袋物理学勉強会第一回の予習に関して
by
GM3D
トポロジカルデータ解析(仮)
by
Takahiro Yoshinaga
A Road map of Data Analysis for Visualization with D3.js
by
博三 太田
ReNom 2016 ~ 2018振り返り
by
ReNom User Group
機械学習ライブラリ : TensorFlow
by
エンジニア勉強会 エスキュービズム
Findings from visualizing_massive_data
by
Toshiyuki Shimono
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
by
Eric Sartre
データベースシステム論06 - SQL基礎演習1 データの定義と操作
by
Shohei Yokoyama
論文読み 20170525
by
Taichi Iki
Similar to 東大生向けデータ解析講座 第1回 2017/12/27
PPTX
220427-pydata 統計・データ分析 特集
by
Takuya Nishimoto
PPTX
厳研Python講座1回目
by
tan tan
PDF
TokyoR101_BeginnersSession2.pdf
by
kotora_0507
PPTX
Analytics Environment
by
Yuu Kimy
PDF
S02 t2 my_historyofpythonlearning
by
Takeshi Akutsu
PDF
Python for Data Anaysis第2回勉強会4,5章
by
Makoto Kawano
PPTX
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識 第3版
by
Katsuhiro Morishita
PDF
Rブートキャンプ
by
Kosuke Sato
PDF
科学技術計算関連Pythonパッケージの概要
by
Toshihiro Kamishima
PPTX
Pyladies Tokyo meet up #6
by
Katayanagi Nobuko
PDF
JupyterLabを中心とした快適な分析生活
by
Classi.corp
PPTX
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
by
Katsuhiro Morishita
PDF
20181114 r
by
Yutaka Terasawa
PDF
PyData Tokyo Tutorial & Hackathon #1
by
Akira Shibata
PPTX
統計環境R_はじめの一歩2016
by
wada, kazumi
PPTX
東大生向けデータ解析講座 データ解析前処理
by
西岡 賢一郎
PDF
データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831
by
Yusaku Kinoshita
220427-pydata 統計・データ分析 特集
by
Takuya Nishimoto
厳研Python講座1回目
by
tan tan
TokyoR101_BeginnersSession2.pdf
by
kotora_0507
Analytics Environment
by
Yuu Kimy
S02 t2 my_historyofpythonlearning
by
Takeshi Akutsu
Python for Data Anaysis第2回勉強会4,5章
by
Makoto Kawano
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識 第3版
by
Katsuhiro Morishita
Rブートキャンプ
by
Kosuke Sato
科学技術計算関連Pythonパッケージの概要
by
Toshihiro Kamishima
Pyladies Tokyo meet up #6
by
Katayanagi Nobuko
JupyterLabを中心とした快適な分析生活
by
Classi.corp
PythonとRによるデータ分析環境の構築と機械学習によるデータ認識
by
Katsuhiro Morishita
20181114 r
by
Yutaka Terasawa
PyData Tokyo Tutorial & Hackathon #1
by
Akira Shibata
統計環境R_はじめの一歩2016
by
wada, kazumi
東大生向けデータ解析講座 データ解析前処理
by
西岡 賢一郎
データ分析-の波乗り遅れた気がしてる人のための Python×データ分析の超基礎の基礎 v1.0-20160831
by
Yusaku Kinoshita
More from 西岡 賢一郎
PPTX
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
by
西岡 賢一郎
PPTX
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
by
西岡 賢一郎
PPTX
Amazon SageMakerのNotebookからJobを作成する
by
西岡 賢一郎
PPTX
リモートワークで知っておきたい コミュニケーション時の過大な期待
by
西岡 賢一郎
PPTX
リモートワークで意識すべき7つのこと
by
西岡 賢一郎
PPTX
Amazon SageMaker ML Governance 3つの機能紹介
by
西岡 賢一郎
PPTX
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
by
西岡 賢一郎
PPTX
機械学習の特徴量を管理するAmazon SageMaker Feature Store
by
西岡 賢一郎
PPTX
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
by
西岡 賢一郎
PPTX
Amazon SageMakerでカスタムコンテナを使った学習
by
西岡 賢一郎
PPTX
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
by
西岡 賢一郎
PPTX
Amazon AthenaでSageMakerを使った推論
by
西岡 賢一郎
PPTX
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
by
西岡 賢一郎
PPTX
未来のカタチ x AI
by
西岡 賢一郎
PPTX
TorchDataチュートリアル解説
by
西岡 賢一郎
PPTX
Amazon SageMaker JumpStart
by
西岡 賢一郎
PPTX
Amazon SageMaker Studio Lab紹介
by
西岡 賢一郎
PPTX
Amazon SageMaker Canvasを使ったノーコード機械学習
by
西岡 賢一郎
PPTX
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
by
西岡 賢一郎
PPTX
H2O Waveを使ったAIアプリケーション作成入門
by
西岡 賢一郎
Amazon SageMaker Foundation Modelsで事前学習済みモデルを利用する
by
西岡 賢一郎
Amazon SageMaker Ground Truthを使って手動のラベル付けを簡略化する
by
西岡 賢一郎
Amazon SageMakerのNotebookからJobを作成する
by
西岡 賢一郎
リモートワークで知っておきたい コミュニケーション時の過大な期待
by
西岡 賢一郎
リモートワークで意識すべき7つのこと
by
西岡 賢一郎
Amazon SageMaker ML Governance 3つの機能紹介
by
西岡 賢一郎
Feature StoreのOnline StoreとOffline Storeの違いについて理解する
by
西岡 賢一郎
機械学習の特徴量を管理するAmazon SageMaker Feature Store
by
西岡 賢一郎
機械学習用のデータを準備する Amazon SageMaker Data Wrangler - ノーコードで前処理から学習まで
by
西岡 賢一郎
Amazon SageMakerでカスタムコンテナを使った学習
by
西岡 賢一郎
Amazon SageMakerでscikit-learnで作ったモデルのEndpoint作成
by
西岡 賢一郎
Amazon AthenaでSageMakerを使った推論
by
西岡 賢一郎
Amazon Athenaで独自の関数を使う Amazon Athena UDF - AthenaでTweetの感情分析
by
西岡 賢一郎
未来のカタチ x AI
by
西岡 賢一郎
TorchDataチュートリアル解説
by
西岡 賢一郎
Amazon SageMaker JumpStart
by
西岡 賢一郎
Amazon SageMaker Studio Lab紹介
by
西岡 賢一郎
Amazon SageMaker Canvasを使ったノーコード機械学習
by
西岡 賢一郎
PMFを目指すプロダクト開発組織が組織拡大するときににやるべきこと
by
西岡 賢一郎
H2O Waveを使ったAIアプリケーション作成入門
by
西岡 賢一郎
東大生向けデータ解析講座 第1回 2017/12/27
1.
東大生向けデータ解析講座 第1回 2017/12/27 3idea Inc.
CEO 西岡 賢一郎
2.
スケジュール ● 12/27(水):データ解析のための環境構築(Python3, jupyter
notebook等) ○ Python3の簡単な紹介 ○ Python3の基本的な構文 ○ Jupyter notebookを使って実際にPython3を試してみる ● 12/29(金):numpy, pandasの操作 ● 1/4(木):sklearnを使った機械学習による予測 ● 1/5(金):応用(選択テーマ、若しく持ち込みテーマ)
3.
対象者 ● プログラミング初心者で研究に使いたい方 ● 短期間でPython環境構築から解析の基礎技術を身につけたい方 ●
今後自分で機械学習をやっていきたい方 ● データサイエンスに興味がある方 ● 今後自分の分野でもAIの応用が進んでいく中、自分でも機械学習の基礎を 修めておきたい方
4.
● 2004年、東京大学理科2類入学後、教養学部広域科学科に進学し情報系研 究室に入りデータマイニング・機械学習を研究、総合文化研究科に進学し 修士・博士を取得 ● 株式会社トライディアを博士課程在籍中の2012年に設立 ●
大学時代は体操部に所属 自己紹介
5.
学生時代のプログラミング ● 教養学部に進学したが、実際はプログラミング必須の学科だった。大学4 年生で情報系の研究室に所属したことをきっかけに本格的にプログラミン グを始める ● はじめはC++,
R, Rubyを勉強。Ruby on Railsというウェブフレームワー クでアプリケーション開発を始める。他にもiOS, androidの開発など色々 な物に手を出したが。研究などをきっかけにPythonに取り組み、解析系の 仕事を現在も行っている ● 文系学生にプログラミングを教える活動や、三鷹寮にてプログラミングコ ミュニティーを作り解析者やウェブアプリ開発者の仲間を増やす活動をし ていた
6.
Python 2とPython 3について ●
書籍やネットで調べ物をしているとPython2の情報が多いが、Python2は 2020年までのサポートとなっているので、これから解析を始める人は Python3をおすすめ。 ● Python2のサポートは2020年まで ● Python2の書籍などをPython3で再現するときに、初心者がはまりそうな 部分 ○ print文 ○ 整数値の割り算: ○ Unicodeの扱い ○ map, filter関数の返り値
7.
print文 Python3ではprintが関数となっており、括弧が必須となっている Python2 Python3 >>> print
1 File "<stdin>", line 1 print 1 ^ SyntaxError: Missing parentheses in call to 'print' >>> print 1, 2 File "<stdin>", line 1 print 1, 2 ^ SyntaxError: Missing parentheses in call to 'print' >>> print(1) 1 >>> print(1, 2) 1 2 >>> print 1 1 >>> print 1, 2 1 2 >>> print(1) 1 >>> print(1, 2) (1, 2)
8.
整数値での割り算 Python2では商が返ってきていたが、Python3では小数が返ってくる Python2 Python3 >>> 1/2 0 >>>
3/2 1 >>> 1.0/2 0.5 >>> 1/2 0.5 >>> 3/2 1.5 >>> 1.0/2 0.5
9.
Unicodeの扱い Python3ではテキストがUnicodeとなったため扱いやすくなった Python2 Python3 >>> '本郷' '¥xe6¥x9c¥xac¥xe9¥x83¥xb7' >>>
u'本郷' u'¥u672c¥u90f7' >>> '本郷'[0] '¥xe6' >>> '本郷' '本郷' >>> u'本郷' '本郷' >>> '本郷'.encode('utf-8') b'¥xe6¥x9c¥xac¥xe9¥x83¥xb7' >>> '本郷'[0] '本'
10.
map, filter関数の返り値 Python2では商が返ってきていたが、Python3では小数が返ってくる Python2 Python3 >>>
map(lambda x: x*2, [1,2,3]) [2, 4, 6] >>> filter(lambda x: x%2 == 0, [1,2,3]) [2] >>> map(lambda x: x*2, [1,2,3]) <map object at 0x7f57df3ae470> >>> list(map(lambda x: x*2, [1,2,3])) [2, 4, 6] >>> filter(lambda x: x%2 == 0, [1,2,3]) <filter object at 0x7f57df3ae470> >>> list(filter(lambda x: x%2 == 0, [1,2,3])) [2] ここでは説明を省略するが、lambdaは無名関数と呼 ばれるもの。lambdaに関しては演習のときに説明
11.
Pythonの環境構築 ● 手っ取り早く環境構築したい人 Anaconda(https://www.anaconda.com/download/#windows)のインストー ルがおすすめ。解析に必要なものがまとめて入るが、他の開発環境への影 響を与える場合がある。研究などで簡単に解析したい人はこちらで十分。 ● 自分で本格的に今後もPythonを勉強していきたい人 Pyenvをインストールし、一つ一つパッケージを入れていく。
12.
習うより慣れる: Jupyter Notebookを使ってみる ●
consoleでjupyter notebookを起動する人 jupyter notebookとコマンドをうつ ● Anacondaを使っている人 Anaconda Navigatorを起動したのち, Jupyter Notebookをメニューから選 んで起動
13.
Jupyter Notebookの使い方 ● ノートブックを作成したいフォルダ階層で、「New」ボタン
⇒ 「Python3」を選択し、ノートブックを作成 ● Command Mode(Esc)とEdit Mode(Enter or セル内をクリック)がある ● Edit Modeでセルと呼ばれるスペースに Python のコードを入力し実行 ○ Ctrl + Enter: セル内のプログラムを実行 ○ Shift + Enter: プログラムを実行して下にセルを追加 ● Command Modeでhを入力すると、各種ショートカットが表示 ● 上部のKernelから「Interrupt」「Restart」「Restart & Run All」等も利用 できる
14.
Python 基本 ● 最低限知っておくべきデータ型 ○
int: 整数 (1 ,2, 3など) ○ float: 小数点 (1.0, 2.1, 3.3333など) ○ str: 文字列 (‘a’, ‘b’, “本郷”, など) ○ その他複素数などを定義する型なども存在 ● リスト・タプル・辞書 ○ リスト: 配列と呼ばれるもの。複数のデータをまとめる ([1,2,3], [10, 20]など) ○ タプル: リストと似ていてるが、中身の変更ができない ((1,2,3), (10, 20)など) ○ 辞書: キーと値のペアからなる ({ ‘a’: 1, ‘b’, 10}, { 1: 10, ‘x’: 100}など) ● 四則演算: いわゆる計算を行うもの (+ - * / など) ● 比較演算子: 条件を満たすかどうかをTrue, Falseで返す (==, !=, <, >, <=, >=) ● ブール演算子 (and, or, not)
15.
Python 基本 ● 変数の定義
(a = 1, x = ‘aaa’) ● インデント: ブロックを定義 (Cなどにおける{}に対応するもの) ● if文: 条件を定義 ● for文: 繰り返しの計算 ● 関数: 特定の演算を定義 (def, lambda)
Download