Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Pythonの処理系はどのように実装され,どのよう
に動いているのか? 我々はその実態を調査すべ
くアマゾンへと飛んだ.
KMC春合宿2017 @utgwkk
私について
● @utgwkk
● KMC-ID: utgw
● 京都大学工学部情報学科
計算機科学コース2回生
● デレステ: 581948763
講座の対象・予定
● C言語のような静的型付け・コンパイル言語しか触ったことがない人向け
● 動的型付け・インタプリタ言語の中身が気になる人向け
● Python の標準実装である CPython がどう実装されているのか見ていく
○ 他の実装...
今日話すこと
1. Python の概要
2. Python のオブジェクトの構造体による内部表現
3. Python の主要なデータ型の実装
4. Python の関数・モジュールの実装
5. Python のコードの実行・仮想機械について
1. Python の概要
2. Python のオブジェクトの構造体による内部表現
3. Python の主要なデータ型の実装
4. Python の関数・モジュールの実装
5. Python のコードの実行・仮想機械について
どのように実装...
Python の概要
Python とは
● Guido van Rossum が作ったプログラミング言語
● 動的型付けプログラミング言語
● インタプリタ言語
● 最新バージョンは 3.6 (2016/12/23)
Python の特徴
● 動的型付けプログラミング言語である
○ 型ヒントが最近導入された
● インタプリタ言語である
● インデントによってブロックを表現する (オフサイドルール)
● コードがシンプルで扱いやすく設計されている
● 機械学習...
Python のコードの例
● 変数の定義
x = 12345 # int(整数型)
st = “this is string” # str(文字列型)
bo = True # bool(真偽値)
obj = None # 何もない的な
Python のコードの例
● 変数の定義
alist = [3, 4, 6]
atuple = (3, 4, 6)
adict = {‘hoge’: 10, ‘fuga: 20}
aset = {1, 3, 5, 7}
Python のコードの例
● 関数の定義 (def 文)
def process(x, y=5):
return x + y - 1
Python のコードの例
● 条件分岐 (if 文)
if num < 50:
print(“less than 50.”)
elif num < 100:
print(“less than 100.”)
else:
print(“sugo-...
Python のコードの例
● 繰り返し (for 文,while 文)
for i in range(10):
print(i ** 2)
while i < 50:
i *= 2
Python のコードの例
● 例外処理
try:
do_something_abunai()
except NanikaError as e:
print(‘例外が発生し,捕捉される場合’)
else:
print(‘例外が発生しなかった場合...
Python のコードの例
● コンテキストマネージャ
○ あるオブジェクトに対する初期化と後片付けをまとめて記述できる
■ Go の defer,C# の using 文と似ている
○ open() されたファイルは with 文を抜ける際に...
Python のコードの例
● コンテキストマネージャ
○ だいたいこのコードと等価
f = open(“hoge.txt”, “wt”)
try:
f.write(data)
finally:
f.close()
Python のコードの例
● ジェネレータ
○ なんらかの処理をした値を複数回返すというときに便利
○ 遅延評価イテレータを簡単に作れる
def gen():
data = do_something()
yield data
yield do...
Python のコードの例
● 値のスワップ
○ これでいい
○ 一時変数は使わないの?
■ あとで見る
x, y = y, x
Python のコードの例
● 内包表記
[x ** 2 for x in range(100) if x % 2 == 0]
{x ** 2 for x in range(100) if x % 2 == 0}
{str(x): x for ...
Python のオブジェクトの構造体によ
る内部表現
CPython
● van Rossum が書いた Python の標準実装
● C言語で記述されている
● CPython を使ってライブラリを書くことができる
○ いわゆるC拡張ですね
Python のオブジェクトの実装
● オブジェクトを表す構造体
○ PyObject
○ PyVarObject
● クラスを表す構造体
○ PyTypeObject
オブジェクトを表す2つの構造体
typedef struct _object {
_PyObject_HEAD_EXTRA
Py_ssize_t ob_refcnt;
struct _typeobject *ob_type;
} PyObjec...
Py(Var)Object の持つ要素
● オブジェクトの参照カウンタ (ob_refcnt)
● PyTypeObject へのポインタ (*ob_type)
● (可変長オブジェクトの要素数 (ob_size) )
PyTypeObject
● Doc/includes/typestruct.h
● Python のクラスを表す構造体
● メンバがいっぱいある
○ 演算子オーバーロードとか
○ メンバ関数,メンバ変数
○ ハッシュ関数
関係性
PyObject
PyVarObject
PyTypeObject
この他にもいろいろな構造体があります
● おいおい出てくるのでその都度やっていきます
○ データ構造を表す構造体
○ メンバ関数を表す構造体
○ モジュールを表す構造体
○ etc.
Python の主要なデータ型の実装
Python のデータ型
● 組み込みデータ型
○ int (整数), float (浮動小数点数)
○ str (文字列), bytes (バイナリ列)
○ コンテナ
○ 他にもあるけどとりあえずこれぐらい
Python のデータ型
● 組み込みデータ型
○ int (整数), float (浮動小数点数)
○ str (文字列), bytes (バイナリ列)
○ コンテナ
○ 他にもあるけどとりあえずこれぐらい
int: struct _longobject
● 多倍長整数
○ (メモリの許す限り)いくらでも大きな整数を表すことができる
struct _longobject {
PyVarObject ob_base;
digit ob_digit[1...
int: struct _longobject
● 負の数は ob_size を負にすることで表している
● 0 のときは ob_size == 0
● ある整数Xの絶対値に対して,次の関係が成り立つ
○ Di
は ob_digit[i]
○ ...
多倍長整数の足し算・引き算
● 多倍長整数の足し算・引き算は,筆算に似た方法で行われる
ob_digit[0] ob_digit[1] ob_digit[2] ... ob_digit[ob_size - 1]
ob_digit[0] ob_d...
多倍長整数の掛け算・割り算
● 多倍長整数の掛け算・割り算はちょっと複雑で説明しきれないので省略
○ 愚直にやると遅いので,最適化されたアルゴリズムが用いられている
○ 次のワードでググろう
■ カラツバ法
○ 次の書籍をあたろう
■ The ...
Python のコンテナ
● 次の4つを取り上げます
○ list
○ collections.deque
○ dict
○ set
● CPython では各種操作の時間計算量が規定されている
○ https://wiki.python.or...
list: PyListObject
● list という名前をしているけど,動的配列
typedef struct {
PyObject_VAR_HEAD // PyVarObject としての情報
PyObject **ob_item; /...
collections.deque
● 双方向連結リストによって実装された両端キュー
● 先頭への要素の追加がO(1)でできる
● 要素のローテート(Piet でいうところの roll)ができる
dict: PyDictObject
● ハッシュテーブル
typedef struct {
PyObject_VAR_HEAD
Py_ssize_t ma_used; // 辞書の要素数
uint64_t ma_version_tag; //...
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
hoge
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
hoge 0
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
hoge 0
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
hoge 0
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
fuga
value_2
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
1
fuga
value_2
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
fuga
value_2
1 fuga
value_2
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
piyo
value_3
fuga
value_2
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
1
piyo
value_3
fuga
value_2
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
1
piyo
value_3
fuga
value_2
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
1
piyo
value_3
fuga
value_2
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
1
piyo
value_3
fuga
value_2
2
dict: PyDictObject
● ハッシュテーブル
hoge
value_10
1
2
1
piyo
value_3
fuga
value_2
2
piyo
value_3
set
● (要素の重複を許さない)集合
● 実装はほとんど dict と同じなので省略
○ dict に key だけを格納するとだいたい set になる
Python の関数/モジュールの実装
モジュールの作り方
● だいたい以下の手順を踏めば CPython でライブラリが作れます
● クラスや定数を意図的に無視しています
1. 関数を書く
2. 関数の一覧を登録する
3. モジュールの情報を登録する
4. モジュールの初期化をする...
関数を書く
● 関数は static で宣言する
● 引数は (PyObject*, PyObject*) とする
● 返り値も PyObject* とする
● がんばる
関数を書く (具体的に)
● 関数は static で宣言する
○ 外部から見えていい関数は,後述する「モジュールを初期化する関数」のみとする
● 引数は (PyObject*, PyObject*) とする
○ 1つ目はモジュール自身を表す ...
関数を書く (具体的に)
● がんばる
○ あとはC言語で書くだけ!!!!!!!!
○ 手動で参照カウントを増減させる
■ このへんは Cython とか使うともっと楽に書けると思う
■ 今回はそこまで踏み込みません
関数の一覧を登録する
● PyMethodDef の配列に詰め込む
● 終端に番兵を置く
static PyMethodDef mysortmethods[] = {
{“bubblesort”, (PyCFunction)bubblesort...
関数の一覧を登録する
● PyMethodDef の配列に詰め込む
● 終端に番兵を置く
static PyMethodDef mysortmethods[] = {
{“bubblesort”, (PyCFunction)bubblesort...
関数の一覧を登録する
● PyMethodDef の配列に詰め込む
● 終端に番兵を置く
static PyMethodDef mysortmethods[] = {
{“bubblesort”, (PyCFunction)bubblesort...
関数の一覧を登録する
● PyMethodDef の配列に詰め込む
● 終端に番兵を置く
static PyMethodDef mysortmethods[] = {
{“bubblesort”, (PyCFunction)bubblesort...
関数の一覧を登録する
● PyMethodDef の配列に詰め込む
● 終端に番兵を置く
static PyMethodDef mysortmethods[] = {
{“bubblesort”, (PyCFunction)bubblesort...
関数の一覧を登録する
● PyMethodDef の配列に詰め込む
● 終端に番兵を置く
static PyMethodDef mysortmethods[] = {
{“bubblesort”, (PyCFunction)bubblesort...
モジュールの情報を登録する
● PyModuleDef 構造体
○ モジュールの名前
○ モジュールの説明
○ モジュールが利用するメモリ領域の大きさ
○ モジュールの関数・クラス
モジュールの初期化をする関数を書く
● これだけ非 static で宣言する
● これで import できるようになる
実例を見る
● バブルソート関数だけがある mysort というモジュールを書いた
○ https://github.com/utgwkk/python-c-api-practice
● setup.py をよしなに書くとモジュールとして配布で...
Python のコードの実行・仮想機械
について
よくあるコンパイル言語の実行手順
コードを構文解析する
抽象構文木に変換する
実行する
実行可能バイナリを生成する
素朴なインタプリタ言語の実行手順
コードを構文解析する
抽象構文木に変換する
評価する
Python の実行手順
コードを構文解析する
抽象構文木に変換する
仮想機械で評価する
仮想機械用のバイトコードに変換する
実行の手順 (PEP 339 より)
1. コードを解析して解析木にする
2. 解析木を抽象構文木(AST)に変換する
3. 抽象構文木を制御フローグラフ(CFG)に変換する
4. 制御フローグラフを基にしてバイトコードを生成する
5. バイト...
実行の手順 (PEP 339 より)
1. コードを解析して解析木にする
2. 解析木を抽象構文木(AST)に変換する
3. 抽象構文木を制御フローグラフ(CFG)に変換する
4. 制御フローグラフを基にしてバイトコードを生成する
5. バイト...
バイトコードへの変換
● Python のコードは最終的にバイトコード(中間コード)にコンパイルされる
○ 1バイトで命令を表す(256通り)
○ これと引数を組み合わせて 2バイトが命令の最小単位
● コンパイルされたバイトコードは仮想機械(...
なぜ「コンパイル」?
● 高級なコードを低級な命令(バイトコード)に変換してから
仮想機械上で実行したほうが速い
● いろんな言語がこういう体系を取っている
○ Java, C#, Ruby, ...
PyCodeObject (Include/code.h)
● バイトコードを表す構造体
○ 引数の数
○ スタックの大きさ
○ 命令コード
○ ローカル変数の配列
○ 定数の配列
バイトコードを逆アセンブルする
● TODO: 「Python のコードの例」で紹介したコードのバイトコードを見る
○ 条件分岐
○ 制御構造
○ 例外処理
○ コンテキストマネージャ
○ ジェネレータ
● TODO:見る
○ x, y = y...
Python VM の仕様
● スタックマシン
○ データのやりとりにスタックを用いる
○ 計算対象としてスタックのトップから順に数えていく
● 命令一覧
○ http://docs.python.jp/3/library/dis.html#p...
Python VM の正体
● PyFrameObject 構造体がその正体
○ PyCodeObject へのポインタ(バイトコードの列)
○ グローバル変数,ローカル変数などへのポインタ
○ スタック
○ 例外オブジェクト,トレースバックの...
_PyEval_EvalFrameDefault() 関数
● ここに PyFrameObject を渡して PyCodeObject を実行している
● 終了条件に達するまでバイトコードを順に実行する
○ 無限ループ (for (;;)) の...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
print
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
シミュレートしてみよう
1 0 LOAD_CONST 3 (6)
2 STORE_NAME 0 (a)
4 LOAD_NAME 1 (print)
6 LOAD_NAME 0 (a)
8 CALL_FUNCTION 1
10 POP_TOP
1...
まとめ
まとめ
● Python のオブジェクトはいろいろな構造体で表現されている
● Python のコードは最適化を経てバイトコードにコンパイルされる
● Python のコンパイルされたバイトコードは VM 上で実行される
● 質問は分かる範囲で...
参考
● Inside The Python Virtual Machine
https://leanpub.com/insidethepythonvirtualmachine/read
● About Python VM
http://svn...
Upcoming SlideShare
Loading in …5
×

Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.

11,589 views

Published on

KMC春合宿2017

Published in: Technology
  • ..............ACCESS that WEBSITE Over for All Ebooks ................ ......................................................................................................................... DOWNLOAD FULL PDF EBOOK here { https://urlzs.com/UABbn } ......................................................................................................................... Download Full EPUB Ebook here { https://urlzs.com/UABbn } .........................................................................................................................
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Download or read that Ebooks here ... ......................................................................................................................... DOWNLOAD FULL PDF EBOOK here { http://bit.ly/2m77EgH } ......................................................................................................................... Download EPUB Ebook here { http://bit.ly/2m77EgH } ......................................................................................................................... Download Doc Ebook here { http://bit.ly/2m77EgH } ......................................................................................................................... .........................................................................................................................
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • accessibility Books Library allowing access to top content, including thousands of title from favorite author, plus the ability to read or download a huge selection of books for your pc or smartphone within minutes ,Download or read Ebooks here ... ......................................................................................................................... Download FULL PDF EBOOK here { https://urlzs.com/UABbn }
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • accessibility Books Library allowing access to top content, including thousands of title from favorite author, plus the ability to read or download a huge selection of books for your pc or smartphone within minutes DOWNLOAD THIS BOOKS INTO AVAILABLE FORMAT ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { https://urlzs.com/UABbn } ......................................................................................................................... Download Full EPUB Ebook here { https://urlzs.com/UABbn } ......................................................................................................................... ...................................ALL FOR EBOOKS................................................. Cookbooks, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy,
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here
  • Download or read that Ebooks here ... ......................................................................................................................... DOWNLOAD FULL PDF EBOOK here { http://bit.ly/2m77EgH } ......................................................................................................................... Download EPUB Ebook here { http://bit.ly/2m77EgH } ......................................................................................................................... Download Doc Ebook here { http://bit.ly/2m77EgH } ......................................................................................................................... .........................................................................................................................
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.

  1. 1. Pythonの処理系はどのように実装され,どのよう に動いているのか? 我々はその実態を調査すべ くアマゾンへと飛んだ. KMC春合宿2017 @utgwkk
  2. 2. 私について ● @utgwkk ● KMC-ID: utgw ● 京都大学工学部情報学科 計算機科学コース2回生 ● デレステ: 581948763
  3. 3. 講座の対象・予定 ● C言語のような静的型付け・コンパイル言語しか触ったことがない人向け ● 動的型付け・インタプリタ言語の中身が気になる人向け ● Python の標準実装である CPython がどう実装されているのか見ていく ○ 他の実装もだいたいこんな感じ? ● あまり深いところまで行かずにざっと見ていく予定 ○ 私の理解が追い付いていないので
  4. 4. 今日話すこと 1. Python の概要 2. Python のオブジェクトの構造体による内部表現 3. Python の主要なデータ型の実装 4. Python の関数・モジュールの実装 5. Python のコードの実行・仮想機械について
  5. 5. 1. Python の概要 2. Python のオブジェクトの構造体による内部表現 3. Python の主要なデータ型の実装 4. Python の関数・モジュールの実装 5. Python のコードの実行・仮想機械について どのように実装され 今日話すこと どのように動いているのか
  6. 6. Python の概要
  7. 7. Python とは ● Guido van Rossum が作ったプログラミング言語 ● 動的型付けプログラミング言語 ● インタプリタ言語 ● 最新バージョンは 3.6 (2016/12/23)
  8. 8. Python の特徴 ● 動的型付けプログラミング言語である ○ 型ヒントが最近導入された ● インタプリタ言語である ● インデントによってブロックを表現する (オフサイドルール) ● コードがシンプルで扱いやすく設計されている ● 機械学習・統計ライブラリが豊富 ○ 日本だと機械学習目的で書いてる人が多そう [要出典]
  9. 9. Python のコードの例 ● 変数の定義 x = 12345 # int(整数型) st = “this is string” # str(文字列型) bo = True # bool(真偽値) obj = None # 何もない的な
  10. 10. Python のコードの例 ● 変数の定義 alist = [3, 4, 6] atuple = (3, 4, 6) adict = {‘hoge’: 10, ‘fuga: 20} aset = {1, 3, 5, 7}
  11. 11. Python のコードの例 ● 関数の定義 (def 文) def process(x, y=5): return x + y - 1
  12. 12. Python のコードの例 ● 条件分岐 (if 文) if num < 50: print(“less than 50.”) elif num < 100: print(“less than 100.”) else: print(“sugo-i!!!!!!!”)
  13. 13. Python のコードの例 ● 繰り返し (for 文,while 文) for i in range(10): print(i ** 2) while i < 50: i *= 2
  14. 14. Python のコードの例 ● 例外処理 try: do_something_abunai() except NanikaError as e: print(‘例外が発生し,捕捉される場合’) else: print(‘例外が発生しなかった場合’) finally: print(‘いずれの場合にも実行される処理’)
  15. 15. Python のコードの例 ● コンテキストマネージャ ○ あるオブジェクトに対する初期化と後片付けをまとめて記述できる ■ Go の defer,C# の using 文と似ている ○ open() されたファイルは with 文を抜ける際に必ず close() される with open(“hoge.txt”, “wt”) as f: f.write(data)
  16. 16. Python のコードの例 ● コンテキストマネージャ ○ だいたいこのコードと等価 f = open(“hoge.txt”, “wt”) try: f.write(data) finally: f.close()
  17. 17. Python のコードの例 ● ジェネレータ ○ なんらかの処理をした値を複数回返すというときに便利 ○ 遅延評価イテレータを簡単に作れる def gen(): data = do_something() yield data yield do_something_else(data)
  18. 18. Python のコードの例 ● 値のスワップ ○ これでいい ○ 一時変数は使わないの? ■ あとで見る x, y = y, x
  19. 19. Python のコードの例 ● 内包表記 [x ** 2 for x in range(100) if x % 2 == 0] {x ** 2 for x in range(100) if x % 2 == 0} {str(x): x for x in range(100) if x % 2 == 0} (x ** 2 for x in range(100) if x % 2 == 0) # ジェネレータ
  20. 20. Python のオブジェクトの構造体によ る内部表現
  21. 21. CPython ● van Rossum が書いた Python の標準実装 ● C言語で記述されている ● CPython を使ってライブラリを書くことができる ○ いわゆるC拡張ですね
  22. 22. Python のオブジェクトの実装 ● オブジェクトを表す構造体 ○ PyObject ○ PyVarObject ● クラスを表す構造体 ○ PyTypeObject
  23. 23. オブジェクトを表す2つの構造体 typedef struct _object { _PyObject_HEAD_EXTRA Py_ssize_t ob_refcnt; struct _typeobject *ob_type; } PyObject; typedef struct { PyObject ob_base; Py_ssize_t ob_size; } PyVarObject; #define _PyObject_HEAD_EXTRA Includes/object.h L106-115 PyVarObject extends PyObject
  24. 24. Py(Var)Object の持つ要素 ● オブジェクトの参照カウンタ (ob_refcnt) ● PyTypeObject へのポインタ (*ob_type) ● (可変長オブジェクトの要素数 (ob_size) )
  25. 25. PyTypeObject ● Doc/includes/typestruct.h ● Python のクラスを表す構造体 ● メンバがいっぱいある ○ 演算子オーバーロードとか ○ メンバ関数,メンバ変数 ○ ハッシュ関数
  26. 26. 関係性 PyObject PyVarObject PyTypeObject
  27. 27. この他にもいろいろな構造体があります ● おいおい出てくるのでその都度やっていきます ○ データ構造を表す構造体 ○ メンバ関数を表す構造体 ○ モジュールを表す構造体 ○ etc.
  28. 28. Python の主要なデータ型の実装
  29. 29. Python のデータ型 ● 組み込みデータ型 ○ int (整数), float (浮動小数点数) ○ str (文字列), bytes (バイナリ列) ○ コンテナ ○ 他にもあるけどとりあえずこれぐらい
  30. 30. Python のデータ型 ● 組み込みデータ型 ○ int (整数), float (浮動小数点数) ○ str (文字列), bytes (バイナリ列) ○ コンテナ ○ 他にもあるけどとりあえずこれぐらい
  31. 31. int: struct _longobject ● 多倍長整数 ○ (メモリの許す限り)いくらでも大きな整数を表すことができる struct _longobject { PyVarObject ob_base; digit ob_digit[1]; }; ob_digit[0] ob_digit[1] ob_digit[2] ... ob_digit[ob_size - 1]
  32. 32. int: struct _longobject ● 負の数は ob_size を負にすることで表している ● 0 のときは ob_size == 0 ● ある整数Xの絶対値に対して,次の関係が成り立つ ○ Di は ob_digit[i] ○ N は ob_size の絶対値 ○ S はシフト数 (15 もしくは 30)
  33. 33. 多倍長整数の足し算・引き算 ● 多倍長整数の足し算・引き算は,筆算に似た方法で行われる ob_digit[0] ob_digit[1] ob_digit[2] ... ob_digit[ob_size - 1] ob_digit[0] ob_digit[1] ob_digit[2] ... ob_digit[ob_size - 1] ob_digit[0] ob_digit[1] ob_digit[2] ... ob_digit[ob_size - 1] A B A+B carry carry carry add add add add
  34. 34. 多倍長整数の掛け算・割り算 ● 多倍長整数の掛け算・割り算はちょっと複雑で説明しきれないので省略 ○ 愚直にやると遅いので,最適化されたアルゴリズムが用いられている ○ 次のワードでググろう ■ カラツバ法 ○ 次の書籍をあたろう ■ The Art of Computer Programming (D. Knuth) ■ Handbook of Applied Cryptography (Alfred J. Menezes ほか)
  35. 35. Python のコンテナ ● 次の4つを取り上げます ○ list ○ collections.deque ○ dict ○ set ● CPython では各種操作の時間計算量が規定されている ○ https://wiki.python.org/moin/TimeComplexity
  36. 36. list: PyListObject ● list という名前をしているけど,動的配列 typedef struct { PyObject_VAR_HEAD // PyVarObject としての情報 PyObject **ob_item; // 要素へのポインタ Py_ssize_t allocated; // 確保しているサイズ(≠要素数) } PyListObject; [0] [1] [2] [ob_size - 1]... ... allocated
  37. 37. collections.deque ● 双方向連結リストによって実装された両端キュー ● 先頭への要素の追加がO(1)でできる ● 要素のローテート(Piet でいうところの roll)ができる
  38. 38. dict: PyDictObject ● ハッシュテーブル typedef struct { PyObject_VAR_HEAD Py_ssize_t ma_used; // 辞書の要素数 uint64_t ma_version_tag; // 辞書のバージョン PyDictKeysObject *ma_keys; // 辞書のキーのリスト PyObject **ma_values; // 辞書の値を格納するテーブル } PyDictObject;
  39. 39. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2
  40. 40. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 hoge
  41. 41. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 hoge 0
  42. 42. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 hoge 0
  43. 43. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 hoge 0
  44. 44. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 fuga value_2
  45. 45. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 1 fuga value_2
  46. 46. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 fuga value_2 1 fuga value_2
  47. 47. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 piyo value_3 fuga value_2
  48. 48. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 1 piyo value_3 fuga value_2
  49. 49. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 1 piyo value_3 fuga value_2
  50. 50. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 1 piyo value_3 fuga value_2
  51. 51. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 1 piyo value_3 fuga value_2 2
  52. 52. dict: PyDictObject ● ハッシュテーブル hoge value_10 1 2 1 piyo value_3 fuga value_2 2 piyo value_3
  53. 53. set ● (要素の重複を許さない)集合 ● 実装はほとんど dict と同じなので省略 ○ dict に key だけを格納するとだいたい set になる
  54. 54. Python の関数/モジュールの実装
  55. 55. モジュールの作り方 ● だいたい以下の手順を踏めば CPython でライブラリが作れます ● クラスや定数を意図的に無視しています 1. 関数を書く 2. 関数の一覧を登録する 3. モジュールの情報を登録する 4. モジュールの初期化をする関数を書く
  56. 56. 関数を書く ● 関数は static で宣言する ● 引数は (PyObject*, PyObject*) とする ● 返り値も PyObject* とする ● がんばる
  57. 57. 関数を書く (具体的に) ● 関数は static で宣言する ○ 外部から見えていい関数は,後述する「モジュールを初期化する関数」のみとする ● 引数は (PyObject*, PyObject*) とする ○ 1つ目はモジュール自身を表す (だいたい self と名付ける) ○ 2つ目は引数を格納した Python のタプル (だいたい args と名付ける) ○ これを PyArg_ParseTuple() 関数を使ってパースすると,所望の値が得られる ● 返り値も PyObject* とする ○ None を返すときは Py_RETURN_NONE マクロを使う
  58. 58. 関数を書く (具体的に) ● がんばる ○ あとはC言語で書くだけ!!!!!!!! ○ 手動で参照カウントを増減させる ■ このへんは Cython とか使うともっと楽に書けると思う ■ 今回はそこまで踏み込みません
  59. 59. 関数の一覧を登録する ● PyMethodDef の配列に詰め込む ● 終端に番兵を置く static PyMethodDef mysortmethods[] = { {“bubblesort”, (PyCFunction)bubblesort, METH_VARARGS, “bubblesort.”}, {NULL, NULL, 0, NULL} }
  60. 60. 関数の一覧を登録する ● PyMethodDef の配列に詰め込む ● 終端に番兵を置く static PyMethodDef mysortmethods[] = { {“bubblesort”, (PyCFunction)bubblesort, METH_VARARGS, “bubblesort.”}, {NULL, NULL, 0, NULL} } 関数の名前
  61. 61. 関数の一覧を登録する ● PyMethodDef の配列に詰め込む ● 終端に番兵を置く static PyMethodDef mysortmethods[] = { {“bubblesort”, (PyCFunction)bubblesort, METH_VARARGS, “bubblesort.”}, {NULL, NULL, 0, NULL} } 関数ポインタ (PyCFunction にキャストする)
  62. 62. 関数の一覧を登録する ● PyMethodDef の配列に詰め込む ● 終端に番兵を置く static PyMethodDef mysortmethods[] = { {“bubblesort”, (PyCFunction)bubblesort, METH_VARARGS, “bubblesort.”}, {NULL, NULL, 0, NULL} } 引数の受け取り方
  63. 63. 関数の一覧を登録する ● PyMethodDef の配列に詰め込む ● 終端に番兵を置く static PyMethodDef mysortmethods[] = { {“bubblesort”, (PyCFunction)bubblesort, METH_VARARGS, “bubblesort.”}, {NULL, NULL, 0, NULL} } 関数の説明文
  64. 64. 関数の一覧を登録する ● PyMethodDef の配列に詰め込む ● 終端に番兵を置く static PyMethodDef mysortmethods[] = { {“bubblesort”, (PyCFunction)bubblesort, METH_VARARGS, “bubblesort.”}, {NULL, NULL, 0, NULL} } 番兵(終端を表す)
  65. 65. モジュールの情報を登録する ● PyModuleDef 構造体 ○ モジュールの名前 ○ モジュールの説明 ○ モジュールが利用するメモリ領域の大きさ ○ モジュールの関数・クラス
  66. 66. モジュールの初期化をする関数を書く ● これだけ非 static で宣言する ● これで import できるようになる
  67. 67. 実例を見る ● バブルソート関数だけがある mysort というモジュールを書いた ○ https://github.com/utgwkk/python-c-api-practice ● setup.py をよしなに書くとモジュールとして配布できる ● 組み込みライブラリの場合は CPython のビルド時によしなにされる ● TODO: コードをざっと見る ● TODO: インストールできることを確認する
  68. 68. Python のコードの実行・仮想機械 について
  69. 69. よくあるコンパイル言語の実行手順 コードを構文解析する 抽象構文木に変換する 実行する 実行可能バイナリを生成する
  70. 70. 素朴なインタプリタ言語の実行手順 コードを構文解析する 抽象構文木に変換する 評価する
  71. 71. Python の実行手順 コードを構文解析する 抽象構文木に変換する 仮想機械で評価する 仮想機械用のバイトコードに変換する
  72. 72. 実行の手順 (PEP 339 より) 1. コードを解析して解析木にする 2. 解析木を抽象構文木(AST)に変換する 3. 抽象構文木を制御フローグラフ(CFG)に変換する 4. 制御フローグラフを基にしてバイトコードを生成する 5. バイトコードを仮想機械上で実行する
  73. 73. 実行の手順 (PEP 339 より) 1. コードを解析して解析木にする 2. 解析木を抽象構文木(AST)に変換する 3. 抽象構文木を制御フローグラフ(CFG)に変換する 4. 制御フローグラフを基にしてバイトコードを生成する 5. バイトコードを仮想機械上で実行する
  74. 74. バイトコードへの変換 ● Python のコードは最終的にバイトコード(中間コード)にコンパイルされる ○ 1バイトで命令を表す(256通り) ○ これと引数を組み合わせて 2バイトが命令の最小単位 ● コンパイルされたバイトコードは仮想機械(VM)上で実行される ● こういうタイプのインタプリタをバイトコードインタプリタと呼ぶ
  75. 75. なぜ「コンパイル」? ● 高級なコードを低級な命令(バイトコード)に変換してから 仮想機械上で実行したほうが速い ● いろんな言語がこういう体系を取っている ○ Java, C#, Ruby, ...
  76. 76. PyCodeObject (Include/code.h) ● バイトコードを表す構造体 ○ 引数の数 ○ スタックの大きさ ○ 命令コード ○ ローカル変数の配列 ○ 定数の配列
  77. 77. バイトコードを逆アセンブルする ● TODO: 「Python のコードの例」で紹介したコードのバイトコードを見る ○ 条件分岐 ○ 制御構造 ○ 例外処理 ○ コンテキストマネージャ ○ ジェネレータ ● TODO:見る ○ x, y = y, x
  78. 78. Python VM の仕様 ● スタックマシン ○ データのやりとりにスタックを用いる ○ 計算対象としてスタックのトップから順に数えていく ● 命令一覧 ○ http://docs.python.jp/3/library/dis.html#python-bytecode-instructions
  79. 79. Python VM の正体 ● PyFrameObject 構造体がその正体 ○ PyCodeObject へのポインタ(バイトコードの列) ○ グローバル変数,ローカル変数などへのポインタ ○ スタック ○ 例外オブジェクト,トレースバックの情報 ● 関数呼び出しごとに作られる ○ ジェネレータが簡単に実現できる
  80. 80. _PyEval_EvalFrameDefault() 関数 ● ここに PyFrameObject を渡して PyCodeObject を実行している ● 終了条件に達するまでバイトコードを順に実行する ○ 無限ループ (for (;;)) の中がその実体 ○ 終了条件 ■ return 文が実行される ■ 例外が送出され try~except で捕捉されない
  81. 81. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a print
  82. 82. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a print
  83. 83. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a print 6
  84. 84. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a print 6
  85. 85. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print 6
  86. 86. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print
  87. 87. print シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print
  88. 88. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print print a
  89. 89. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print print a
  90. 90. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print print a
  91. 91. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print
  92. 92. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print None
  93. 93. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print None
  94. 94. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print None
  95. 95. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print
  96. 96. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print
  97. 97. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print None
  98. 98. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print None
  99. 99. シミュレートしてみよう 1 0 LOAD_CONST 3 (6) 2 STORE_NAME 0 (a) 4 LOAD_NAME 1 (print) 6 LOAD_NAME 0 (a) 8 CALL_FUNCTION 1 10 POP_TOP 12 LOAD_CONST 2 (None) 14 RETURN_VALUE 定数: None 6 名前: a = 6 print
  100. 100. まとめ
  101. 101. まとめ ● Python のオブジェクトはいろいろな構造体で表現されている ● Python のコードは最適化を経てバイトコードにコンパイルされる ● Python のコンパイルされたバイトコードは VM 上で実行される ● 質問は分かる範囲で答えます
  102. 102. 参考 ● Inside The Python Virtual Machine https://leanpub.com/insidethepythonvirtualmachine/read ● About Python VM http://svn.coderepos.org/share/docs/jbking/vmdoc/about_python_vm.html ● CPython の Git リポジトリ https://github.com/python/cpython ● Python 3.6.0 Documentation http://docs.python.jp/3/

×