Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

可視化法学(Found it project#9)

557 views

Published on

可視化法学(Found it Project #9)編です。
https://foundit-project.connpass.com/event/66468/

Published in: Entertainment & Humor
  • Be the first to comment

  • Be the first to like this

可視化法学(Found it project#9)

  1. 1. 可視化法学の紹介 ICT x 法律 の話 芝尾幸一郎(ソフトウェアエンジニア)
  2. 2. 自己紹介
  3. 3. 芝尾幸一郎 • Aiming(ソーシャルゲーム会社)でデータ分析の仕事をして いる。 • 教育のバックグラウンドはメディアアート • ドワンゴで、ニコニコ動画for iphoneの開発をしていた。 • 趣味でデータ分析をしている。 • 趣味で動画サイトの分析やランキングサイトを作ってい る
  4. 4. データ分析基盤構築 • データ分析基盤構築の本を書 いた。 • どの様に集計ログフォーマッ トを作ればよいか。 • データ分析基盤の技術策定の 勘所 • 作ったデータ分析基盤をどの 様に活用するか
  5. 5. 今回の目的 • 可視化法学の紹介(20分) • モチベーションの紹介(5分) • リーガルテックの試み(5分) • エンジニアはどう関わるか(5分)
  6. 6. 可視化法学とは
  7. 7. 可視化法学 • 概要 「可視化法学-法教育に役立てるためにICT を活用して法律の構造を解析して可視化す る個人のプロジェクト」
  8. 8. 法律の参照構造を解釈 してその繋がりを可視 化
  9. 9. 作り方
  10. 10. 法令データ収集 • 総務省法令データベースから データを取得。 • 今はzipがありますが、昔は webからスクレイプしてまし た。
  11. 11. 全ての参照構造を抜き出 す。 • 救急救命士法の中に刑 法へのリンクが有る 刑法 救急救命士法
  12. 12. 刑法 売春防止法 刑法 労働者派遣事業の適正な運営の確保及び派遣労 働者の保護等に関する法律 刑法 育児休業、介護休業等育児又は家族介護を行う 労働者の福祉に関する法律 刑法 特定機器に係る適合性評価手続の結果の外国と の相互承認の実施に関する法律
  13. 13. グラフ理論に基づいて描画 胡一凡さんの考えたアルゴリズム
  14. 14. グラフ理論の基づいて描画 • 多くの法律から参照される法律のサイズは大きくした。 • eg刑法、刑事訴訟法 • 点の色は、その法律が、どの分野に属するか? • 刑事、民事、教育、厚生、労働etc • 色々な分野から参照される法律は鮮やか
  15. 15. 描画の様子
  16. 16. 色んな法律を見てみる
  17. 17. 似たものは近くに配置される 人間が手動で配置しているのではなく、参照し ている法が近くにあれば機械的に自然と集まる
  18. 18. 憲法分野 • 憲法には、基本法が良くくっ 付く。 • 憲法に並んで、沖縄の復帰に 関する法案が大きなウェイト を占めており、占領されて復 帰するのは一つ国作るみたい な大変さがあるようだ。 26
  19. 19. 教育法分野 • 学校教育法が超大きなウェイ トを占めている。 • 地味に、放送大学学園法、私 立学校教職員共済法が多くの リンクを得ている。 27
  20. 20. 税制分野 • 所得税、法人税、関税法が大 きい。 • 租税特別措置法は多くの法か ら参照され、実はあんまり特 別措置じゃなかった。 28
  21. 21. 河川分野 • シンプル • 河川法だけ覚えれば後はそれ の派生でなんとかなるんじゃ ないか? • 法の修正もまだ容易だろう • バグも入り込みにくい 29
  22. 22. 社会保険分野 • 死ぬほど複雑で相互依存が激し い。 • 社会保障は利害関係者が多くて 、なかなか難しいのだろう。 • 何か法改正や追加の度にバグる だろう。 • リファクタリング( コードをシンプル にするプログラミング用語)出来るとい いな。 30
  23. 23. 今後作りたい物
  24. 24. インタラクティブな web版可視化法学
  25. 25. web版DEMO http://www.lawvis.info/ 33
  26. 26. 法分野の時系列変化
  27. 27. 法律がいつ出来ていつ 繋がったかを可視化
  28. 28. 国別の比較
  29. 29. などをやりたい
  30. 30. その他の取り組み
  31. 31. 法令要約(テスト版) 貸金業法
  32. 32. 法令要約 • 機械学習(自然言語処理) • トピックモデルを使って、法令を一枚の画像に要約でき ないか? • その法令に特徴的な用語を抜き出す。 • ガウス過程に基づく連続空間トピックモデル
  33. 33. DOC2VECで 法令理解
  34. 34. Doc2VECについて • Word2Vecをパラグラフへ応用したもの。 • Paragraph2Vecが元論文の名前 • Word2Vec • 文章における各単語間の関連を元に、単語の重みを付けたも の • 詳しくはこちら • https://deepage.net/machine_learning/2017/01/08/doc2vec.ht ml
  35. 35. 法令の類似度を測るには • 単語の抜き出し(形態素解析) • MeCab • % mecab • すもももももももものうち • すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ • も 助詞,係助詞,*,*,*,*,も,モ,モ • もも 名詞,一般,*,*,*,*,もも,モモ,モモ • も 助詞,係助詞,*,*,*,*,も,モ,モ • もも 名詞,一般,*,*,*,*,もも,モモ,モモ • の 助詞,連体化,*,*,*,*,の,ノ,ノ • うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ • EOS • Doc2Vec • Gensim https://radimrehurek.com/gensim/models/doc2vec.html
  36. 36. webサイト作ってみた • Doc2Vecを利用して法令の類似性を測るサイトを作った • http://54.238.251.57:5000/ (現在停止中) • 出来ること • 法律用語の類似語を調べる(死刑の類似語等) • ランダムに選んだカテゴリと近いカテゴリを列挙 • ランダムに選んだ法令と近い法令を列挙
  37. 37. 作り方 • 法令を集める • 法令データをmecabを使って、名詞だけ抽出 • name=未成年者飲酒禁止法(大正十一年三月三十日法律 第二十号) word=['未成年', '者', '飲酒', '禁止', '法', '大正', ' 年', '三月', '日', '法律', '号', '最終', '改正', '平成', '年', '二月', ' 日', '法律', '号', ‘条'] • gensim.doc2vecを利用して、単語間の繋がりを学習。 model = models.Doc2Vec(size=400, alpha=0.0015, sample=1e-4, min_count=10, workers=4) model.build_vocab(sentences) for x in range(30): model.train(sentences)
  38. 38. 学習パラメータの調整 • 名詞だけを含めるか?動詞や形容詞も含めるか? • 多くの法律に共有する単語は無視するか? • どの程度の頻度で出たらその法令を特徴づける単語だと 認識するか?
  39. 39. パラメータを色々いじる • law(名詞、形容詞、動詞) • law2 min_count=1 最低1回以上出た単語を学習に使用 • law3 min_count=10 • law4 min_count=40 • law5 min_count=100 • law7 tagを法令名ではなく、カテゴリ名に変更
  40. 40. 宣伝
  41. 41. 冊子を売ってます。 1号、2号、800円 技術書典3 き27 10/22(日)アキバUDX
  42. 42. モチベーション
  43. 43. 法は複雑すぎる • 市民は理解できない。 • 複雑になっていくばかりで、誰もリフ ァクタリングしない。
  44. 44. エンジニアは複雑さが嫌い • プログラムのコードは、複雑であるが、シンプルにする 努力を、日々続けている。 • プログラム言語の進化やシステムを利用することで、シ ンプルにしている。 • アセンブラからスクリプト言語へ。 • 継続的テストとリファクタリング
  45. 45. Code(法令)≒ Code(プログラミング)
  46. 46. code(法令)もcode(ソース コード)もcodeである。
  47. 47. 類似点 • 構造を持ち、他者(人、CPU)の理解可能な形で書かれてい る。 • 複雑な(社会、事象)を制御する為に用いられる。 • しばしばバグが有るw
  48. 48. エンジニアが普段使う 道具で法令を見てみよ う
  49. 49. 川上会長の著作権 • 著作権法をjavascriptで書き直 して複雑さを測定する。 • http://bizzine.jp/article/detail/63 7 コードを書く経営者ドワン ゴ川上会長「プログラミン グこそが基礎教養」
  50. 50. 川上会長の著作権 これ、構造化するとわかるん ですけど、実はこの中にコピ ペされている部分がある。(会 場笑) JavaScriptの形式に直 してコンパイルしたら、複雑 度の合計が103になりました。 通常70以上はメンテ不可能と いう先ほどの循環的複雑度か らいえば、この法律は、いか なる変更をしてもバグを生む ということが判明したわけで す。
  51. 51. 論理憲法 https://twitter.com/bitlawjp
  52. 52. 憲法をprologでリライト
  53. 53. コード品質向上の取り組み • プロトタイプ作成 • インテグレーションテスト • モジュール化 • DRY思想の徹底 • プログラム言語それ自体の進化 • プロファイリング • コードレビュー(gitflow)
  54. 54. プロファイリング • どのプログラムコードがどの位呼ばれているか? • どのようなコールグラフで呼ばれているか?
  55. 55. MiniScheme 0.85 でコードリーディング4 ソースコード解析2 http://blog.livedoor.jp/fortymillion/tag/%E3%82%B3 %E3%83%BC%E3%83%AB%E3%82%B0%E3%8 3%A9%E3%83%95
  56. 56. このようなコールグラフを見 ている時に、法律の参照を調 べてみようと思った。
  57. 57. 法律をgithubで管理 ドイツ http://archive.fo/9EDKO
  58. 58. github管理の利点 • 一世代の溶かし込みではなく、ver1から全ての世代の更新 履歴を追跡できる • ブランチを作れるので、試案や対案も保存できる。 • ある時点のある政党が、対案を出してきたとしてそれ もgithubに残るので、後世の研究者が研究できる。 • 法に対するオープンアクセスを促進できる
  59. 59. 他のプログラミング手法を応用 すれば、法のコードクオリテイ も上がる(上がれば良いな)。 法が何もしていないとは思いませんが、 他のジャンルで行われいることを組み入れてみたらどうだろう。
  60. 60. IT x 法律,リーガルテ ックの試み
  61. 61. 法とデザイン ➤ アーキテクチャー ➤ コモンズ ➤ リーガルデザイン ➤ 分野論 ➤ 音楽、二次創作、出版、ア ート、写真、ゲーム、ファ ッション、アーカイブ、ハ ードウェア、不動産、金融 、家族、政治
  62. 62. アーキテクチャーと法 ➤ 法とアーキテクチャー研究の インターフェース ➤ アーキテクチャーの設計と自 由の再構築 ➤ 個人化される環境 ➤ 技術の道徳化と刑事法規制 ➤ アーキテクチャーによる法の 私物化と権利の限界 ➤ 貨幣空間の法とアーキテクチ ャー ➤ 憲法のアーキテクチャー
  63. 63. CODEX https://law.stanford.edu/codex-the-stanford-center-for- legal-informatics/
  64. 64. 新旧改め文を10秒で • 法制執務業務支援システム(e-laws) • 法改正のための、新旧改め文を、人手ではなく、プログラミ ングで行なう。 • 作業時間は、30時間から10秒へ • 人間が楽するために、機械に頑張らせる • 働くママが終止符を打った霞が関の“伝統芸能”
  65. 65. ある人のツィート
  66. 66. 大量の情報処理(人力) • 法曹は大量の情報処理をしなければならない。 • ファイリング資料2冊、DVD
  67. 67. エンジニアは怠惰 • エンジニアは怠惰なのでこう考える • この資料の内、重要な箇所はどこだろう? • 過去の交通事故と比べて、この事故に特徴的なことは なんだろう。 • 法的事実をこの資料から自動生成出来ないか?
  68. 68. コードの活用 人力で行わず、機械で要約出来ないか? コンピュータを使って迅速化、楽に出来ないか? 怠惰であるために今日頑張る
  69. 69. 足で稼ぐ • とわいえ、足で稼ぐという、習慣も価値がある。 • 愚直に資料に向き合うことも本当は大事。 • エンジニアも謙虚にこれらの価値観に向き合う必要があ る。
  70. 70. 法のIT化、エンジニア の協力出来る場所
  71. 71. 法クラスタでもAIは人気 AIがつなげる社会 AIネットワーク時代の法・政策 田 雅樹 編著・ 林 秀弥 編著・ 成原 慧 編著
  72. 72. 法クラスタでもAIは大人気 AI時代のサムライ業(上)代 替の危機 新事業に挑む 弁理士、商標サイトで起業/司 法書士、M&Aなど仲介も 法律カテゴリも、AI化の進展で 、機械に代替されちゃうかも・ ・・。
  73. 73. AI以前に忘れ去られる事柄 デジタル化 構造データ化 AI化
  74. 74. デジタル化 • 判例は大半が紙・・。 • デジタル化していても・・、画像埋め込みとか。
  75. 75. 構造データ化 • 判例データは、テキスト化さ れただけ。 • デジタル化はしているが、構 造化されたデータにはなって いない。 • メタデータなどは特に無い。
  76. 76. AI以前に • AIで職を奪われる以前に、IT化が進んでいない。 • 今でもFAXが大好きとか。
  77. 77. AIの隠れた要素 非専門家が想定するAIはピンクで囲った部分だけ。 実際の業務ではそれ以外の部分が大事。
  78. 78. データの例外は見えない • データ分析の専門家や、エン ジニア以外で、例外や特殊処 理に価値を見出す人は少ない 。 • バッドデータハンドブックは 、如何にデータ収集や前処理 が大変かを説いた書籍
  79. 79. 野球分析 • スポーツでのデータ分析は、 野球が一番進んでいる。 • 理由は、整理され蓄積された 良質なデータセットがあった から。
  80. 80. 泥臭い仕事は、エンジニア • データを整形する。 • ハズレデータを除外する。 • 再整形する。 • 泥臭い仕事はエンジニアの出番。
  81. 81. まとめ • 可視化法学。ITで法律をわかりやすく • プログラマーのツールや発想が他業種でも役立つ • 法律 x IT(リーガルテック)の実例 • プログラマーはどう役に立つか。泥臭い部分が主戦場
  82. 82. 最後にお願い
  83. 83. 冊子を売ってます。 1号、2号、800円 技術書典3 き27 10/22(日)アキバUDX
  84. 84. 法律の専門家の助力を求めま す。 速いマシンを使わせてくださ い。
  85. 85. @lawvis をフォロー ブログも有るよ。「可視化法学」で検索

×