Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Shozo Hatta
PDF, PPTX
6,333 views
Unicode文字プロパティ
正規表現の文字クラス[ ]で使用できるUnicode文字プロパティについて解説します。 統一規格なので正規表現の方言に左右されないのが特徴ですが、それ自体にも癖があります。
Technology
◦
Read more
5
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 25
2
/ 25
3
/ 25
4
/ 25
5
/ 25
6
/ 25
7
/ 25
8
/ 25
9
/ 25
10
/ 25
11
/ 25
12
/ 25
13
/ 25
14
/ 25
15
/ 25
16
/ 25
17
/ 25
18
/ 25
19
/ 25
20
/ 25
21
/ 25
22
/ 25
23
/ 25
24
/ 25
25
/ 25
More Related Content
PPTX
20130217 st lukes fuo lecture
by
帝京大学ちば総合医療センター
PPTX
20170305 srws robins i最終版
by
SR WS
PDF
明日から読めるメタ・アナリシス
by
Yasuyuki Okumura
PDF
観察研究の必須事項
by
Yoshitake Takebayashi
PPTX
6.1メタアナリシス revman practice
by
SR WS
PPTX
6診断精度のメタアナリシス
by
SR WS
PDF
間質性肺炎とステロイド
by
kiyonet
PPTX
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
by
SR WS
20130217 st lukes fuo lecture
by
帝京大学ちば総合医療センター
20170305 srws robins i最終版
by
SR WS
明日から読めるメタ・アナリシス
by
Yasuyuki Okumura
観察研究の必須事項
by
Yoshitake Takebayashi
6.1メタアナリシス revman practice
by
SR WS
6診断精度のメタアナリシス
by
SR WS
間質性肺炎とステロイド
by
kiyonet
20161222 srws第五回 Risk of Bias 2.0 toolを用いた文献評価
by
SR WS
What's hot
PPTX
観察研究の質の評価
by
Yoshitake Takebayashi
PDF
バリデーション研究の入門
by
Yasuyuki Okumura
PDF
初學R語言的60分鐘
by
Chen-Pan Liao
PDF
データ入力が終わってから分析前にすること
by
Masaru Tokuoka
PPTX
ολυμπιακοι αγωνες
by
somakris
PPTX
入院患者の発熱へのアプローチ【ADVANCED】
by
NEURALGPNETWORK
PPT
「診断精度研究のメタ分析」の入門
by
yokomitsuken5
PPTX
20160713 srws第六回@メタ・アナリシス前半
by
SR WS
PDF
研究倫理と研究デザインについて
by
Kawasaki University of Medical Welfare
PDF
知って得する静脈栄養
by
YoshisadaToyota
PPTX
STROBE/STARDの解説
by
Takashi Fujiwara
PDF
臨床的有意性の書き方
by
Yasuyuki Okumura
PPTX
「操作変数法」の報告事例
by
Yoshitake Takebayashi
PDF
Rでコンジョイント分析
by
osamu morimoto
PDF
バリデーション研究の計画・報告・活用
by
Yasuyuki Okumura
PDF
161017 コホート研究批判的吟味
by
Takashi Fujiwara
PDF
BLS, ALS, ECPR update2015-2018
by
Hideki Arimoto
PPTX
臨床に生かすために知っておきたい医学統計
by
Noriyuki Katsumata
PDF
エビデンスの統合から推奨の作成
by
Yasuyuki Okumura
PPTX
観察研究の必須事項
by
Yoshitake Takebayashi
観察研究の質の評価
by
Yoshitake Takebayashi
バリデーション研究の入門
by
Yasuyuki Okumura
初學R語言的60分鐘
by
Chen-Pan Liao
データ入力が終わってから分析前にすること
by
Masaru Tokuoka
ολυμπιακοι αγωνες
by
somakris
入院患者の発熱へのアプローチ【ADVANCED】
by
NEURALGPNETWORK
「診断精度研究のメタ分析」の入門
by
yokomitsuken5
20160713 srws第六回@メタ・アナリシス前半
by
SR WS
研究倫理と研究デザインについて
by
Kawasaki University of Medical Welfare
知って得する静脈栄養
by
YoshisadaToyota
STROBE/STARDの解説
by
Takashi Fujiwara
臨床的有意性の書き方
by
Yasuyuki Okumura
「操作変数法」の報告事例
by
Yoshitake Takebayashi
Rでコンジョイント分析
by
osamu morimoto
バリデーション研究の計画・報告・活用
by
Yasuyuki Okumura
161017 コホート研究批判的吟味
by
Takashi Fujiwara
BLS, ALS, ECPR update2015-2018
by
Hideki Arimoto
臨床に生かすために知っておきたい医学統計
by
Noriyuki Katsumata
エビデンスの統合から推奨の作成
by
Yasuyuki Okumura
観察研究の必須事項
by
Yoshitake Takebayashi
Similar to Unicode文字プロパティ
PDF
Unicodeについて教えてgooでしつこくきいてみたよ♪
by
1000 VICKY
PDF
Unicode 2018 recruit internship
by
Fumito Haga
PPTX
Ruby regexp
by
TakayukiNakano4
PDF
Web技術勉強会 第34回
by
龍一 田中
PPTX
文字コード入門 理論編 クイズ付き
by
Takao Baba
PPTX
JIS2004 with Windows SDK
by
Kazushi Kamegawa
PPTX
文字コードのお話
by
Shunji Konishi
PDF
テキストファイルを読む💪 第1回
by
京大 マイコンクラブ
PDF
Unicode-v11-0
by
kmiyako
Unicodeについて教えてgooでしつこくきいてみたよ♪
by
1000 VICKY
Unicode 2018 recruit internship
by
Fumito Haga
Ruby regexp
by
TakayukiNakano4
Web技術勉強会 第34回
by
龍一 田中
文字コード入門 理論編 クイズ付き
by
Takao Baba
JIS2004 with Windows SDK
by
Kazushi Kamegawa
文字コードのお話
by
Shunji Konishi
テキストファイルを読む💪 第1回
by
京大 マイコンクラブ
Unicode-v11-0
by
kmiyako
Unicode文字プロパティ
1.
Unicode 文字プロパティ 八田 昌三 (BPS)
2.
誰? • 元ローカライズ業界 • 多言語翻訳のチェックを正規表現ツールで行ってい た
3.
• 特殊な業界知識 • 多言語ドキュメントを正規表現で同時にチェック • ヨーロッパ25言語、どんな言語が追加されるかわからない • フランス・ドイツ・イタリア・スペイン・オランダ・スウェーデン・ ノルウェー・フィンランド・ポーランド・ギリシャ・ロシア・チェコ・ スロバキア・スロベニア・ルーマニア・ブルガリア・ウクライナ・ア ラビア・ペルシャ・etc
4.
RubyWorld Conference 2013で発表しました
5.
Unicode 文字プロパティって? • 正規表現の文字クラス [ ]
の中で使える • p{ }で囲って指定 ! • 文字プロパティ自体は Unicode Consocium の 正式な規格 • ただし実装の進み具合はさまざま
6.
公式規格 • http://www.unicode.org/Public/UNIDATA/ Scripts.txt
7.
記法も実装で異なる
8.
POSIXのじゃだめなの? • POSIXの文字クラス[[なんちゃら]]は、実装によっ て動作が異なる可能性がある • • 当時の業務は実装に依存できなかった Unicode文字プロパティには規格がある
9.
• 以後Ruby2.x系 (Onigumo) で説明
10.
rubular.com
11.
Onigumoで使える文字プロパティ https://github.com/k-takata/Onigmo/blob/master/doc/UnicodeProps.txt
12.
漢字にマッチする 正規表現 • 伝統的な方法: [一-龠] • • 一部の漢字が漏れてる(まず支障はない) 文字プロパティ: [p{Han}] • 明快、すべての漢字が網羅される
13.
ひらがなにマッチする 正規表現 • 伝統的な方法: [ぁ-ん] • • 思い出しにくい 文字プロパティ: [p{Hiragana}] • 明快
14.
• でも注意も必要
15.
漢数字にマッチする 正規表現 • 伝統的な方法: • [一二三四五六七八九十壱弐参拾百千万萬億兆〇] ! • 文字プロパティ: さすがにない
16.
カタカナにマッチする 正規表現 • 伝統的な方法: [ァ-ヴ] ! あれ? • 文字プロパティ: [p{Katakana}ー]
17.
• 実は音引き「ー」はKatakanaに含まれていない • 明示的に文字クラスに「ー」を追加する必要がある
18.
数字にマッチする 正規表現 • 伝統的な方法: [0-9], [0123456789] ! • 文字プロパティ:
[p{N}]または[p{Number}] • 後者はエイリアス • 明快、と思いきや
19.
• 漢字のゼロ「〇」(マル○ではない)にだけなぜかマッ チしてしまう • 規格の方が中途半端
20.
アルファベットにマッチする 正規表現 • 伝統的な方法: [a-zA-Z] • 文字プロパティ: [p{L}]または[p{Alphabetic}] • 明快、と思いきや
21.
• 日本語どころかあらゆる言語の文字とマッチしてい る • 記号や数字とはマッチしていない
22.
実は • 「アルファベット」という概念はそもそもABCだけではない • 文字セットのうち、「数字でなく」「スペースでなく」「記 号でない」ものすべてを指す • • 「国語」が国によって指すものが違うのと似ている だから日本語でも何語でも数字・記号以外のあらゆる文字セッ トにマッチする • これはPOSIXの[[:alpha:]]でも同じ
23.
という具合に • 実装に依存せず、多言語を串刺しにする正規表現を 作成するうえでUnicode文字プロパティは便利 • だが動作の検証は欠かせない
24.
• 詳細は TecheRacho にて • http://techracho.bpsinc.jp/ hachi8833/2013_09_13/13433
25.
• ご清聴ありがとうございました
Download