漢和辞典 Unicode 
角川文化振興財団 
田中弘一(事務局長)〒坂倉基 
1
2 
「角川新字源」について 
•「角川新字源」とは? 初版発行1968年1月 以来50版、450万部以上を誇るロングセラー。 現行版は親字約10000字、用例60000余語。 「増補字源」「漢和中辞典」以来の、かつ、 現在は「大字源」とともに角川の主要漢和辞典。 しかし長いあいだ更新が停滞(1994年以来)。 
•現在、鋭意改訂作業中! 
字義(語釈)の全面的な見直し 
親字および熟語の再選定 
文字コードの取り込み,etc. 
& 
ボーンデジタル で再構築
3 
「角川新字源」オープン化計画 
•ボーンデジタルって? 要はデータで作ること! 
編纂システムの構築 
専用フォントの制作 
自動組版の採用 
タグ(マークアップ)テキスト化,etc. 
<p>■熟語</p><div class=“leftMargin“><p><font face=” 新字源外字,新字源外字 Regular”></font></p>…………… 
•オープンなデータとして提供できるのでは? デジタルメディアでのマルチユースだけではなく。 角川文化振興財団として、 オープンなアカデミックリソースとしての活用法を研究中。 (時期や範囲については、まだ未定……。)
4 
「角川新字源」フォント&コード 
•専用フォントの制作 基本は従来使用していた凸版明朝。 “世界観”に合わせて大幅修正。 電子版でも字形を正確に再現可能。 
•Unicodeによる符号化 当然、“字母”を用意しただけでは無意味。 使える活字にするためには、符号化が必要。 Unicodeから始めた符号化の作業。 
U+0001 
U+0002 
U+0003U+0001U+0002 
U+0003 
U+0001 
U+0002 
U+0003 
U+0001 
U+0002 
U+0003 
U+0001 
U+0002U+0003 
U+0001 
U+0002 
U+0003
5 
「角川新字源」フォント&コード2 
•異体字とデザイン差の取り扱い →字体弁別粒度*と包摂基準の問題 用語、基準の問題。辞書での「異体字」と文字コードでの「異体字」。 辞書での「デザイン差」と文字コードでの「包摂」。 字形がマッチしないものについては、コードを割り振らないのか? それとも一番近いものに割り振るのか? 利用者が求めているものは何か? 
•Unicodeの採用字形を読み解く なぜこの字形が採用されたのか? 同じ意図で、「新字源」が採用した字形はどれなのか? (理想を言えば……。)
6 
「角川新字源」フォント&コード3 
•こういう字はどうしようか? 
「新字源」親字表 
(採用字形) 
Unicode表 (The Unicode Standard, Version 7.0 ) 他にも……「亭」など。 見出字U+4EAD 異体字U+20158? 
……「像」など。 
見出字U+50CF 
異体字U+2F80B 
(IVDならU+50CF U+E0103 )
7 
解決のために 
結局のところ…… 
•どのコードをどこまで載せるのか、 基準をしっかり決める。 
•Unicodeをきちんと知る。
8 
未来のために 【漢和辞典の宿題】 
•IVDを取り入れるのか? 
•正字(≒康煕字典体)、国語施策、 そして例示字形〒デジタルフォント。 
•かつては漢文を読むためのもの、今は? 
•国語辞典が担えない機能は?

漢和辞典とUnicode 角川文化振興財団

  • 1.
    漢和辞典 Unicode 角川文化振興財団 田中弘一(事務局長)〒坂倉基 1
  • 2.
    2 「角川新字源」について •「角川新字源」とは?初版発行1968年1月 以来50版、450万部以上を誇るロングセラー。 現行版は親字約10000字、用例60000余語。 「増補字源」「漢和中辞典」以来の、かつ、 現在は「大字源」とともに角川の主要漢和辞典。 しかし長いあいだ更新が停滞(1994年以来)。 •現在、鋭意改訂作業中! 字義(語釈)の全面的な見直し 親字および熟語の再選定 文字コードの取り込み,etc. & ボーンデジタル で再構築
  • 3.
    3 「角川新字源」オープン化計画 •ボーンデジタルって?要はデータで作ること! 編纂システムの構築 専用フォントの制作 自動組版の採用 タグ(マークアップ)テキスト化,etc. <p>■熟語</p><div class=“leftMargin“><p><font face=” 新字源外字,新字源外字 Regular”></font></p>…………… •オープンなデータとして提供できるのでは? デジタルメディアでのマルチユースだけではなく。 角川文化振興財団として、 オープンなアカデミックリソースとしての活用法を研究中。 (時期や範囲については、まだ未定……。)
  • 4.
    4 「角川新字源」フォント&コード •専用フォントの制作基本は従来使用していた凸版明朝。 “世界観”に合わせて大幅修正。 電子版でも字形を正確に再現可能。 •Unicodeによる符号化 当然、“字母”を用意しただけでは無意味。 使える活字にするためには、符号化が必要。 Unicodeから始めた符号化の作業。 U+0001 U+0002 U+0003U+0001U+0002 U+0003 U+0001 U+0002 U+0003 U+0001 U+0002 U+0003 U+0001 U+0002U+0003 U+0001 U+0002 U+0003
  • 5.
    5 「角川新字源」フォント&コード2 •異体字とデザイン差の取り扱い→字体弁別粒度*と包摂基準の問題 用語、基準の問題。辞書での「異体字」と文字コードでの「異体字」。 辞書での「デザイン差」と文字コードでの「包摂」。 字形がマッチしないものについては、コードを割り振らないのか? それとも一番近いものに割り振るのか? 利用者が求めているものは何か? •Unicodeの採用字形を読み解く なぜこの字形が採用されたのか? 同じ意図で、「新字源」が採用した字形はどれなのか? (理想を言えば……。)
  • 6.
    6 「角川新字源」フォント&コード3 •こういう字はどうしようか? 「新字源」親字表 (採用字形) Unicode表 (The Unicode Standard, Version 7.0 ) 他にも……「亭」など。 見出字U+4EAD 異体字U+20158? ……「像」など。 見出字U+50CF 異体字U+2F80B (IVDならU+50CF U+E0103 )
  • 7.
    7 解決のために 結局のところ…… •どのコードをどこまで載せるのか、 基準をしっかり決める。 •Unicodeをきちんと知る。
  • 8.
    8 未来のために 【漢和辞典の宿題】 •IVDを取り入れるのか? •正字(≒康煕字典体)、国語施策、 そして例示字形〒デジタルフォント。 •かつては漢文を読むためのもの、今は? •国語辞典が担えない機能は?