SlideShare a Scribd company logo
1 of 18
AHPDFXML
PDF文書の構造化とアクセスビリティの向上
1. 情報がアクセシブルとはなにか
高齢者や障害者を含めて、誰もが提供される情
報や機能を支障なく利用できることを意味します。
2.なぜアクセシビリティが求められているか
国連 障害者権利条約
日本は2014年1月20日に批准し、2月19日より効力が発生しました。
障害者差別解消法
平成25年6月に制定され、平成28年4月1日から施行されました。
 居住地域の安全に関わるデータを表したグラフが画像で掲載されており、その
画像に代替情報が用意されていない。そのため、視覚に障害のある住民が音
声読み上げソフトを利用して情報を取得しようとした際に、自身の安全に関
わる情報を入手できない。
 施設の所在地と道順を示した地図において、最寄りのバス停の名称を示した
文字の色が薄く、色を識別しづらい利用者がバス停の名称を読み取れない。
3.情報がアクセスブルでない例
総務省
「みんなの公共サイト 運用ガイドライン」より
 公式ホームページで市長の会見の内容を動画で提供しているが、市長が話
した内容が字幕で提供されておらず、聴覚に障害のある利用者に内容が伝
わらない。
 公式ホームページの上部に配置されたメニューのリンクがキーボードで操作でき
るように作られておらず、手の動作が不自由でマウスを使うことができない利用
者がホームページを利用できない。
2. PDFをアクセスブルにするのは何故難しいのか
 PDFは紙に印刷するのと同じ状態のページのイメージを保存するためのファイル
形式です。
 PDFは仮想のプリンター(PDFプリンタードライバーともいいます)を使ってアプリ
ケーションの印刷機能から作成する方法が普及しています。
 基本的にPDF内部は、描画オブジェクトの集まりです。
 テキストは論理的に並んでいるとは限りません。段組み、段落、表情報は存在
するとは限りません。
6
• PDFの内容を構造化して、アクセスブルにするために、
AHPDFXMLの設計を開始しました。
4.PDFの文書構造を表現するAHPDFXML
5.AHPDFXMLの構造
• PDF内の情報を構造化してタグ付けします。
Document
Page
Page
Page
Section
Section
Frame
Frame
Frame
 Document
documentは、 1個のPDFに対応した文書構造のルート要素です。
documentは、PDFのページに対応した複数のpage要素から構成され
ます。
 Page
pageは、PDFの1ページを表す要素です。
pageは、ヘッダ要素、フッタ要素、複数のsection要素から構成されます。
 Section
sectionは、段組を表現するための要素です。
sectionは、段数分の段組み幅の要素、複数のframe要素から構成され
ます。
 Frame
frameは、枠を表現する要素です。
frameの種類は、テキスト、表、イメージ、シェイプテキスト、シェイプテーブル
等です。
Frame
(種別=text)
P
段落
P
段落
P
段落
Line
行
Line
行
Line
行
Run
文字列
Run
文字列
Run
文字列
 Frame (text)
テキストフレームは複数のP(段落)要素から構成されます。
 P
pは、段落を表現する要素です。
pは、複数のLine(行)要素から構成されます。
 Line
lineは、行を表現する要素です。
lineは、複数のrun(文字列)要素から構成されます。
Frame
(種別=table)
Table-column
row
Cell
セル
Table-column
Table-column
row
row
row
Cell
セル
Cell
セル
 Frame (table)
テーブルフレームは1個のtable(表)要素で構成されます。
 Table
tableは、表を表現する要素です。
tableは、複数のtable-column (列)と複数のrow(行)要素から
構成されます。
 row
rowは、行の行を表現する要素です。
rowは、複数のcell(セル)要素から構成されます。
6.AHPDFXMLのためのPDF解析の工夫
 線画オブジェクトから、直線と四角形を選び出します。
横線と縦線を列挙します。
この横線と縦線の交わりからセルを作り出し、表を作成します。
セル1 セル2 セル3
セル4 セル5 セル6
セル7 セル8 セル9
セル10 セル11 セル12
 文字を座標順に並び替えます。
 セルのテキストを判断します。
 段落を作成します。
 段組みを判断します。
2段組み
8.AHPDFXMLの用途
 HTMLの変換や、テキストの抽出
XSLTスタイルシートを作成して、HTMLの変換や、テキスト
の抽出ができる。
 オープンオフィスXMLへ変換
Javaなどでプログラミングして、OOXMLへ変換する。
 アクセスブルなPDF作成
AHPDFXMLでPDFを解析し、タグ付けして、再度PDF保存し
て、アクセスブルなPDF/UAを作成する。
8.AHPDFXML出力課題
 ヘッダ・フッタの認識
ページ番号や作成日付、印刷日付等の前ページに共通したコンテンツを判断して、
ヘッダ、フッタのタグをつける。
読み上げツールで読み上げないようにする。

More Related Content

Viewers also liked

Noticias inmobiliarias de hoy - 2 de noviembre
Noticias inmobiliarias de hoy - 2 de noviembreNoticias inmobiliarias de hoy - 2 de noviembre
Noticias inmobiliarias de hoy - 2 de noviembrePrueba Social
 
Angel paúl maliza cruz
Angel paúl maliza cruzAngel paúl maliza cruz
Angel paúl maliza cruzangel_maliza
 
Единый канал коммуникаций между бизнесом и его клиентами
Единый канал коммуникаций между бизнесом и его клиентамиЕдиный канал коммуникаций между бизнесом и его клиентами
Единый канал коммуникаций между бизнесом и его клиентамиVoximplant
 
Comments on social protection, transfers and remittances indicators of the Ru...
Comments on social protection, transfers and remittances indicators of the Ru...Comments on social protection, transfers and remittances indicators of the Ru...
Comments on social protection, transfers and remittances indicators of the Ru...ExternalEvents
 
Entornos aprendizaje virtual sowa
Entornos aprendizaje virtual sowaEntornos aprendizaje virtual sowa
Entornos aprendizaje virtual sowaSilvia Sowa
 
Introducción a wi fi (802
Introducción a wi fi (802Introducción a wi fi (802
Introducción a wi fi (802Anderson Rey
 
Чудесан животињски свет
Чудесан животињски светЧудесан животињски свет
Чудесан животињски светTihomir Kostadinovic
 
Basic glossary of web design terms for non designers (part 2)
Basic glossary of web design terms for non designers (part 2)Basic glossary of web design terms for non designers (part 2)
Basic glossary of web design terms for non designers (part 2)Designveloper
 

Viewers also liked (10)

Noticias inmobiliarias de hoy - 2 de noviembre
Noticias inmobiliarias de hoy - 2 de noviembreNoticias inmobiliarias de hoy - 2 de noviembre
Noticias inmobiliarias de hoy - 2 de noviembre
 
Angel paúl maliza cruz
Angel paúl maliza cruzAngel paúl maliza cruz
Angel paúl maliza cruz
 
Единый канал коммуникаций между бизнесом и его клиентами
Единый канал коммуникаций между бизнесом и его клиентамиЕдиный канал коммуникаций между бизнесом и его клиентами
Единый канал коммуникаций между бизнесом и его клиентами
 
Comments on social protection, transfers and remittances indicators of the Ru...
Comments on social protection, transfers and remittances indicators of the Ru...Comments on social protection, transfers and remittances indicators of the Ru...
Comments on social protection, transfers and remittances indicators of the Ru...
 
Entornos aprendizaje virtual sowa
Entornos aprendizaje virtual sowaEntornos aprendizaje virtual sowa
Entornos aprendizaje virtual sowa
 
Introducción a wi fi (802
Introducción a wi fi (802Introducción a wi fi (802
Introducción a wi fi (802
 
LA CUIDADANÍA
LA CUIDADANÍALA CUIDADANÍA
LA CUIDADANÍA
 
Чудесан животињски свет
Чудесан животињски светЧудесан животињски свет
Чудесан животињски свет
 
Basic glossary of web design terms for non designers (part 2)
Basic glossary of web design terms for non designers (part 2)Basic glossary of web design terms for non designers (part 2)
Basic glossary of web design terms for non designers (part 2)
 
Trabajo final-catedra
Trabajo final-catedraTrabajo final-catedra
Trabajo final-catedra
 

Recently uploaded

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Gamesatsushi061452
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルCRI Japan, Inc.
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...Toru Tamaki
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video UnderstandingToru Tamaki
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptxsn679259
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイスCRI Japan, Inc.
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsWSO2
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。iPride Co., Ltd.
 

Recently uploaded (10)

論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 

Ahpdfxml