SlideShare a Scribd company logo
AHPDFXML
PDF文書の構造化とアクセスビリティの向上
1. 情報がアクセシブルとはなにか
高齢者や障害者を含めて、誰もが提供される情
報や機能を支障なく利用できることを意味します。
2.なぜアクセシビリティが求められているか
国連 障害者権利条約
日本は2014年1月20日に批准し、2月19日より効力が発生しました。
障害者差別解消法
平成25年6月に制定され、平成28年4月1日から施行されました。
 居住地域の安全に関わるデータを表したグラフが画像で掲載されており、その
画像に代替情報が用意されていない。そのため、視覚に障害のある住民が音
声読み上げソフトを利用して情報を取得しようとした際に、自身の安全に関
わる情報を入手できない。
 施設の所在地と道順を示した地図において、最寄りのバス停の名称を示した
文字の色が薄く、色を識別しづらい利用者がバス停の名称を読み取れない。
3.情報がアクセスブルでない例
総務省
「みんなの公共サイト 運用ガイドライン」より
 公式ホームページで市長の会見の内容を動画で提供しているが、市長が話
した内容が字幕で提供されておらず、聴覚に障害のある利用者に内容が伝
わらない。
 公式ホームページの上部に配置されたメニューのリンクがキーボードで操作でき
るように作られておらず、手の動作が不自由でマウスを使うことができない利用
者がホームページを利用できない。
2. PDFをアクセスブルにするのは何故難しいのか
 PDFは紙に印刷するのと同じ状態のページのイメージを保存するためのファイル
形式です。
 PDFは仮想のプリンター(PDFプリンタードライバーともいいます)を使ってアプリ
ケーションの印刷機能から作成する方法が普及しています。
 基本的にPDF内部は、描画オブジェクトの集まりです。
 テキストは論理的に並んでいるとは限りません。段組み、段落、表情報は存在
するとは限りません。
6
• PDFの内容を構造化して、アクセスブルにするために、
AHPDFXMLの設計を開始しました。
4.PDFの文書構造を表現するAHPDFXML
5.AHPDFXMLの構造
• PDF内の情報を構造化してタグ付けします。
Document
Page
Page
Page
Section
Section
Frame
Frame
Frame
 Document
documentは、 1個のPDFに対応した文書構造のルート要素です。
documentは、PDFのページに対応した複数のpage要素から構成され
ます。
 Page
pageは、PDFの1ページを表す要素です。
pageは、ヘッダ要素、フッタ要素、複数のsection要素から構成されます。
 Section
sectionは、段組を表現するための要素です。
sectionは、段数分の段組み幅の要素、複数のframe要素から構成され
ます。
 Frame
frameは、枠を表現する要素です。
frameの種類は、テキスト、表、イメージ、シェイプテキスト、シェイプテーブル
等です。
Frame
(種別=text)
P
段落
P
段落
P
段落
Line
行
Line
行
Line
行
Run
文字列
Run
文字列
Run
文字列
 Frame (text)
テキストフレームは複数のP(段落)要素から構成されます。
 P
pは、段落を表現する要素です。
pは、複数のLine(行)要素から構成されます。
 Line
lineは、行を表現する要素です。
lineは、複数のrun(文字列)要素から構成されます。
Frame
(種別=table)
Table-column
row
Cell
セル
Table-column
Table-column
row
row
row
Cell
セル
Cell
セル
 Frame (table)
テーブルフレームは1個のtable(表)要素で構成されます。
 Table
tableは、表を表現する要素です。
tableは、複数のtable-column (列)と複数のrow(行)要素から
構成されます。
 row
rowは、行の行を表現する要素です。
rowは、複数のcell(セル)要素から構成されます。
6.AHPDFXMLのためのPDF解析の工夫
 線画オブジェクトから、直線と四角形を選び出します。
横線と縦線を列挙します。
この横線と縦線の交わりからセルを作り出し、表を作成します。
セル1 セル2 セル3
セル4 セル5 セル6
セル7 セル8 セル9
セル10 セル11 セル12
 文字を座標順に並び替えます。
 セルのテキストを判断します。
 段落を作成します。
 段組みを判断します。
2段組み
8.AHPDFXMLの用途
 HTMLの変換や、テキストの抽出
XSLTスタイルシートを作成して、HTMLの変換や、テキスト
の抽出ができる。
 オープンオフィスXMLへ変換
Javaなどでプログラミングして、OOXMLへ変換する。
 アクセスブルなPDF作成
AHPDFXMLでPDFを解析し、タグ付けして、再度PDF保存し
て、アクセスブルなPDF/UAを作成する。
8.AHPDFXML出力課題
 ヘッダ・フッタの認識
ページ番号や作成日付、印刷日付等の前ページに共通したコンテンツを判断して、
ヘッダ、フッタのタグをつける。
読み上げツールで読み上げないようにする。

More Related Content

Viewers also liked

Noticias inmobiliarias de hoy - 2 de noviembre
Noticias inmobiliarias de hoy - 2 de noviembreNoticias inmobiliarias de hoy - 2 de noviembre
Noticias inmobiliarias de hoy - 2 de noviembre
Prueba Social
 
Angel paúl maliza cruz
Angel paúl maliza cruzAngel paúl maliza cruz
Angel paúl maliza cruz
angel_maliza
 
Единый канал коммуникаций между бизнесом и его клиентами
Единый канал коммуникаций между бизнесом и его клиентамиЕдиный канал коммуникаций между бизнесом и его клиентами
Единый канал коммуникаций между бизнесом и его клиентами
Voximplant
 
Comments on social protection, transfers and remittances indicators of the Ru...
Comments on social protection, transfers and remittances indicators of the Ru...Comments on social protection, transfers and remittances indicators of the Ru...
Comments on social protection, transfers and remittances indicators of the Ru...
ExternalEvents
 
Entornos aprendizaje virtual sowa
Entornos aprendizaje virtual sowaEntornos aprendizaje virtual sowa
Entornos aprendizaje virtual sowa
Silvia Sowa
 
Introducción a wi fi (802
Introducción a wi fi (802Introducción a wi fi (802
Introducción a wi fi (802
Anderson Rey
 
LA CUIDADANÍA
LA CUIDADANÍALA CUIDADANÍA
LA CUIDADANÍA
BrandisSubero
 
Чудесан животињски свет
Чудесан животињски светЧудесан животињски свет
Чудесан животињски свет
Tihomir Kostadinovic
 
Basic glossary of web design terms for non designers (part 2)
Basic glossary of web design terms for non designers (part 2)Basic glossary of web design terms for non designers (part 2)
Basic glossary of web design terms for non designers (part 2)
Designveloper
 
Trabajo final-catedra
Trabajo final-catedraTrabajo final-catedra
Trabajo final-catedra
Abimael Trespalacio Avila
 

Viewers also liked (10)

Noticias inmobiliarias de hoy - 2 de noviembre
Noticias inmobiliarias de hoy - 2 de noviembreNoticias inmobiliarias de hoy - 2 de noviembre
Noticias inmobiliarias de hoy - 2 de noviembre
 
Angel paúl maliza cruz
Angel paúl maliza cruzAngel paúl maliza cruz
Angel paúl maliza cruz
 
Единый канал коммуникаций между бизнесом и его клиентами
Единый канал коммуникаций между бизнесом и его клиентамиЕдиный канал коммуникаций между бизнесом и его клиентами
Единый канал коммуникаций между бизнесом и его клиентами
 
Comments on social protection, transfers and remittances indicators of the Ru...
Comments on social protection, transfers and remittances indicators of the Ru...Comments on social protection, transfers and remittances indicators of the Ru...
Comments on social protection, transfers and remittances indicators of the Ru...
 
Entornos aprendizaje virtual sowa
Entornos aprendizaje virtual sowaEntornos aprendizaje virtual sowa
Entornos aprendizaje virtual sowa
 
Introducción a wi fi (802
Introducción a wi fi (802Introducción a wi fi (802
Introducción a wi fi (802
 
LA CUIDADANÍA
LA CUIDADANÍALA CUIDADANÍA
LA CUIDADANÍA
 
Чудесан животињски свет
Чудесан животињски светЧудесан животињски свет
Чудесан животињски свет
 
Basic glossary of web design terms for non designers (part 2)
Basic glossary of web design terms for non designers (part 2)Basic glossary of web design terms for non designers (part 2)
Basic glossary of web design terms for non designers (part 2)
 
Trabajo final-catedra
Trabajo final-catedraTrabajo final-catedra
Trabajo final-catedra
 

Recently uploaded

FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance
 
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
iPride Co., Ltd.
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
Toru Tamaki
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
atsushi061452
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
NTT DATA Technology & Innovation
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
CRI Japan, Inc.
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
Sony - Neural Network Libraries
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
Yuuitirou528 default
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
Matsushita Laboratory
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
yassun7010
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
Fukuoka Institute of Technology
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
harmonylab
 

Recently uploaded (16)

FIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdfFIDO Alliance Osaka Seminar: CloudGate.pdf
FIDO Alliance Osaka Seminar: CloudGate.pdf
 
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
MPAなWebフレームワーク、Astroの紹介 (その2) 2024/05/24の勉強会で発表されたものです。
 
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
論文紹介:When Visual Prompt Tuning Meets Source-Free Domain Adaptive Semantic Seg...
 
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
論文紹介: Offline Q-Learning on diverse Multi-Task data both scales and generalizes
 
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
YugabyteDB適用に向けた取り組みと隠れた魅力 (DSS Asia 2024 発表資料)
 
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアルLoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
LoRaWAN 4チャンネル電流センサー・コンバーター CS01-LB 日本語マニュアル
 
【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow【AI論文解説】Consistency ModelとRectified Flow
【AI論文解説】Consistency ModelとRectified Flow
 
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdfFIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
FIDO Alliance Osaka Seminar: LY-DOCOMO-KDDI-Mercari Panel.pdf
 
CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料CS集会#13_なるほどわからん通信技術 発表資料
CS集会#13_なるほどわからん通信技術 発表資料
 
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdfFIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
FIDO Alliance Osaka Seminar: PlayStation Passkey Deployment Case Study.pdf
 
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdfFIDO Alliance Osaka Seminar: Welcome Slides.pdf
FIDO Alliance Osaka Seminar: Welcome Slides.pdf
 
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
TaketoFujikawa_物語のコンセプトに基づく情報アクセス手法の基礎検討_JSAI2024
 
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
2024年度_サイバーエージェント_新卒研修「データベースの歴史」.pptx
 
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdfFIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
FIDO Alliance Osaka Seminar: NEC & Yubico Panel.pdf
 
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
単腕マニピュレータによる 複数物体の同時組み立ての 基礎的考察 / Basic Approach to Robotic Assembly of Multi...
 
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
 

Ahpdfxml