Ainl 2013 bogatyrev_математическая и лингвистическая
автоматическое построение оригинал макетов учебников как отч
1. Автоматическое построение
оригинал-макетов печатных
изданий как отчетов баз данных
учебных материалов
Аникеева Анна Викторовна
Новосибирский государственный университет
Механико-математический факультет
Новосибирск 2004
2. Актуальность проблемы
Необходимость представления учебных
материалов в различных формах:
В виде печатных учебников.
В виде электронных средств обучения (ЭСО).
Чаще всего, при наличии учебного материала
и оригинал-макет, и ЭСО создают отдельно.
Данный способ часто неэффективен:
При внесении изменений требуется повторение
трудоемких стадий для создания оригинал-макета.
Неудобство синхронизации этих изменений в различных
форматах.
3. Возможные подходы к
решению данной задачи
Подходы к решению:
Конвертирование из формата оригинал-макета в формат
ЭСО (например, из TeX в HTML).
Преобразование ЭСО в формат оригинал-макета
(например, конвертирование XML c помощью XSLT в
формализованную разметку).
Неудобство применения данных решений:
Сложна совместная работа авторского коллектива над
учебным материалом, особенно для территориально
разделенного коллектива.
4. Альтернативный подход к
данной проблеме
Последовательное построение ресурса на
основе БД и отделение данных от контекста
использования дает:
Возможность использования материала как ЭСО.
Возможность представления в виде оригинал-макета, как
специального отчета БД.
Но, на данный, момент нам не известны
программные продукты позволяющие
автоматически создавать оригинал-макет.
В работе исследованы пути и предложено
решение для автоматического построения
оригинал-макета как отчета БД учебных
материалов.
5. Цель работы
Целью настоящей работы являлось
исследование способов автоматического
построения оригинал-макетов учебников как
отчетов БД учебных материалов,
проектирование и реализация системы
автоматического построения оригинал-макетов
для Инструментального портала (ИП) создания и
поддержки информационных ресурсов научного
и образовательного характера, развиваемого в
НГУ.
6. Инструментальный портал
ИП предназначен для построения ЭСО, как
информационных систем на основе БД.
Web-сервис не требует дополнительного ПО
клиентской стороны.
СУБД лежащее в основе поддерживает:
Некоторые элементы объектного подхода (классы,
объекты, методы).
Работу с XML данными (форматированные тексты,
математическая нотация, векторная графика).
Поддерживаются ассоциативные контекстно-зависимые
связи между объектами БД (связь от отдельного
элемента текста одного объекта к другому объекту).
7. Основные требования к системе
построения оригинал-макета
В результате должен быть получен оригинал-
макет в формате TeX, RTF или PDF.
Графические форматы, поддерживаемые ИП,
должны быть преобразованы в форматы,
удовлетворяющие стандартам оригинал-макета.
После форматирования текста в оригинал-макете
должны сохраняться специальные шрифты и
математические формулы.
Ассоциативные контекстно-зависимые связи
должны быть автоматически преобразованы в
перекрестные ссылки.
Полученный оригинал-макет должен сохранять
организацию книги в соответствии с ГОСТ.
8. Подход к автоматическому
построению оригинал-макета.
Получение печатного издания на языке
формальной разметки осуществляется
следующим образом:
Для каждого элемента БД строится отдельный скрипт на
языке формальной разметки. Этот скрипт создается
специальным методом того класса, которому
принадлежит элемент. Эти методы должны быть
написаны заранее для каждого класса модели данных и
представляют элемент на языке формальной разметки.
Они составляют специальный «интерфейс» построения
оригинал-макета и могут быть использованы
многократно.
Потом применяется конвертор, который, преобразует
документ с языка формальной разметки в формат
оригинал-макета.
9. Схема создания оригинал-
макета
документ на языке
формальной разметки
Класс
Скрипт
Генератор Конв ертор
гиперотчетов Скрипт
Оригинал-
БД (XML) макет
Методы Класс
класса Скрипт
Скрипт
10. Критерии выбора языка
формальной разметки
Наиболее известные языки: TeX, TEI, FO,
DocBook.
Критерии выбора:
Существование стандартных конверторов в TeX, PDF
или RTF.
Наличие Средств работы с формулами.
Возможность использования специальных шрифтов.
Удобная работа с графическими форматами.
По этим критериям был проведен анализ,
раскрывающий возможности данных
языков формальной разметки
11. Таблица сравнений
Параметры TeX TEI
TeX ⊗ Существует единый конвертор
TeiTools, но под Linux
PDF Конвертор TEX->PDF Существует конвертор в FO а из
него в PDF
RTF Tex2RTF конвертор из ТЕХ в RTF TeiTools
Формулы Поддерживает использование Поддерживает встраивание
формул формул из MathML
Изображения Можно вставлять изображения Позволяет вставлять графику в
формата eps, но можно форматах CGM, TIFF или JPEG,
установить драйвер pdftex PNG
который умеет работать с jpg
Шрифты Для использования Не поддерживает изменение
кириллических шрифтов нужно шрифтов
установить пакет PsCyr и
использовать шрифты pfa
Viewer Имеет собственные Имеется XSLT для
просмотрщики, например DVI трансформации информации из
Viewer TEI в HTML
12. Выбор языка формальной
разметки
Анализ показал, что более перспективными
являются языки, основанные на XML. Однако, при
первом рассмотрении был выбран TeX, так как он
удовлетворял нашим основным требованиям. И
часть работы уже была реализована TeX.
Но исследования не были прекращены, и после
более детального изучения было решено
использовать TEI.
Прост и удобен в применении.
Основан на XML.
13. Проделанная работа
Для всех элементов были написаны методы,
представляющие эти элементы на языке
формальной разметки. Применение этих
методов позволило разметить содержание,
титульный лист и аннотацию, осуществить
структурную разметку основной части текста:
Прослеживать разметку «в глубину» (на главы,
подглавы, параграфы, пункты).
Производить визуальную разметку (разбиение на
абзацы и страницы, учет отступов, межстрочных
состояний, начертания шрифтов).
Отслеживать и размечать списки, таблицы и цитаты.
Ассоциативные контекстно-зависимые связи
преобразовывать в перекрестные ссылки.
14. Применение и тестирование
Созданные средства построения оригинал-
макетов применялись и тестировались в составе
ИП и были использованы для построения
оригинал-макета печатного издания учебного
курса «Физика атомов и молекул».
Издание имеет все необходимые данные и
типовую организацию структуры книги:
содержание, титульный лист, аннотацию,
форматированный текст и справочную
информацию.
Созданная система готова к построению
оригинал-макетов любых учебных пособий,
реализованных в инструментальном портале.
15. Подведение итогов
Исследована возможность автоматического построения
оригинал-макета учебного издания как отчета БД учебных
материалов.
Предложен и развит подход построения оригинал-макетов
учебных изданий ЭСО применительно к объектным базам
данных, поддерживающих XML-поля. Данный подход
реализован для ИП построения ЭСО.
Система была применена для практического построения
оригинал-макетов учебных изданий.
Созданное ПО позволяет автоматизированное построение
оригинал-макета учебных ресурсов портала и допускает их
представление в формате PDF.
16. Дальнейшее развитие
Планируется продолжение работ по
развитию функциональности данной системы:
Предполагается встроить поддержку вывода
векторной графики (SVG) в оригинал-макете.
Доведение системы до полностью автоматического
уровня и ее интеграции в Портал, что позволит
удаленным пользователям не только создавать
сложные ЭСО, но и на любом этапе создания и
редактирования ресурса автоматически получать их
оригинал-макеты для печатных изданий.
17. Спасибо за внимание
Работа представлена
Аникеевой Анной Викторовной
e-mail: anikeeva@gorodok.net
Мультимедиа центр Новосибирского
государственного университета:
Телефон: (3832)39-75-08
Kazakov@phys .nsu.ru