SlideShare a Scribd company logo
Автоматическое построение
 оригинал-макетов печатных
 изданий как отчетов баз данных
 учебных материалов

Аникеева Анна Викторовна
Новосибирский государственный университет
Механико-математический факультет



                  Новосибирск 2004
Актуальность проблемы
   Необходимость     представления                  учебных
    материалов в различных формах:
       В виде печатных учебников.
       В виде электронных средств обучения (ЭСО).
   Чаще всего, при наличии учебного материала
    и оригинал-макет, и ЭСО создают отдельно.
   Данный способ часто неэффективен:
       При внесении изменений требуется повторение
        трудоемких стадий для создания оригинал-макета.
       Неудобство синхронизации этих изменений в различных
        форматах.
Возможные подходы к
решению данной задачи
   Подходы к решению:
       Конвертирование из формата оригинал-макета в формат
        ЭСО (например, из TeX в HTML).
       Преобразование ЭСО в формат оригинал-макета
        (например, конвертирование XML c помощью XSLT в
        формализованную разметку).
   Неудобство применения данных решений:
       Сложна совместная работа авторского коллектива над
        учебным материалом, особенно для территориально
        разделенного коллектива.
Альтернативный подход к
    данной проблеме
   Последовательное построение ресурса на
    основе БД и отделение данных от контекста
    использования дает:
       Возможность использования материала как ЭСО.
       Возможность представления в виде оригинал-макета, как
        специального отчета БД.
   Но, на данный, момент нам не известны
    программные       продукты     позволяющие
    автоматически создавать оригинал-макет.
   В работе исследованы пути и предложено
    решение для автоматического построения
    оригинал-макета как отчета БД учебных
    материалов.
Цель работы
     Целью   настоящей    работы    являлось
исследование    способов     автоматического
построения оригинал-макетов учебников как
отчетов     БД      учебных      материалов,
проектирование    и   реализация     системы
автоматического построения оригинал-макетов
для Инструментального портала (ИП) создания и
поддержки информационных ресурсов научного
и образовательного характера, развиваемого в
НГУ.
Инструментальный портал
   ИП предназначен для построения ЭСО, как
    информационных систем на основе БД.
   Web-сервис не требует дополнительного ПО
    клиентской стороны.
   СУБД лежащее в основе поддерживает:
       Некоторые элементы объектного подхода (классы,
        объекты, методы).
       Работу с XML данными (форматированные тексты,
        математическая нотация, векторная графика).
       Поддерживаются ассоциативные контекстно-зависимые
        связи между объектами БД (связь от отдельного
        элемента текста одного объекта к другому объекту).
Основные требования к системе
построения оригинал-макета
   В результате должен быть получен оригинал-
    макет в формате TeX, RTF или PDF.
   Графические форматы, поддерживаемые ИП,
    должны быть преобразованы в форматы,
    удовлетворяющие стандартам оригинал-макета.
   После форматирования текста в оригинал-макете
    должны сохраняться специальные шрифты и
    математические формулы.
   Ассоциативные     контекстно-зависимые   связи
    должны быть автоматически преобразованы в
    перекрестные ссылки.
   Полученный оригинал-макет должен сохранять
    организацию книги в соответствии с ГОСТ.
Подход к автоматическому
построению оригинал-макета.
   Получение печатного издания на языке
    формальной    разметки   осуществляется
    следующим образом:
       Для каждого элемента БД строится отдельный скрипт на
        языке формальной разметки. Этот скрипт создается
        специальным     методом    того   класса,  которому
        принадлежит элемент. Эти методы должны быть
        написаны заранее для каждого класса модели данных и
        представляют элемент на языке формальной разметки.
        Они составляют специальный «интерфейс» построения
        оригинал-макета    и   могут    быть   использованы
        многократно.
        Потом применяется конвертор, который, преобразует
        документ с языка формальной разметки в формат
        оригинал-макета.
Схема создания оригинал-
      макета

                            документ на языке
                           формальной разметки
                          Класс
                                     Скрипт

             Генератор                           Конв ертор
           гиперотчетов              Скрипт
                                                              Оригинал-
БД (XML)                                                       макет
            Методы         Класс
            класса                   Скрипт

                                     Скрипт
Критерии выбора языка
формальной разметки
   Наиболее известные языки: TeX, TEI, FO,
    DocBook.
   Критерии выбора:
       Существование стандартных конверторов в TeX, PDF
        или RTF.
       Наличие Средств работы с формулами.
       Возможность использования специальных шрифтов.
       Удобная работа с графическими форматами.
   По этим критериям был проведен анализ,
    раскрывающий     возможности   данных
    языков формальной разметки
Таблица сравнений
 Параметры TeX                               TEI
        TeX                ⊗                 Существует единый конвертор
                                             TeiTools, но под Linux

        PDF Конвертор TEX->PDF               Существует конвертор в FO а из
                                             него в PDF


        RTF Tex2RTF конвертор из ТЕХ в RTF   TeiTools

   Формулы Поддерживает использование        Поддерживает встраивание
           формул                            формул из MathML
Изображения Можно вставлять изображения      Позволяет вставлять графику в
            формата eps, но можно            форматах CGM, TIFF или JPEG,
            установить драйвер pdftex        PNG
            который умеет работать с jpg
   Шрифты Для использования                  Не поддерживает изменение
          кириллических шрифтов нужно        шрифтов
          установить пакет PsCyr и
          использовать шрифты pfa
     Viewer Имеет собственные                Имеется XSLT для
            просмотрщики, например DVI       трансформации информации из
            Viewer                           TEI в HTML
Выбор языка формальной
           разметки
   Анализ показал, что более перспективными
    являются языки, основанные на XML. Однако, при
    первом рассмотрении был выбран TeX, так как он
    удовлетворял нашим основным требованиям. И
    часть работы уже была реализована TeX.
   Но исследования не были прекращены, и после
    более    детального   изучения    было решено
    использовать TEI.
       Прост и удобен в применении.
       Основан на XML.
Проделанная работа
   Для всех элементов были написаны методы,
    представляющие эти элементы на языке
    формальной    разметки.   Применение     этих
    методов позволило разметить содержание,
    титульный лист и аннотацию, осуществить
    структурную разметку основной части текста:
       Прослеживать разметку «в глубину» (на главы,
        подглавы, параграфы, пункты).
       Производить визуальную разметку (разбиение на
        абзацы и страницы, учет отступов, межстрочных
        состояний, начертания шрифтов).
       Отслеживать и размечать списки, таблицы и цитаты.
       Ассоциативные       контекстно-зависимые      связи
        преобразовывать в перекрестные ссылки.
Применение и тестирование
    Созданные средства построения оригинал-
макетов применялись и тестировались в составе
ИП и были использованы для построения
оригинал-макета печатного издания учебного
курса «Физика атомов и молекул».
    Издание имеет все необходимые данные и
типовую     организацию     структуры     книги:
содержание,    титульный    лист,    аннотацию,
форматированный       текст    и    справочную
информацию.
    Созданная система готова к построению
оригинал-макетов любых учебных пособий,
реализованных в инструментальном портале.
Подведение итогов
   Исследована возможность автоматического построения
    оригинал-макета учебного издания как отчета БД учебных
    материалов.
   Предложен и развит подход построения оригинал-макетов
    учебных изданий ЭСО применительно к объектным базам
    данных, поддерживающих XML-поля. Данный подход
    реализован для ИП построения ЭСО.
   Система была применена для практического построения
    оригинал-макетов учебных изданий.
   Созданное ПО позволяет автоматизированное построение
    оригинал-макета учебных ресурсов портала и допускает их
    представление в формате PDF.
Дальнейшее развитие
    Планируется  продолжение    работ    по
развитию функциональности данной системы:
          Предполагается     встроить   поддержку    вывода
           векторной графики (SVG) в оригинал-макете.
          Доведение системы до полностью автоматического
           уровня и ее интеграции в Портал, что позволит
           удаленным пользователям не только создавать
           сложные ЭСО, но и на любом этапе создания и
           редактирования ресурса автоматически получать их
           оригинал-макеты для печатных изданий.
Спасибо за внимание
Работа представлена
Аникеевой Анной Викторовной
e-mail: anikeeva@gorodok.net

 Мультимедиа центр Новосибирского
государственного университета:
Телефон: (3832)39-75-08
Kazakov@phys .nsu.ru

More Related Content

Viewers also liked

Protagonistas de cuento
Protagonistas de cuentoProtagonistas de cuento
Protagonistas de cuento
erreka
 
1242625986my upload
1242625986my upload1242625986my upload
1242625986my upload
51 lecture
 
Primeira república (1889 1930) - capítulo 5
Primeira república (1889 1930) - capítulo 5Primeira república (1889 1930) - capítulo 5
Primeira república (1889 1930) - capítulo 5
alunoscsa
 
La resiliencia
La resilienciaLa resiliencia
La resiliencia
yenso
 
Com Crear Una Pàgina Web
Com Crear Una Pàgina WebCom Crear Una Pàgina Web
Com Crear Una Pàgina Web
planas
 
Ficha1 diogo almeida
Ficha1 diogo almeidaFicha1 diogo almeida
Ficha1 diogo almeida
Diogo Almeida
 
Многопользовательские браузерные игры нового типа
Многопользовательские браузерные игры нового типаМногопользовательские браузерные игры нового типа
Многопользовательские браузерные игры нового типа
Anton Volkov
 

Viewers also liked (20)

Protagonistas de cuento
Protagonistas de cuentoProtagonistas de cuento
Protagonistas de cuento
 
1242625986my upload
1242625986my upload1242625986my upload
1242625986my upload
 
Primeira república (1889 1930) - capítulo 5
Primeira república (1889 1930) - capítulo 5Primeira república (1889 1930) - capítulo 5
Primeira república (1889 1930) - capítulo 5
 
Imagens das juventudes no mundo contemporâneo 2015
Imagens das juventudes no mundo contemporâneo 2015Imagens das juventudes no mundo contemporâneo 2015
Imagens das juventudes no mundo contemporâneo 2015
 
Apresentação do blog
Apresentação do blogApresentação do blog
Apresentação do blog
 
Academia DHM
Academia DHMAcademia DHM
Academia DHM
 
Inclusão digital Venilson e Assislando
Inclusão digital Venilson e AssislandoInclusão digital Venilson e Assislando
Inclusão digital Venilson e Assislando
 
Homer simpson
Homer simpsonHomer simpson
Homer simpson
 
Samennogdeskundigerindetoekomstpabozweden 090513052309 Phpapp01
Samennogdeskundigerindetoekomstpabozweden 090513052309 Phpapp01Samennogdeskundigerindetoekomstpabozweden 090513052309 Phpapp01
Samennogdeskundigerindetoekomstpabozweden 090513052309 Phpapp01
 
Deodoro da fonseca
Deodoro da fonseca Deodoro da fonseca
Deodoro da fonseca
 
7 41
7 417 41
7 41
 
La resiliencia
La resilienciaLa resiliencia
La resiliencia
 
Com Crear Una Pàgina Web
Com Crear Una Pàgina WebCom Crear Una Pàgina Web
Com Crear Una Pàgina Web
 
Reg testdrive rev_2014
Reg testdrive rev_2014Reg testdrive rev_2014
Reg testdrive rev_2014
 
Computacion
ComputacionComputacion
Computacion
 
La resiliencia
La resilienciaLa resiliencia
La resiliencia
 
Ficha1 diogo almeida
Ficha1 diogo almeidaFicha1 diogo almeida
Ficha1 diogo almeida
 
A abolicao do homem c. s.lewis
A abolicao do homem   c. s.lewisA abolicao do homem   c. s.lewis
A abolicao do homem c. s.lewis
 
Многопользовательские браузерные игры нового типа
Многопользовательские браузерные игры нового типаМногопользовательские браузерные игры нового типа
Многопользовательские браузерные игры нового типа
 
Bachillerato UGM
Bachillerato UGMBachillerato UGM
Bachillerato UGM
 

Similar to автоматическое построение оригинал макетов учебников как отч

"Оффис вне оффиса"
"Оффис вне оффиса""Оффис вне оффиса"
"Оффис вне оффиса"
ANSevrukova
 
C++ осень 2012 лекция 7
C++ осень 2012 лекция 7C++ осень 2012 лекция 7
C++ осень 2012 лекция 7
Technopark
 
Решение по управлению технической и инженерной документацией от компании Oracle
Решение по управлению технической и инженерной документацией от компании OracleРешение по управлению технической и инженерной документацией от компании Oracle
Решение по управлению технической и инженерной документацией от компании Oracle
Anton Shmakov
 
Fact Extraction (ideograph)
Fact Extraction (ideograph)Fact Extraction (ideograph)
Fact Extraction (ideograph)
NLPseminar
 
метод организации репозитория исходного кода
метод организации репозитория исходного кодаметод организации репозитория исходного кода
метод организации репозитория исходного кода
Sergii Shmarkatiuk
 
Инструмент для разработки эл. курсов Course lab. WebSoft
Инструмент для разработки эл. курсов Course lab. WebSoftИнструмент для разработки эл. курсов Course lab. WebSoft
Инструмент для разработки эл. курсов Course lab. WebSoft
Сообщество eLearning PRO
 
Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическая
AINL Conferences
 

Similar to автоматическое построение оригинал макетов учебников как отч (20)

Html лаб 2
Html лаб 2Html лаб 2
Html лаб 2
 
"Оффис вне оффиса"
"Оффис вне оффиса""Оффис вне оффиса"
"Оффис вне оффиса"
 
Инструментальные системы извлечения информации
Инструментальные системы извлечения информацииИнструментальные системы извлечения информации
Инструментальные системы извлечения информации
 
Потокавая обработка текстовых данных.pptx
Потокавая обработка текстовых данных.pptxПотокавая обработка текстовых данных.pptx
Потокавая обработка текстовых данных.pptx
 
Lection1
Lection1Lection1
Lection1
 
Как и зачем можно создать DSL на Python
Как и зачем можно создать DSL на PythonКак и зачем можно создать DSL на Python
Как и зачем можно создать DSL на Python
 
Теория языков программирования некоторые слайды к лекциям
Теория языков программирования некоторые слайды к лекциямТеория языков программирования некоторые слайды к лекциям
Теория языков программирования некоторые слайды к лекциям
 
C++ осень 2012 лекция 7
C++ осень 2012 лекция 7C++ осень 2012 лекция 7
C++ осень 2012 лекция 7
 
Симуляционное моделирование и семантические технологии
Симуляционное моделирование и семантические технологииСимуляционное моделирование и семантические технологии
Симуляционное моделирование и семантические технологии
 
IBM ECM :: Сравнение документов "на просвет"
IBM ECM :: Сравнение документов "на просвет"IBM ECM :: Сравнение документов "на просвет"
IBM ECM :: Сравнение документов "на просвет"
 
4я лекция - Прототипирование.
4я лекция - Прототипирование.4я лекция - Прототипирование.
4я лекция - Прототипирование.
 
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
Смолина Пользовательские интерфейсы систем лингвистической разметки текстовСмолина Пользовательские интерфейсы систем лингвистической разметки текстов
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
 
Автоматическое построение лексико-синтаксических шаблонов по текстам предметн...
Автоматическое построение лексико-синтаксических шаблонов по текстам предметн...Автоматическое построение лексико-синтаксических шаблонов по текстам предметн...
Автоматическое построение лексико-синтаксических шаблонов по текстам предметн...
 
Решение по управлению технической и инженерной документацией от компании Oracle
Решение по управлению технической и инженерной документацией от компании OracleРешение по управлению технической и инженерной документацией от компании Oracle
Решение по управлению технической и инженерной документацией от компании Oracle
 
Stolyarov
StolyarovStolyarov
Stolyarov
 
Fact Extraction (ideograph)
Fact Extraction (ideograph)Fact Extraction (ideograph)
Fact Extraction (ideograph)
 
Custom Language Plugin for JetBrains IDEA
Custom Language Plugin for JetBrains IDEACustom Language Plugin for JetBrains IDEA
Custom Language Plugin for JetBrains IDEA
 
метод организации репозитория исходного кода
метод организации репозитория исходного кодаметод организации репозитория исходного кода
метод организации репозитория исходного кода
 
Инструмент для разработки эл. курсов Course lab. WebSoft
Инструмент для разработки эл. курсов Course lab. WebSoftИнструмент для разработки эл. курсов Course lab. WebSoft
Инструмент для разработки эл. курсов Course lab. WebSoft
 
Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическая
 

автоматическое построение оригинал макетов учебников как отч

  • 1. Автоматическое построение оригинал-макетов печатных изданий как отчетов баз данных учебных материалов Аникеева Анна Викторовна Новосибирский государственный университет Механико-математический факультет Новосибирск 2004
  • 2. Актуальность проблемы  Необходимость представления учебных материалов в различных формах:  В виде печатных учебников.  В виде электронных средств обучения (ЭСО).  Чаще всего, при наличии учебного материала и оригинал-макет, и ЭСО создают отдельно.  Данный способ часто неэффективен:  При внесении изменений требуется повторение трудоемких стадий для создания оригинал-макета.  Неудобство синхронизации этих изменений в различных форматах.
  • 3. Возможные подходы к решению данной задачи  Подходы к решению:  Конвертирование из формата оригинал-макета в формат ЭСО (например, из TeX в HTML).  Преобразование ЭСО в формат оригинал-макета (например, конвертирование XML c помощью XSLT в формализованную разметку).  Неудобство применения данных решений:  Сложна совместная работа авторского коллектива над учебным материалом, особенно для территориально разделенного коллектива.
  • 4. Альтернативный подход к данной проблеме  Последовательное построение ресурса на основе БД и отделение данных от контекста использования дает:  Возможность использования материала как ЭСО.  Возможность представления в виде оригинал-макета, как специального отчета БД.  Но, на данный, момент нам не известны программные продукты позволяющие автоматически создавать оригинал-макет.  В работе исследованы пути и предложено решение для автоматического построения оригинал-макета как отчета БД учебных материалов.
  • 5. Цель работы Целью настоящей работы являлось исследование способов автоматического построения оригинал-макетов учебников как отчетов БД учебных материалов, проектирование и реализация системы автоматического построения оригинал-макетов для Инструментального портала (ИП) создания и поддержки информационных ресурсов научного и образовательного характера, развиваемого в НГУ.
  • 6. Инструментальный портал  ИП предназначен для построения ЭСО, как информационных систем на основе БД.  Web-сервис не требует дополнительного ПО клиентской стороны.  СУБД лежащее в основе поддерживает:  Некоторые элементы объектного подхода (классы, объекты, методы).  Работу с XML данными (форматированные тексты, математическая нотация, векторная графика).  Поддерживаются ассоциативные контекстно-зависимые связи между объектами БД (связь от отдельного элемента текста одного объекта к другому объекту).
  • 7. Основные требования к системе построения оригинал-макета  В результате должен быть получен оригинал- макет в формате TeX, RTF или PDF.  Графические форматы, поддерживаемые ИП, должны быть преобразованы в форматы, удовлетворяющие стандартам оригинал-макета.  После форматирования текста в оригинал-макете должны сохраняться специальные шрифты и математические формулы.  Ассоциативные контекстно-зависимые связи должны быть автоматически преобразованы в перекрестные ссылки.  Полученный оригинал-макет должен сохранять организацию книги в соответствии с ГОСТ.
  • 8. Подход к автоматическому построению оригинал-макета.  Получение печатного издания на языке формальной разметки осуществляется следующим образом:  Для каждого элемента БД строится отдельный скрипт на языке формальной разметки. Этот скрипт создается специальным методом того класса, которому принадлежит элемент. Эти методы должны быть написаны заранее для каждого класса модели данных и представляют элемент на языке формальной разметки. Они составляют специальный «интерфейс» построения оригинал-макета и могут быть использованы многократно.  Потом применяется конвертор, который, преобразует документ с языка формальной разметки в формат оригинал-макета.
  • 9. Схема создания оригинал- макета документ на языке формальной разметки Класс Скрипт Генератор Конв ертор гиперотчетов Скрипт Оригинал- БД (XML) макет Методы Класс класса Скрипт Скрипт
  • 10. Критерии выбора языка формальной разметки  Наиболее известные языки: TeX, TEI, FO, DocBook.  Критерии выбора:  Существование стандартных конверторов в TeX, PDF или RTF.  Наличие Средств работы с формулами.  Возможность использования специальных шрифтов.  Удобная работа с графическими форматами.  По этим критериям был проведен анализ, раскрывающий возможности данных языков формальной разметки
  • 11. Таблица сравнений Параметры TeX TEI TeX ⊗ Существует единый конвертор TeiTools, но под Linux PDF Конвертор TEX->PDF Существует конвертор в FO а из него в PDF RTF Tex2RTF конвертор из ТЕХ в RTF TeiTools Формулы Поддерживает использование Поддерживает встраивание формул формул из MathML Изображения Можно вставлять изображения Позволяет вставлять графику в формата eps, но можно форматах CGM, TIFF или JPEG, установить драйвер pdftex PNG который умеет работать с jpg Шрифты Для использования Не поддерживает изменение кириллических шрифтов нужно шрифтов установить пакет PsCyr и использовать шрифты pfa Viewer Имеет собственные Имеется XSLT для просмотрщики, например DVI трансформации информации из Viewer TEI в HTML
  • 12. Выбор языка формальной разметки  Анализ показал, что более перспективными являются языки, основанные на XML. Однако, при первом рассмотрении был выбран TeX, так как он удовлетворял нашим основным требованиям. И часть работы уже была реализована TeX.  Но исследования не были прекращены, и после более детального изучения было решено использовать TEI.  Прост и удобен в применении.  Основан на XML.
  • 13. Проделанная работа  Для всех элементов были написаны методы, представляющие эти элементы на языке формальной разметки. Применение этих методов позволило разметить содержание, титульный лист и аннотацию, осуществить структурную разметку основной части текста:  Прослеживать разметку «в глубину» (на главы, подглавы, параграфы, пункты).  Производить визуальную разметку (разбиение на абзацы и страницы, учет отступов, межстрочных состояний, начертания шрифтов).  Отслеживать и размечать списки, таблицы и цитаты.  Ассоциативные контекстно-зависимые связи преобразовывать в перекрестные ссылки.
  • 14. Применение и тестирование Созданные средства построения оригинал- макетов применялись и тестировались в составе ИП и были использованы для построения оригинал-макета печатного издания учебного курса «Физика атомов и молекул». Издание имеет все необходимые данные и типовую организацию структуры книги: содержание, титульный лист, аннотацию, форматированный текст и справочную информацию. Созданная система готова к построению оригинал-макетов любых учебных пособий, реализованных в инструментальном портале.
  • 15. Подведение итогов  Исследована возможность автоматического построения оригинал-макета учебного издания как отчета БД учебных материалов.  Предложен и развит подход построения оригинал-макетов учебных изданий ЭСО применительно к объектным базам данных, поддерживающих XML-поля. Данный подход реализован для ИП построения ЭСО.  Система была применена для практического построения оригинал-макетов учебных изданий.  Созданное ПО позволяет автоматизированное построение оригинал-макета учебных ресурсов портала и допускает их представление в формате PDF.
  • 16. Дальнейшее развитие  Планируется продолжение работ по развитию функциональности данной системы:  Предполагается встроить поддержку вывода векторной графики (SVG) в оригинал-макете.  Доведение системы до полностью автоматического уровня и ее интеграции в Портал, что позволит удаленным пользователям не только создавать сложные ЭСО, но и на любом этапе создания и редактирования ресурса автоматически получать их оригинал-макеты для печатных изданий.
  • 17. Спасибо за внимание Работа представлена Аникеевой Анной Викторовной e-mail: anikeeva@gorodok.net Мультимедиа центр Новосибирского государственного университета: Телефон: (3832)39-75-08 Kazakov@phys .nsu.ru