Электронные издания

2bbc099f

Информационная структура современного издательства


В связи с быстрым развитием электронных средств и систем распространения информации возникает все больше вопросов относительно роли новых издательских технологий и значимости электронных изданий в современном мире. Прежде всего остановимся на том, какие изменения характеризуют современные технологии издательского процесса:

  • все более широкое использование компьютеров не только при непосредственной подготовке книги или журнала, но и для создания и ведения издательского портфеля, подготовки иллюстраций, оригинал-макетов, диапозитивов и пр.;

    использование сетевых технологий для организации совместной работы и взаимодействия наборщиков, верстальщиков, оформителей издания и т. д.;

    повсеместное внедрение электронной формы представления издательского портфеля в виде базы данных, в которой хранятся не только окончательно сверстанные издания, но зачастую и их версии;

    распространение в электронном виде точной копии печатного издания с возможностью ее последующей распечатки в случае необходимости в произвольном количестве экземпляров;

    появление принципиально новых типов изданий с использованием чисто компьютерных технологий, таких как гипертекст, мультимедиа, электронное аналоговое моделирование, анимационные эффекты;

    подключение практически всех средних и крупных издательств к всемирной сети Интернет, что открывает совершенно новые возможности сточки зрения доступа к информации, распространяемой данным издательством.

    В состав цифрового мультимедиа наряду с традиционными текстовыми и графическими файлами в самых различных форматах, входит также цифровые аудио файлы, анимационные графические файлы и видео файлы в цифровом формате.

    Основной информационных носитель цифрового мультимедиа - это компакт-диск, а в последние годы еще и DVD-диск, хотя такая информация может непосредственно передаваться по сетям связи, храниться в виде соответствующих файлов на жестких магнитных дисках персональных компьютеров, накапливаться в виде специальных баз данных, к которым возможно, в том числе и дистанционное обращение для занесения новой или извлечения имеющейся информации.


    Все известные традиционные промышленные технологии имеют ограниченную сферу применения, что обычно следует из самого их названия. В то же время трудно привести пример области науки или техники, которая хотя бы потенциально не была связана с технологиями мультимедиа. Цифровое мультимедиа объединяет все известные формы представления информации - текст, графику и фотографические изображения, цифровое видео и аудио, цифровые модели объектов и интерактивные данные, такие как Java-апплеты. Главная задача мультимедиа технологий состоит интеграции процессов создания, управления и распространения информации любого вида.



    Современное издательство постепенно превращается в систему для Обработки и хранения цифровой медиа-информации. В функции издательской системы будет входить оцифровка, индексация, длительное хранение, извлечение и защита от несанкционированного доступа цифровой медиа-информации в распределенной сетевой среде. Основные подсистемы издательской информационной системы, представленные на рис. 7.2
    , перечислены ниже
    :



    • централизованное хранилище цифровой информации всех типов и форматов;

      совокупность цифровых технологий для загрузки изданий в хранилище и их каталогизации;

      система поиска и просмотра первичной информации;

      доставка единиц хранения информации работнику издательства для редактирования.

      Такая издательская система должна обладать определенным набором свойств, а именно:



      • все типы данных должны храниться в едином информационном пространстве;

        минимизация ручного труда по каталогизации и индексации информации;

        вся информация должна быть доступна с любого клиентского компьютера;

        должна быть обеспечена возможность нахождения издания по его информационным характеристикам;

        клиентское программное обеспечение должно легко стыковаться со средствами обработки и создания содержания изданий;

        издания должны быть доступны только для лиц с соответствующими правами доступа.



        Рассмотрим основные компоненты информационной структуры издательства. Основные компоненты системы локализуются на сервере или нескольких серверах. В частности, отдельный сервер обычно используют для ведения издательской базы данных. Иногда может быть выделен специальный сервер доставки информации клиенту, реже - сервер для поиска нужных электронных изданий. Для интеграции сервера (серверов) с клиентскими компьютерами используется издательская интрасеть. Наконец, посредством экстрасети и сети Интернет могут быть подключены территориально удаленные сотрудники издательства и некоторые контрагенты, с которыми поддерживается регулярная информационная связь.

        Ядром любой издательской информационной системы является хранилище изданий. Естественно, издания хранятся в электронной форме, т. е. хранилище электронных изданий - основной компонент информационной системы издательства. Поэтому требования к этому компоненту и особенности организации хранения электронных изданий будут рассмотрены в специальном параграфе. Здесь следует лишь отметить, что для организации эффективного поиска изданий необходимо хранить атрибутивную информацию или метаданные, т. е. имя автора или авторов, название издания, время первой публикации издания, название издательства, кому принадлежат авторские права, характер представления данных (тип файла) и пр.

        Загрузчик является той частью издательской системы, которая должна сделать ввод изданий и документов настолько эффективным, насколько это возможно. Поскольку количество вводимой информации велико, становится понятно требование минимизации ручного труда в этом процессе.

        При вводе документов одновременно должны генерироваться метаданные для каталогизации и индексирования, на основе которых документы могут затем извлекаться пользователями. Известно несколько способов автоматизации, соответствующих разным методам доступа к данным. Наиболее известен и хорошо отработан метод автоматической индексации полного текста. Самые прогрессивные средства индексации текста базируются на технологии семантических сетей, в которой значения слов определяются по контексту, а не просто подбором унифицированных терминов для отдельных слов, однако пока работу программных средств нельзя назвать безупречной.


        Представляется оправданным включение в метаданные ключевых слов и выражений, отобранных автором (иногда редактором), так как никто лучше них не сможет подобрать набор ключевых слов, оптимально характеризующих как тематическую область издания, так и его отличия от близких по тематике. Возможен отбор этих слов из уже имеющегося в атрибутивной базе данных набора, но иногда оправдано и расширение этого общего набора путем ввода дополнительных элементов, характерных для нового издания.

        В издательской деятельности возможна автоматическая генерация связей для отношений «содержится» и «используется в» путем разбора языка компоновки страниц и выделения элементарных объектов из составных документов. Чем более структурирован язык составления страниц, тем легче выделять информацию: форматы с высоким уровнем структуризации, подобные Adobe FrameMaker, SGML и XML, удобнее, чем форматы со специальной структурой типа QuarkXPress и Word, хуже всего интерпретируются форматы, не имеющие четко выраженной структуры - PostScript и, в меньшей степени, PDF.

        До сих пор не существует общих средств автоматического выделения нетривиальной информации из изображений, аудио и видео, но некоторые разработчики (Kodak, LivePicture, Virage, Excalibur) занимаются исследованиями в этой области. Иногда атрибутивные метаданные могут генерироваться просто путем извлечения информации из определенных форматов данных. Лучший пример этого - форматы файлов Adobe PhotoShop, которые содержат массу полезной информации.

        При загрузке добавляются не только метаданные, но и вспомогательные представления документов, в частности, миниатюры, представляющие внешний вид издания. Генерация миниатюр может быть автоматизирована. Например, большинство графических форматов содержат свои собственные миниатюры, для других, например для изображений с высоким разрешением, можно сгенерировать их «на лету». Аналогично можно спроектировать загрузчик таким образом, чтобы он, получая цифровые аудио-объекты, создавал клипы первых нескольких секунд (например, в форма те WAV 10 КГц).


        Таким же образом видео MPEG-2 может преобразовываться в клипы QuickTime длительностью в 5 или 10 с.

        Существует два базовых способа доставки цифровых документов пользователю: передача файлов - ее можно использовать для текстов, изображений, аудио и видео с низким качеством, и поточная передача для высококачественного «движущегося» медиа-аудио, видео и анимации. Этот последний способ налагает очень серьезные требования на возможности сервера.

        При хранении мультимедиа-данных требования к вычислительным ресурсам, необходимым для передачи документов, качественно отличаются от требований к подсистеме хранения. Поэтому, во многих случаях, выделяется отдельный сервер доставки данных. В первую очередь этот сервер должен иметь высокую пропускную способность для передачи мультимедийных объектов из хранилища на клиентские компьютеры. В идеале медиа-память должна допускать многосерверный доступ так, чтобы хранилище разделялось между сервером хранения и сервером доставки данных.

        Сервер доставки аудио/видео должен обеспечивать гарантированную пропускную полосу для потока данных, поэтому в архитектуре сервера должны быть сбалансированы ресурсы процессора, периферия ввода / вывода и сетевых интерфейсов. Программное обеспечение сервера доставки, во-первых, должно включать средства низкого уровня для работы с файлами, обеспечивающие различные режимы проигрывания медиа. Во-вторых, нужно, чтобы это ПО определяло стандартные интерфейсы для разработки приложений - «плейеров» на клиентской стороне и реализовывало серверную часть этих интерфейсов.

        В большинстве случаев используется сквозное проигрывание (playthrough), что дает возможность начать просмотр мультимедийного издания еще до того, как он полностью загружен на сервер доставки. Например, сервер MediaCenter фирмы
        Sun позволяет начать воспроизведение аудио- или видео-данных уже через пять секунд после начала загрузки. Сквозное проигрывание необходимо для приложений с быстрым и непрерывным обновлением содержания. Режим playthrough развивает метод оперативной загрузки, который заключается в способности сервера одновременно загружать один и воспроизводить другой документ.



        На уровне операционной системы видеоматериалы представляются взаимосвязанной совокупностью файлов (см. также § 3.5). Так, для фильма в цифровой форме хранятся файлы одного или нескольких видеопотоков и файл для аудиопотока. В дополнение к файлам содержания существуют вспомогательные файлы, которые поддерживают распределение первичного файла по разным дискам (striping), синхронизацию между видео и аудио, обеспечивают разные режимы воспроизведения.

        Браузер представляет собой интерфейс пользователя для доступа и просмотра электронных изданий. Отделение браузера от уровня клиентских сервисов подчеркивает тот факт, что он может быть реализован с помощью любого стандартного Web-браузера, что дает множество преимуществ, например независимость от платформы. Наращивание функциональных возможностей может происходить путем добавления сервисов в рамках задаваемой браузером общей организации.

        Браузер обеспечивает интерфейс с сервисом запросов и должен обеспечивать следующие функции:



        • иерархический доступ каталог/файл, аналогичный менеджеру файлов;

          интерфейсы для поиска;

          просмотр списка ответов, включающего миниатюры;

          навигацию по связям между документами.

          Если данный клиент обладает правами доступа к хранилищу изданий, он может, выбрав одну из миниатюр, сформировать запрос к хранилищу изданий на получение соответствующего документа. После определенного времени ожидания, связанного с выбором соответствующего информационного носителя в хранилище, сервер доставки начнет передачу клиенту запрошенной информации.

          Второй главный компонент браузера - средства просмотра для мультимедийных изданий. Для этого компонента существенно, чтобы медиа-документы были представлены в распространенных форматах либо легко преобразовывались в них. Браузер, однако, должен быть способен получать документы в их родных форматах и активизировать соответствующие приложения обработки, например чтобы пользователь мог редактировать документы.

          7.4.


          Содержание раздела