Не стоит опасаться разметки. Она существует уже более двух тысячелетий. Сам текст появился впервые как набор меток на поверхностях разных материалов. С течением времени менялись не только типы материалов и инструменты, но и виды меток, которые сообщали читателям нечто полезное об этом тексте. Сначала эта метаинформация (т. е. информация об информации. — Прим, ред.) была очень грубой и примитивной. Например, во времена Римской империи большая часть текста представляла собой бесконечный поток символов.
Действительно, многие используемые нами способы форматирования текста были изобретены для предоставления информации о каком-то отрывке текста. Например, маркированные списки использовались для обозначения тех объектов, которые следует рассматривать совместно.
Общинная земля принадлежит людям.
- Они могут выводить свой скот на пастбище.
- Они могут использовать лужайки для танцев.
- Никто не вправе устанавливать изгороди на общинной земле.
- Все в равной степени должны ухаживать за пастбищем и лужайками.
После изобретения книгопечатания стало возможным использовать подчеркивание, регулировать высоту и ширину символов, а также применять разные начертания. Для указания печатному станку на необходимость введения такой разметки появилась специальная система редакторских обозначений и сокращений.
Я научился рассматривать природу не так, как это было во время бездумной юности. Теперь, я чаще прислушиваюсь к тихой и печальной, а не жесткой и раздражающей музыке гуманности, которая полна силы для смирения и подчинения.
В XIX веке появились типографские машины с возможностями использования литейных форм, с помощью которых можно было набирать целые страницы текста. Операторы таких машин использовали специальные рычаги для изменения жирности начертания символов в соответствии с пометками редакторов. В конце 60-х и начале 70-х годов программисты Изобрели текстовые процессоры и по аналогии с этими рычагами стали использовать специальные метки в потоке символов. Каждая такая метка, или дескриптор, приводила практически к тому же результату, что и рычаг типографской машины, но уже без использования набора свинцовых литер.
Я научился рассматривать <Ь£природу</Ь£ не так, как это было во время бездумной юности. Теперь я чаще прислушиваюсь к тихой и печальной, а не жесткой и раздражающей музыке <iryMaHHociH</i, которая полна силы для <Ь£<смирения и подчинения</bf</i.
Каждый текстовый процессор и специализированное программное обеспечение в то время имели собственный набор дескрипторов с разными дескрипторами для каждого типа разметки. Например, полужирное начертание у одного разработчика может обозначаться символами, у другого — символами bold, а у третьего — символами #—emph—#. Впоследствии производители такого крупного и сложного оборудования, как самолеты и танки, столкнулись с трудностями совместного использования сотен и тысяч документов, созданных с помощью разных текстовых процессоров. Они вынуждены были использовать программистов для преобразования всего разнообразия дескрипторов в единую систему дескрипторов, или словарь дескрипторов, чтобы принтер mof печатать любые документы. В конце концов Пентагон и его поставщики предложили разработчикам программного обеспечения, издателям и библиотекарям прийти к согласию и найти единое решение этой проблемы.
Если дескриптор может идентифицировать данные, то эти данные можно использовать для самых разных задач. В таном случае можно создать программу, которая может выбирать только необходимую информацию, возможно, соединяя ее с информацией из другого источника, а затем представляя ее в виде комбинации в совершенно разной форме и для совершенно разных целей.
Сотрудники компании IBM применили совершенно иной подход. Они обнаружили, что верстальщики обычно анализируют рукопись Книги для поиска основных компонентов и определения структурных взаимосвязей между ними (основной заголовок, подзаголовок, текст). Предполагая, что большинство документов имеют иерархическую структуру, они решили использовать дескрипторы для обозначения структурной роли каждого компонента (основной заголовок — Н1, подзаголовок — Н2, текст — Р).
Использование языка XML для разметки данных часто приводит к весьма значительному увеличению размера документа, но малый размер файла не является одной из целей применения XML. Он применяется в основном для упрощения процесса написания программы, которая используется для доступа к данным на основании известной структуры этих данных.
Для описания абстрактной структуры сотрудники компании ЮМ придумали определение типа документа Document Type Definition, которое содержит все дескрипторы контента и отображает взаимосвязь этих элементов с другими элементами структуры.
Следующим гениальным ходом этой команды разработчиков стало предложение разделить форму и содержание. Они переместили все правила форматирования в другой файл и получили три документа.
- Исходный документ с дескрипторами, которые обозначают каждый элемент структуры: заголовки, подзаголовки и текст.
- Файл с форматами, которые имеют вид условий и уравнений: если дескриптор обозначает, что данный текст является основным заголовком, то представить его с помощью голубого шрифта размером 24 точки.
- Файл с описанием абстрактной структуры, которую должны иметь все документы этого типа, и представлением формальных дескрипторов в виде словаря.
Этот язык GML (General Markup Language), предложенный компанией ЮМ в 1969 году, превратился в 1974 году в SGML (Standard General Markup Language) и стал международным стандартом в 1986 году. Он, по сути, является машиной по созданию словарей, т. е. наборов стандартных дескрипторов, которые определяют структуру и содержание того или иного типа документов. SGML обладает рядом неоспоримых преимуществ.
Он упрощает процесс крупномасштабной публикации документов (например, в аэрокосмической, телекоммуникационной или ядерной отраслях промышленности), потому что позволяет корпорациям, отраслям промышленности и государственным учреждениям создавать стандартный набор дескрипторов, которые могут быть вставлены в ASCII-документы вместо использования различных собственных кодов форматирования. Это позволяет легко печатать на принтерах тысячи документов, созданных сотнями разных подрядчиков, и комбинировать их в одном наборе документов без дорогостоящей трансляции разных дескрипторов форматирования.
- Он удобен при работе с долговременными документами, в которые приходится вносить большое количество исправлений, обновлений и перекрестных ссылок, потому что структурная модель остается той же, что и прежде, несмотря на все эти изменения.
- Он гарантирует последовательность изложения и совместимость многих страниц во многих книгах.
- Он предоставляет единый источник неформатированного текста, которым можно легко обмениваться с разными подрядчиками, потому что он записан в стандартном ASCII-формате.
