Правильная ссылка на эту страницу
http://az-design.ru/Projects/WebStat/WebSiteStore/01_005.shtml

Особенности верстки в программе WebSiteStore

       При том, что особых требований к верстке страниц не предъявляется, есть особенности архитектуры БД, которые позволяют несколько уменьшить объем БД (до 20%) и ускорить работу.
       Дело в том, что в нормальной HTML-верстке строки (абзацы) текста чередуются с тегами HTML, которые часто повторяются. Так как в таблице в каждой строке хранится одна строка из файла, то верстку можно оптимизировать.
       — абзац текста лучше делать в виде одной строки. Ее длина может быть 32760 символов. А чтобы при сохранении файла он не разбился снова на несколько строк, достаточно в Notepad отключить функцию Word Wrap перед сохранением.
       — теги HTML записывать в отдельных строках и по возможности единообразно, т.е. ширину столбцов округлять до значений из некоторого ограниченного набора, параметры тегов, например align='' valign='', указывать в одном порядке.
       В БД есть возможность теги и часто встречающиеся строки хранить в виде отдельной словарной таблицы, а в тело страницы подставлять только код этой строки.

Пример:
       Если у нас есть некоторый текст в HTML вида:

</p>
<FONT FACE="Arial" SIZE=5><P ALIGN="CENTER">
<B>Глава 2. Нормализация</B>
</p>
</FONT><FONT FACE="Arial" SIZE=2>
<P ALIGN="JUSTIFY">
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
Реляционная модель и ее нормальные формы впервые были определены Коддом (Codd, 1970),...

       то в словарной таблице WHTML должны быть строки:

</p>
<FONT FACE="Arial" SIZE=5><P ALIGN="CENTER">
</p>
</FONT><FONT FACE="Arial" SIZE=2>
<P ALIGN="JUSTIFY">
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;

       Тогда эта часть страницы будет записана в таблицу Bodies следующим образом:

153,'<B>Глава 2. Нормализация</B>'
175,'Реляционная модель и ее нормальные формы впервые были определены Коддом (Codd, 1970),...'

       Это позволяет не только уменьшить объем БД, но и несколько увеличить производительность за счет значительного уменьшения количества строк в таблице Bodies. А также за счет того, что при поиске не приходится перебирать тексты из тегов HTML.
       Программа не собирает автоматически словарь WHTML, но предоставляет пользователю необходимые инструменты. Если в конфигурации включен параметр WHTML=true, то при загрузке страниц в БД строки, которые могут быть кандидатами в словарь будут записываться в файл Temp\WHTML.txt в удобном для редактирования виде:

>>></P>
</DIR></DIR>
</FONT><FONT FACE="Times New Roman CYR" SIZE=4>
<P ALIGN="JUSTIFY">

       Первая строка, которая начинается с символов '>>>' это строка из словаря, которая уже присутствует в тексте.
       Вторая строка, это кандидат на добавление в словарь. Если это действительно так, то необходимо в конце первой строки добавить символы ' ', перенести после них вторую строку и убрать символы '>>>' в начале строки:

</P>
</DIR></DIR>
</FONT><FONT FACE="Times New Roman CYR" SIZE=4>
<P ALIGN="JUSTIFY">

       Получившаяся строка и будет новой словарной строкой. Если пара строк не является кандидатом в словарь, то ее нужно просто удалить.
       Пустые строки вставляются для удобства редактирования и их нужно также удалить из файла. Готовый файл можно загрузить в БД с помощью пункта меню "Пополнить словарь из файла"
       Беспокоится о том, что в файле оказались одинаковые строки не нужно - программа сама отберет только уникальные.
       Если после обновления словаря WHTML заново загрузить ту же страницу, то новый файл кандидатов в словарь будет содержать уже другие строки. Программа объединяет несколько словарных строк в одну используя для соединения символы ' '. Таким образом теги записанные в разных строках страницы для удобства зрительного восприятия будут записаны в одну словарную статью, не ограничивая пользователя.
       Если пользователь не хочет включать строку в словарь (по любым причинам), то она будет сохранена как обычный абзац.




<<< Пред. Оглавление
Начало раздела
След. >>>

Дата последнего изменения:
Thursday, 21-Aug-2014 09:10:56 MSK


Постоянный адрес статьи:
http://az-design.ru/Projects/WebStat/WebSiteStore/01_005.shtml