Параметры очистки HTML
/autoCorrectedTags=<tag>[;...]
Эта опция позволяет определить автоматически закрывающиеся HTML-теги.
Например, в XHTML используется следующий синтаксис:
<ul> <li>item1</li> <li>item2</li> </ul>
Здесь тег <li>
должен иметь закрывающий тег </li>
.
Чтобы разобрать HTML без закрывающего тега, добавьте его в параметр autoCorrectedTags:
<ul> <li>item1 <li>item2 </ul>
По умолчанию в этой опции содержатся теги: li
, p
и a
.
Вы можете изменить значение по умолчанию в файле конфигурации.
/cleanHtml
Эта опция очищает загруженные HTML-файлы.
Вы также можете использовать отдельный режим clean-html для очистки локальных файлов и поиска правильных вариантов очистки.
Настройте правила очистки с помощью файла конфигурации и следующих опций вывода:
/cutAttributes=<attribute>[;...]
Эта опция удаляет указанные атрибуты HTML в режиме clean-html или с опцией /cleanHtml.
Пример использования:
/cutAttributes=data-vars-event-action,data-vars-event-label
/cutComments
Эта опция удаляет HTML-комментарии в режиме clean-html или с опцией /cleanHtml.
/cutIDs=<id>[;...]
Эта опция удаляет узлы HTML с указанными значениями идентификатора в режиме clean-html или с опцией /cleanHtml.
Например, вы можете использовать эту опцию для удаления элементов навигации и рекламы.
/cutScripts
Эта опция удаляет теги HTML <script>
и <noscript>
, а также атрибуты событий on*
в режиме clean-html или с опцией /cleanHtml.
/cutStyles
Эта опция удаляет теги стиля HTML, а также атрибуты style
и class
в режиме clean-html или с опцией /cleanHtml.
/cutTags=<tag>[;...]
Эта опция удаляет узлы HTML с указанными тегами в режиме clean-html или с опцией /cleanHtml.
Пример использования:
/cutTags=amp-install-serviceworker,amp-state,amp-analytics,amp-user-notification