Утилиты для словарей - поиск HTML ссылок
Эта утилита была разработана для вытаскивания ссылок из HTML файлов.
Настройка этого инструмента состоит из двух групп. В первой группе необходимо установить путь к исходному каталогу, в котором необходимо провести поиск, и задать способ обработки файлов. А именно:
- Обрабатывать файлы только в заданном каталоге. Если эта опция не установлена, то программа подвергнет рекурсивному анализу все вложенные подкаталоги и файлы в них.
- Искать во всех файлах
- Искать только в файлах с заданными расширениями
- Искать во всех файлы, кроме тех, расширения которых даны
По умолчанию, утилита производит поиск ссылок в *.htm и *.html файлах.
Группа с дополнительными настройками устанавливает тип ссылок для поиска и где их необходимо искать:
- Искать ссылки в заголовке HTML файлов
- Искать в теле HTML файлов
- Искать ссылки в тэге HREF, SRC или в обоих тэгах.
Нажатие кнопки Next> запускает процесс поиска, который может занять значительное время. После завершения операции и сохранения найденого списка ссылок на диск, необходимо отсортировать его, чтобы избавиться от дубликатов.