Module: StringTools::HTML

Defined in:: lib/string_tools/html.rb

Defined Under Namespace

Constant Summary collapse

TEXT_WITH_LINKS_MINIMUM_LENGTH = минимальная длина строки, в которой могут быть ссылки

'<a href="'.length

HTML_SERIALIZE_OPTIONS =

{
  indent: 0,
  # сериализуем в xhtml, поскольку при сериализации в html, libxml2 делает чуть больше, чем хотелось бы:
  # http://stackoverflow.com/questions/24174032/prevent-nokogiri-from-url-encoding-src-attributes
  save_with: Nokogiri::XML::Node::SaveOptions::AS_XHTML
}

Class Method Summary collapse

.remove_links(html, options = {}) ⇒ Object

Public: Удаляет ссылки на неразрешенные домены.

Class Method Details

.remove_links(html, options = {}) ⇒ `Object`

Public: Удаляет ссылки на неразрешенные домены

html - String содержимое потенциально ненужных ссылок options - Hash

:whitelist - Array of String разрешенныe домены

Examples

html = '<a href="https://www.yandex.ru">yandex</a>'

StringTools::HTML.remove_links(html, whitelist: ['google.com'])
# => 'yandex'

StringTools::HTML.remove_links(html, whitelist: ['yandex.ru'])
# => '<a href="https://www.yandex.ru">yandex</a>'

StringTools::HTML.remove_links(html, whitelist: ['www.yandex.ru'])
# => '<a href="https://www.yandex.ru">yandex</a>'

html = '<a href="https://yandex.ru">yandex</a>'

StringTools::HTML.remove_links(html, whitelist: ['www.yandex.ru'])
# => 'yandex'

Returns String without links to external resources