RubyDoc.info: Class: Scraper::Comics – Documentation for ascraper (0.0.2)

.all(start_page = 1, last_page = 5) ⇒ `Object`

# File 'lib/scraper/comics.rb', line 4

def self.all(start_page = 1, last_page = 5)
  results = []
  start_page.upto(last_page).each do |i|
    doc = Nokogiri::HTML(open("http://www.newcomic.org/page/#{i}/"))

    doc.css('.story_short').each do |block|
      result = OpenStruct.new

      url = block.search('a').map {|a| a['href']}.first

      result.title = block.at_css('.story_h').content
      result.url = url

      comic = Nokogiri::HTML(open(url))

      result.main_image = main_image(comic)
      result.other_images = other_images(comic)
      result.download_link = download_link(comic)
      result.tags = tags(comic)

      results << result
    end

  end
  results
end

.download_link(comic) ⇒ `Object`

# File 'lib/scraper/comics.rb', line 39

def self.download_link(comic)
  if comic.at_css('.story_c')
    comic.at_css('.story_c').search('a').map {|a| a['href']}.first
  end
end

.last_page ⇒ `Object`



51
52
53

# File 'lib/scraper/comics.rb', line 51

def self.last_page
  Nokogiri::HTML(open('http://www.newcomic.org/')).search('#dle-content > div.basenavi > span.navigation > a:nth-child(12)').first.children[0].to_s.to_i
end

.main_image(comic) ⇒ `Object`



31
32
33

# File 'lib/scraper/comics.rb', line 31

def self.main_image(comic)
  comic.at_css('.story_c').search('img').map {|a| a['src']}.first
end

.other_images(comic) ⇒ `Object`



35
36
37

# File 'lib/scraper/comics.rb', line 35

def self.other_images(comic)
  comic.at_css('.story_c').search('a').map {|a| a['href']}.collect! {|x| x if %r{\Ahttps?:\/\/.+\.(?:jpe?g|png)\z}.match(x) }.compact
end

.tags(comic) ⇒ `Object`

# File 'lib/scraper/comics.rb', line 45

def self.tags(comic)
  if comic.at_xpath('//*[@id="dle-content"]/div/article/div[2]/p/i')
    comic.at_xpath('//*[@id="dle-content"]/div/article/div[2]/p/i').content.gsub('Tags: ', '').split(',').collect(&:strip)
  end
end

Class: Scraper::Comics

Class Method Summary collapse

Class Method Details

.all(start_page = 1, last_page = 5) ⇒ `Object`

.download_link(comic) ⇒ `Object`

.last_page ⇒ `Object`

.main_image(comic) ⇒ `Object`

.other_images(comic) ⇒ `Object`

.tags(comic) ⇒ `Object`

Class: Scraper::Comics

Class Method Summary collapse

Class Method Details

.all(start_page = 1, last_page = 5) ⇒ Object

.download_link(comic) ⇒ Object

.last_page ⇒ Object

.main_image(comic) ⇒ Object

.other_images(comic) ⇒ Object

.tags(comic) ⇒ Object

.all(start_page = 1, last_page = 5) ⇒ `Object`

.download_link(comic) ⇒ `Object`

.last_page ⇒ `Object`

.main_image(comic) ⇒ `Object`

.other_images(comic) ⇒ `Object`

.tags(comic) ⇒ `Object`