Class: Lingo::Attendee::WordSearcher

Inherits:
Lingo::Attendee show all
Defined in:
lib/lingo/attendee/word_searcher.rb

Overview

– Der WordSearcher ist das Herzstück von Lingo. Er macht die Hauptarbeit und versucht alle Token die nach einem sinnvollen Wort aussehen, in den ihm angegebenen Wörterbüchern zu finden und aufzulösen. Dabei werden die im Wörterbuch gefundenen Grundformen inkl. Wortklassen an das Word-Objekt angehängt.

Mögliche Verlinkung

Erwartet

Daten vom Typ Token (andere werden einfach durchgereicht) z.B. von Tokenizer, Abbreviator

Erzeugt

Daten vom Typ Word für erkannte Wörter z.B. für Synonymer, Decomposer, Ocr_variator, Multiworder, Sequencer, Vector_filter

Parameter

Kursiv dargestellte Parameter sind optional (ggf. mit Angabe der Voreinstellung). Alle anderen Parameter müssen zwingend angegeben werden.

in

siehe allgemeine Beschreibung des Attendee

out

siehe allgemeine Beschreibung des Attendee

source

siehe allgemeine Beschreibung des Dictionary

mode

(Standard: all) siehe allgemeine Beschreibung des Dictionary

Beispiele

Bei der Verarbeitung einer normalen Textdatei mit der Ablaufkonfiguration t1.cfg

meeting:
  attendees:
    - text_reader:   { out: lines, files: '$(files)' }
    - tokenizer:     { in: lines, out: token }
    - abbreviator:   { in: token, out: abbrev, source: 'sys-abk' }
    - word_searcher: { in: abbrev, out: words, source: 'sys-dic' }
    - debugger:      { in: words, prompt: 'out>' }

ergibt die Ausgabe über den Debugger: lingo -c t1 test.txt

out> *FILE('test.txt')
out> <Dies = [(dies/w)]>
out> <ist = [(sein/v)]>
out> <ggf. = [(gegebenenfalls/w)]>
out> <eine = [(einen/v), (ein/w)]>
out> <Abk

++

Constant Summary

Constants inherited from Lingo::Attendee

DEFAULT_SKIP, TERMINALS

Constants included from Language

Language::CHAR_PUNCT, Language::LA_SORTORDER, Language::TA_ABBREVIATION, Language::TA_HELP, Language::TA_HTML, Language::TA_NUMBER, Language::TA_OTHER, Language::TA_PUNCTUATION, Language::TA_SKIP, Language::TA_SPACE, Language::TA_URL, Language::TA_WIKI, Language::TA_WORD, Language::WA_COMPOUND, Language::WA_IDENTIFIED, Language::WA_MULTIWORD, Language::WA_SEQUENCE, Language::WA_UNKMULPART, Language::WA_UNKNOWN, Language::WA_UNSET

Instance Attribute Summary

Attributes inherited from Lingo::Attendee

#lingo, #subscribers

Instance Method Summary collapse

Methods inherited from Lingo::Attendee

#command, #forward, #initialize

Constructor Details

This class inherits a constructor from Lingo::Attendee

Instance Method Details

#controlObject



76
77
# File 'lib/lingo/attendee/word_searcher.rb', line 76

def control(*)
end

#initObject



72
73
74
# File 'lib/lingo/attendee/word_searcher.rb', line 72

def init
  set_dic
end

#process(obj) ⇒ Object



79
80
81
82
# File 'lib/lingo/attendee/word_searcher.rb', line 79

def process(obj)
  forward(obj)
  forward(@dic.find_word(obj.form, obj)) if obj.word_token?
end