Class: Lingo::Attendee::WordSearcher
- Inherits:
-
Lingo::Attendee
- Object
- Lingo::Attendee
- Lingo::Attendee::WordSearcher
- Defined in:
- lib/lingo/attendee/word_searcher.rb
Overview
– Der WordSearcher ist das Herzstück von Lingo. Er macht die Hauptarbeit und versucht alle Token die nach einem sinnvollen Wort aussehen, in den ihm angegebenen Wörterbüchern zu finden und aufzulösen. Dabei werden die im Wörterbuch gefundenen Grundformen inkl. Wortklassen an das Word-Objekt angehängt.
Mögliche Verlinkung
- Erwartet
-
Daten vom Typ Token (andere werden einfach durchgereicht) z.B. von Tokenizer, Abbreviator
- Erzeugt
-
Daten vom Typ Word für erkannte Wörter z.B. für Synonymer, Decomposer, Ocr_variator, Multiworder, Sequencer, Vector_filter
Parameter
Kursiv dargestellte Parameter sind optional (ggf. mit Angabe der Voreinstellung). Alle anderen Parameter müssen zwingend angegeben werden.
- in
-
siehe allgemeine Beschreibung des Attendee
- out
-
siehe allgemeine Beschreibung des Attendee
- source
-
siehe allgemeine Beschreibung des Dictionary
- mode
-
(Standard: all) siehe allgemeine Beschreibung des Dictionary
Beispiele
Bei der Verarbeitung einer normalen Textdatei mit der Ablaufkonfiguration t1.cfg
meeting:
attendees:
- text_reader: { out: lines, files: '$(files)' }
- tokenizer: { in: lines, out: token }
- abbreviator: { in: token, out: abbrev, source: 'sys-abk' }
- word_searcher: { in: abbrev, out: words, source: 'sys-dic' }
- debugger: { in: words, prompt: 'out>' }
ergibt die Ausgabe über den Debugger: lingo -c t1 test.txt
out> *FILE('test.txt')
out> <Dies = [(dies/w)]>
out> <ist = [(sein/v)]>
out> <ggf. = [(gegebenenfalls/w)]>
out> <eine = [(einen/v), (ein/w)]>
out> <Abk
++
Constant Summary
Constants inherited from Lingo::Attendee
Constants included from Language
Language::CHAR_PUNCT, Language::LA_SORTORDER, Language::TA_ABBREVIATION, Language::TA_HELP, Language::TA_HTML, Language::TA_NUMBER, Language::TA_OTHER, Language::TA_PUNCTUATION, Language::TA_SKIP, Language::TA_SPACE, Language::TA_URL, Language::TA_WIKI, Language::TA_WORD, Language::WA_COMPOUND, Language::WA_IDENTIFIED, Language::WA_MULTIWORD, Language::WA_SEQUENCE, Language::WA_UNKMULPART, Language::WA_UNKNOWN, Language::WA_UNSET
Instance Attribute Summary
Attributes inherited from Lingo::Attendee
Instance Method Summary collapse
Methods inherited from Lingo::Attendee
#command, #forward, #initialize
Constructor Details
This class inherits a constructor from Lingo::Attendee
Instance Method Details
#control ⇒ Object
76 77 |
# File 'lib/lingo/attendee/word_searcher.rb', line 76 def control(*) end |
#init ⇒ Object
72 73 74 |
# File 'lib/lingo/attendee/word_searcher.rb', line 72 def init set_dic end |
#process(obj) ⇒ Object
79 80 81 82 |
# File 'lib/lingo/attendee/word_searcher.rb', line 79 def process(obj) forward(obj) forward(@dic.find_word(obj.form, obj)) if obj.word_token? end |