Class: Lingo::Attendee::Synonymer
- Inherits:
-
Lingo::Attendee
- Object
- Lingo::Attendee
- Lingo::Attendee::Synonymer
- Defined in:
- lib/lingo/attendee/synonymer.rb
Overview
– Der Synonymer untersucht die von anderen Attendees ermittelten Grundformen eines Wortes und sucht in den angegebenen Wörterbüchern nach Relationen zu anderen Grundformen. Gefundene Relationen erweitern die Liste des Word-Objektes und werden zur späteren Identifizierung mit der Wortklasse ‘y’ gekennzeichnet.
Mögliche Verlinkung
- Erwartet
-
Daten vom Typ Word z.B. von Wordsearcher, Decomposer, Ocr_variator, Multiworder
- Erzeugt
-
Daten vom Typ Word (ggf. um Relationen ergänzt) z.B. für Decomposer, Ocr_variator, Multiworder, Sequencer, Vector_filter
Parameter
Kursiv dargestellte Parameter sind optional (ggf. mit Angabe der Voreinstellung). Alle anderen Parameter müssen zwingend angegeben werden.
- in
-
siehe allgemeine Beschreibung des Attendee
- out
-
siehe allgemeine Beschreibung des Attendee
- source
-
siehe allgemeine Beschreibung des Dictionary
- mode
-
(Standard: all) siehe allgemeine Beschreibung des Dictionary
- skip
-
(Standard: WA_UNKNOWN [siehe strings.rb]) Veranlasst den Synonymer Wörter mit diesem Attribut zu überspringen.
Beispiele
Bei der Verarbeitung einer normalen Textdatei mit der Ablaufkonfiguration t1.cfg
meeting:
attendees:
- text_reader: { out: lines, files: '$(files)' }
- tokenizer: { in: lines, out: token }
- abbreviator: { in: token, out: abbrev, source: 'sys-abk' }
- word_searcher: { in: abbrev, out: words, source: 'sys-dic' }
- synonymer: { in: words, out: synos, source: 'sys-syn' }
- debugger: { in: words, prompt: 'out>' }
ergibt die Ausgabe über den Debugger: lingo -c t1 test.txt
out> *FILE('test.txt')
out> <Dies = [(dies/w), (das/y), (dies/y)]>
out> <ist = [(sein/v), ((sich) befinden/y), (dasein/y), (existenz/y), (sein/y), (vorhandensein/y)]>
out> <ggf. = [(gegebenenfalls/w), (bei bedarf/y), (gegebenenfalls/y), (ggf./y), (notfalls/y)]>
out> <eine = [(einen/v), (ein/w)]>
out> <Abk
++
Constant Summary
Constants inherited from Lingo::Attendee
Constants included from Language
Language::CHAR_PUNCT, Language::LA_SORTORDER, Language::TA_ABBREVIATION, Language::TA_HELP, Language::TA_HTML, Language::TA_NUMBER, Language::TA_OTHER, Language::TA_PUNCTUATION, Language::TA_SKIP, Language::TA_SPACE, Language::TA_URL, Language::TA_WIKI, Language::TA_WORD, Language::WA_COMPOUND, Language::WA_IDENTIFIED, Language::WA_MULTIWORD, Language::WA_SEQUENCE, Language::WA_UNKMULPART, Language::WA_UNKNOWN, Language::WA_UNSET
Instance Attribute Summary
Attributes inherited from Lingo::Attendee
Instance Method Summary collapse
Methods inherited from Lingo::Attendee
#command, #forward, #initialize
Constructor Details
This class inherits a constructor from Lingo::Attendee
Instance Method Details
#control ⇒ Object
81 82 |
# File 'lib/lingo/attendee/synonymer.rb', line 81 def control(*) end |
#init ⇒ Object
75 76 77 78 79 |
# File 'lib/lingo/attendee/synonymer.rb', line 75 def init set_dic @com = !get_key('compound-parts', false) @skip = get_ary('skip', WA_UNKNOWN, :upcase) end |
#process(obj) ⇒ Object
84 85 86 87 88 89 90 |
# File 'lib/lingo/attendee/synonymer.rb', line 84 def process(obj) if obj.is_a?(Word) && !@skip.include?(obj.attr) obj.add_lexicals(@dic.find_synonyms(obj, [], @com)) end forward(obj) end |