Class: Lingo::Attendee::Synonymer

Inherits:
Lingo::Attendee show all
Defined in:
lib/lingo/attendee/synonymer.rb

Overview

– Der Synonymer untersucht die von anderen Attendees ermittelten Grundformen eines Wortes und sucht in den angegebenen Wörterbüchern nach Relationen zu anderen Grundformen. Gefundene Relationen erweitern die Liste des Word-Objektes und werden zur späteren Identifizierung mit der Wortklasse ‘y’ gekennzeichnet.

Mögliche Verlinkung

Erwartet

Daten vom Typ Word z.B. von Wordsearcher, Decomposer, Ocr_variator, Multiworder

Erzeugt

Daten vom Typ Word (ggf. um Relationen ergänzt) z.B. für Decomposer, Ocr_variator, Multiworder, Sequencer, Vector_filter

Parameter

Kursiv dargestellte Parameter sind optional (ggf. mit Angabe der Voreinstellung). Alle anderen Parameter müssen zwingend angegeben werden.

in

siehe allgemeine Beschreibung des Attendee

out

siehe allgemeine Beschreibung des Attendee

source

siehe allgemeine Beschreibung des Dictionary

mode

(Standard: all) siehe allgemeine Beschreibung des Dictionary

skip

(Standard: WA_UNKNOWN [siehe strings.rb]) Veranlasst den Synonymer Wörter mit diesem Attribut zu überspringen.

Beispiele

Bei der Verarbeitung einer normalen Textdatei mit der Ablaufkonfiguration t1.cfg

meeting:
  attendees:
    - text_reader:   { out: lines, files: '$(files)' }
    - tokenizer:     { in: lines, out: token }
    - abbreviator:   { in: token, out: abbrev, source: 'sys-abk' }
    - word_searcher: { in: abbrev, out: words, source: 'sys-dic' }
    - synonymer:     { in: words, out: synos, source: 'sys-syn' }
    - debugger:      { in: words, prompt: 'out>' }

ergibt die Ausgabe über den Debugger: lingo -c t1 test.txt

out> *FILE('test.txt')
out> <Dies = [(dies/w), (das/y), (dies/y)]>
out> <ist = [(sein/v), ((sich) befinden/y), (dasein/y), (existenz/y), (sein/y), (vorhandensein/y)]>
out> <ggf. = [(gegebenenfalls/w), (bei bedarf/y), (gegebenenfalls/y), (ggf./y), (notfalls/y)]>
out> <eine = [(einen/v), (ein/w)]>
out> <Abk

++

Constant Summary

Constants inherited from Lingo::Attendee

DEFAULT_SKIP, TERMINALS

Constants included from Language

Language::CHAR_PUNCT, Language::LA_SORTORDER, Language::TA_ABBREVIATION, Language::TA_HELP, Language::TA_HTML, Language::TA_NUMBER, Language::TA_OTHER, Language::TA_PUNCTUATION, Language::TA_SKIP, Language::TA_SPACE, Language::TA_URL, Language::TA_WIKI, Language::TA_WORD, Language::WA_COMPOUND, Language::WA_IDENTIFIED, Language::WA_MULTIWORD, Language::WA_SEQUENCE, Language::WA_UNKMULPART, Language::WA_UNKNOWN, Language::WA_UNSET

Instance Attribute Summary

Attributes inherited from Lingo::Attendee

#lingo, #subscribers

Instance Method Summary collapse

Methods inherited from Lingo::Attendee

#command, #forward, #initialize

Constructor Details

This class inherits a constructor from Lingo::Attendee

Instance Method Details

#controlObject



81
82
# File 'lib/lingo/attendee/synonymer.rb', line 81

def control(*)
end

#initObject



75
76
77
78
79
# File 'lib/lingo/attendee/synonymer.rb', line 75

def init
  set_dic
  @com = !get_key('compound-parts', false)
  @skip = get_ary('skip', WA_UNKNOWN, :upcase)
end

#process(obj) ⇒ Object



84
85
86
87
88
89
90
# File 'lib/lingo/attendee/synonymer.rb', line 84

def process(obj)
  if obj.is_a?(Word) && !@skip.include?(obj.attr)
    obj.add_lexicals(@dic.find_synonyms(obj, [], @com))
  end

  forward(obj)
end