IE-Informationsextraktion

Beschreibung

Bachelor Dokumentenverarbeitung Karteikarten am IE-Informationsextraktion, erstellt von Johanna Lubian am 16/03/2016.
Johanna Lubian
Karteikarten von Johanna Lubian, aktualisiert more than 1 year ago
Johanna Lubian
Erstellt von Johanna Lubian vor etwa 8 Jahre
6
1

Zusammenfassung der Ressource

Frage Antworten
(Definition) IE Informationsextraktion ist ein Prozess, welcher Texte in einem festen Format, strukturiert und durch eindeutige Daten darstellt
Wann ist IE besonders nützlich? - Information ist explizit angegeben - kleine Zahl von Templates reicht aus - benötigte Information ist relativ lokal im Text
Nenne 4 grundlegende Typen von Elementen, die aus einem Text extrahiert werden können. (Mit Beispiel) - Entitäten (Personen, Firmen, Orte, Gene, Medikamente) - Attribute (Titel und Alter einer Person) - Fakten (ausgedrückt als Relationen zwischen Entitäten: ist-beschäftigt-bei) - Ereignisse (Entitäten sind an Ereignissen beteiligt: Firmenübernahme)
Teilaufgaben bei IE NE CO TE TR ST
Was bedeutet NE? Named Entity recognition - Um welche Grösse geht es? - Um welche Wert- Grössenangaben? < Finden und klassifizieren von Namen, Orten, Uhrzeiten...>
Was bedeutet CO? Coreference resolution Auflösen von Koreferenz-Beziehungen zwischen referierenden Ausdrücken und Entitäten < bestimmen, welche Ausdrücke auf dieselben Objekte verweisen>
Was bedeutet TE? Template Element construction - jedes TE besteht aus einem generischen Objekt und einigen Eigenschaften, die es beschreibt <Ne-Ergebnisse werden (mittels CO) mit weiteren Informationen angereichert>
Was bedeutet TR? Template Relation construction - Welche Beziehung gibt es zwischen Entitäten? - werden oft durch Verben (und Verbalphrasen) ausgedrückt Bsp.: <Groesse> verlor <Prozentwert> auf <Wert>
Was bedeutet ST? Szenario-Templat Informationen zu komplexeren Ereignissen werden zusammengestellt <Zusammenfügen der Ergebnisse aus TE und TR in vordefinierte Ereignis-Szenario>
Wie werden unterschiedliche Wortklassen markiert? mit tags, festgelegt wird das in sog. Tag sets
Zusammenfassung anzeigen Zusammenfassung ausblenden

ähnlicher Inhalt

must, had to, mustn't oder don't need to
escobar.annelize
Der menschliche Körper
JohannesK
Staaten und Hauptstädte Europas
Peter Kasebacher
Die wichtigsten funktionelle Gruppen
Mirmo
Französisch Zeitformen
Salome Guldener
Öff. Recht - Streitigkeiten Staatshaftungsrecht
myJurazone
KORRE VO - Fragenkatalog überarbeitet
Jennifer Riegler
Die Geschichte der DDR von 1945-1989
Wie Ja
Forstpolitik Krott
Ulf Grätz
Vetie Radiologie VL-Fragen
Carolina Heide
Vetie - Patho - 2014
steff Müller