Difference between revisions of "Uni"

From GJ
Line 1: Line 1:
 
== Analogien ==
 
== Analogien ==
 
* [http://jaehnig.org/wiki/images/f/f9/Textgenerierung_mit_Analogien.pdf Textgenerierung mit Analogien], Hausarbeit zum Hauptseminar '''Textgenerierung''' bei Prof. Manfred Stede, WS 2007/08 Zusammenfassung:  
 
* [http://jaehnig.org/wiki/images/f/f9/Textgenerierung_mit_Analogien.pdf Textgenerierung mit Analogien], Hausarbeit zum Hauptseminar '''Textgenerierung''' bei Prof. Manfred Stede, WS 2007/08 Zusammenfassung:  
:''hacken'' verhält sich zu ''hackte'' wie ''backen'' zu ''backte'' - solche sprachlichen Analogien werde ich in dieser Arbeit beschreiben und formal definieren.
+
:''hacken'' verhält sich zu ''hackte'' wie ''backen'' zu ''backte'' - solche sprachlichen Analogien werde ich in dieser Arbeit beschreiben und formal definieren. Darauf aufbauend habe ich eine vorliegenden Textgenerator implementiert, der aus den gegebenen drei Phrasen eine vierte generiert, so dass eine Analogie entsteht. Diesen heuristischen Textgenerator werde ich ausführlich beschreiben sowie meine Verbesserungen vorstellen. Schließlich zeige ich mit einigen generierten Wörtern und Sätzen, welche Art von Analogien im Deutschen existieren und was der Generator produzieren kann.
 
 
:Darauf aufbauend habe ich eine vorliegenden Textgenerator implementiert, der aus den gegebenen drei Phrasen eine vierte generiert, so dass eine Analogie entsteht. Diesen heuristischen Textgenerator werde ich ausführlich beschreiben sowie meine Verbesserungen vorstellen.  
 
 
 
:Schließlich zeige ich mit einigen generierten Wörtern und Sätzen, welche Art von Analogien im Deutschen existieren und was der Generator produzieren kann.
 
  
 
*[http://jaehnig.org/wiki/images/8/83/Analogien_-_eine_kleine_Einf%C3%BChrung.pdf Analogien - eine kleine Einführung], Vortrag auf der [http://tacos.ling.uni-potsdam.de 18. TaCoS].
 
*[http://jaehnig.org/wiki/images/8/83/Analogien_-_eine_kleine_Einf%C3%BChrung.pdf Analogien - eine kleine Einführung], Vortrag auf der [http://tacos.ling.uni-potsdam.de 18. TaCoS].
Line 20: Line 16:
 
* [http://jaehnig.org/wiki/images/5/5d/Longest_Match_mit_Gewichteten_und_Ungewichteten_Endlichen_Automaten.pdf Longest Match mit Gewichteten und Ungewichteten Endlichen Automaten], Hausarbeit in zum Hauptseminar '''Theorie und Anwendungen endlicher Automaten und Transduktoren''' bei Dr. Thomas Hanneforth, WS 2007/08, Zusammenfassung:
 
* [http://jaehnig.org/wiki/images/5/5d/Longest_Match_mit_Gewichteten_und_Ungewichteten_Endlichen_Automaten.pdf Longest Match mit Gewichteten und Ungewichteten Endlichen Automaten], Hausarbeit in zum Hauptseminar '''Theorie und Anwendungen endlicher Automaten und Transduktoren''' bei Dr. Thomas Hanneforth, WS 2007/08, Zusammenfassung:
  
: Mehrdeutige Ersetzungsregeln können zu mehrdeutigen Ausgaben führen. Nicht immer ist das gewollt. In dieser Arbeit stelle ich 2 Ansätze von (Karttunen 1996) und (Hanneforth 2005) vor, die zunächst die Mehrdeutigkeiten einordnen und mehrere Operatoren zur Unterscheidung einführen und danach Lösungen mit Endlichen Automaten vorstellen, die eindeutige Ausgaben dieser mehrdeutigen Ersetzungsregeln erzwingen.
+
: Mehrdeutige Ersetzungsregeln können zu mehrdeutigen Ausgaben führen. Nicht immer ist das gewollt. In dieser Arbeit stelle ich 2 Ansätze von (Karttunen 1996) und (Hanneforth 2005) vor, die zunächst die Mehrdeutigkeiten einordnen und mehrere Operatoren zur Unterscheidung einführen und danach Lösungen mit Endlichen Automaten vorstellen, die eindeutige Ausgaben dieser mehrdeutigen Ersetzungsregeln erzwingen. Beide Algorithmen beschreibe ich ausführlich mit Beispielen und stelle auch deren Unterschiede heraus, die sich sehr auf Komplexität und damit Anwendbarkeit auswirken. Einen der Ansätze vereinfache ich leicht.
 
 
: Beide Algorithmen beschreibe ich ausführlich mit Beispielen und stelle auch deren Unterschiede heraus, die sich sehr auf Komplexität und damit Anwendbarkeit auswirken. Einen der Ansätze vereinfache ich leicht.
 
  
 
* [http://jaehnig.org/wiki/images/2/2b/Longest_Match_in_Directed_Replacement.pdf Longest Match in Directed Replacement.pdf], Präsentations-Folien dazu.
 
* [http://jaehnig.org/wiki/images/2/2b/Longest_Match_in_Directed_Replacement.pdf Longest Match in Directed Replacement.pdf], Präsentations-Folien dazu.

Revision as of 17:05, 28 October 2008

Analogien

hacken verhält sich zu hackte wie backen zu backte - solche sprachlichen Analogien werde ich in dieser Arbeit beschreiben und formal definieren. Darauf aufbauend habe ich eine vorliegenden Textgenerator implementiert, der aus den gegebenen drei Phrasen eine vierte generiert, so dass eine Analogie entsteht. Diesen heuristischen Textgenerator werde ich ausführlich beschreiben sowie meine Verbesserungen vorstellen. Schließlich zeige ich mit einigen generierten Wörtern und Sätzen, welche Art von Analogien im Deutschen existieren und was der Generator produzieren kann.

Endliche Automaten und Semiringe

Hidden-Markov-Modelle

Hidden-Markov-Modelle sind verbreitete stochastische Modelle, die Zufallsprozesse beschreiben. Sie verwenden dazu eigene Algorithmen wie den Forward- und den Viterbi-Algorithmus. Wir dokumentieren, wie Hidden-Markov-Modelle in Gewichtete Endliche Automaten und Transduktoren umgewandelt und wie Forward- und Viterbi-Algorithmus als Semiring dargestellt werden können. Abschließend betrachten wir einzelne nützliche Eigenschaften Gewichteter Endlicher Automaten: deren Determinisierbarkeit, die Epsilon-Entfernung und das Produkt zweier Automaten.

Longest Match

Mehrdeutige Ersetzungsregeln können zu mehrdeutigen Ausgaben führen. Nicht immer ist das gewollt. In dieser Arbeit stelle ich 2 Ansätze von (Karttunen 1996) und (Hanneforth 2005) vor, die zunächst die Mehrdeutigkeiten einordnen und mehrere Operatoren zur Unterscheidung einführen und danach Lösungen mit Endlichen Automaten vorstellen, die eindeutige Ausgaben dieser mehrdeutigen Ersetzungsregeln erzwingen. Beide Algorithmen beschreibe ich ausführlich mit Beispielen und stelle auch deren Unterschiede heraus, die sich sehr auf Komplexität und damit Anwendbarkeit auswirken. Einen der Ansätze vereinfache ich leicht.

Verschiedenes

  • Intonation im Berlinischen, Präsentations-Folien zum Proseminar Regionale Variation in der Intonation bei Dr. Frank Kügler, SS 2005
  • Left-Corner-Parser, Präsentations-Folien zum Proseminar CL-Techniken in Prolog bei Dr. Thomas Hanneforth, SS 2004