Seminar 1913
Methoden des Maschinellen Lernens
mit Anwendungen für die semantische Kategorisierung
Wintersemester 2005/2006
Kurzbeschreibung
Das Seminar stellt grundlegende Methoden des Maschinellen Lernens vor,
die bei der semantischen Kategorisierung von Texten und Dokumenten
sowie von Wörtern und Begriffen Einsatz finden. Die semantische
Kategorisierung von Texten ist wichtiger Bestandteil der intelligenten
Dokumentenverwaltung, die semantische Kategorisierung von Begriffen
ist zentral für den Aufbau von Computerlexika und Begriffsontologien.
Zu den im Seminar behandelten Lernverfahren zählen unter anderem
Entscheidungsbäume, Bayessche Klassifikatoren und Clustering-Verfahren.
Konkreten Anwendungsszenarien im Bereich der semantischen
Kategorisierung wird ausreichend Raum eingeräumt.
Termine
| Abgabe der Gliederung: |
10. Februar 2006 |
| Abgabe der Ausarbeitung: |
27. Februar 2006 |
| Abgabe der Vortragsfolien: |
5. März 2006 |
| Präsenzphase: |
11. März 2006 |
Themen
-
Entscheidungsbäume und Maximum-Entropy-Verfahren
mit Anwendungen für die Textkategorisierung
Literatur:
-
Anwendungen der Lernarchitektur SNoW für die Eigennamen- und
Frageklassifikation
Literatur:
-
X. Li, P. Morie, D. Roth (2005):
Semantic Integration in Text: From
Ambiguous Names to Identifiable Entities.
AI Magazine, Special Issue on Semantic Integration, pp. 45-68.
-
X. Li, D. Roth (2002):
Learning Question Classifiers.
In: Proceedings of the 19th International Conference on Computational
Linguistics, pp. 556-562.
-
A. Carlson, C. Cumby, N. Rizzolo, J. Rosen, D. Roth (2004):
SNoW User Manual.
-
T. Mitchell (1997):
Machine Learning.
McGraw Hill.
[Abschnitt 4.4: Perceptrons]
-
Case-Based Reasoning mit Anwendungen auf textuelle Dokumente
Literatur:
-
M. M. Richter (1998):
Introduction.
In: M. Lenz, B. Bartsch-Spörl, H.-D. Burkhard, S. Wess (eds.),
Case-Based Reasoning Technology: From Foundations to Applications,
Lecture Notes in Computer Science 1400, Springer, pp. 1-15
-
M. Lenz, A. Hübner, M. Kunze (1998):
Textual CBR.
In: M. Lenz, B. Bartsch-Spörl, H.-D. Burkhard, S. Wess (eds.),
Case-Based Reasoning Technology: From Foundations to Applications,
Lecture Notes in Computer Science 1400, Springer, pp. 115-138
-
M. Healy, S. J. Delany, A. Zamolotskikh (2005):
An Assessment of Case Based Reasoning
for Short Text Message Classification.
In: N. Creaney (ed.), Proceedings of the 16th Irish Conference on
Artificial Intelligence and Cognitive Science (AICS '05),
pp. 257-266.
-
S. J. Delany, P. Cunningham, L. Coyle (2004):
An Assessment of Case-Based Reasoning
for Spam Filtering (Extended Version).
In: L. McGinty & B. Crean (eds.), Proceedings of 15th Irish Conference
on Artificial Intelligence and Cognitive Science (AICS '04),
pp. 9-18.
-
Clustering mittels Expectation-Maximation mit Anwendungen für den
Aufbau semantischer Lexika
Literatur:
-
Support-Vector-Machinen mit Anwendungen für die Textklassifikation
Literatur:
-
Anwendungen der Formalen Begriffsanalyse für den textbasierten Aufbau
von Konzepthierarchien
Literatur:
-
Bootstrapping-Ansätze für den Aufbau semantischer Lexika
Literatur:
-
E. Riloff, J. Shepherd (1999):
A Corpus-Based Bootstrapping Algorithm for Semi-Automated Semantic Lexicon Construction,
Journal of Natural Language Engineering, Vol. 5, No. 2, pp. 147-156.
-
M. Thelen, E. Riloff (2002):
A Bootstrapping Method for Learning
Semantic Lexicons using Extraction Pattern Contexts,
In: Proceedings of the 2002 Conference on Empirical Methods in Natural
Language Processing (EMNLP 2002).
-
T. Baldwin (2005):
Bootstrapping Deep Lexical Resources: Resources for Courses,
In: Proceedings of the ACL-SIGLEX 2005 Workshop on Deep Lexical
Acquisition, Ann Arbor, USA, pp. 67-76.
-
Ergänzungslektüre:
C. D. Manning, H. Schütze (1999):
Foundations of
Statistical Natural Language Processing.
MIT Press.
[Kapitel 8: Lexical Acquisition]
-
Vektorraummodelle mit Anwendungen im Textmining und Informationretrieval
Literatur:
-
M. W. Berry, Z. Drmac, E. R. Jessup (1999):
Matrices, Vector Spaces, and Information
Retrieval.
SIAM Review, 41(2):335-362.
-
C. D. Manning, H. Schütze (1999):
Foundations of
Statistical Natural Language Processing.
MIT Press.
[Abschnitte 15.1, 15.2 und 15.3]
-
Ergänzungslektüre:
A. Hotho, A. Nürnberger, G. Paaß (2005):
A Brief Survey of Text Mining.
LDV Forum, 20(1):19-62
-
Latent Semantic Analysis
Literatur:
-
S. Deerwester, S. Dumais, G. Furnas, T. Landauer, R. Harshman (1990):
Indexing by Latent Semantic Analysis.
Journal of the American Society for Information Sciences,
41:391-447.
-
T. Landauer, P. Foltz, D. Laham (1998):
Introduction to LSA.
Discourse Processes, 25:259-284.
-
P. Nakov, E. Valchanova, G. Angelova (2002):
Towards Deeper Understanding of LSA Performance.
In: Proceedings of Recent Advances in Natural Language Processing.
pp. 311-318.
-
C. D. Manning, H. Schütze (1999):
Foundations of
Statistical Natural Language Processing.
MIT Press.
[Abschnitt 15.4: Latent Semantic Indexing]
Last modified: Fri Nov 4 18:48:41 CET 2005