Description
Die automatische Sprachverarbeitung hat seit ihren Anfängen deutlich an Bedeutung gewonnen. Sie ist heute in einigen Bereichen wie z.B. bei der Suche im Internet unverzichtbar und nicht mehr wegzudenken. Ein Werkzeug für die automatische Wortformerkennung und -produktion ist ein grundlegender Baustein für viele Anwendungen. Sie kann in vielen Bereichen eingesetzt werden, sowohl als eigenständige Anwendung, z.B. für didaktische Zwecke oder zur morphologischen Annotation von Korpora, als auch als unterstützende Komponente für Anwendungen wie die syntaktische Analyse von Texten.
Das hier vorgestellte System ist ein automatisches Werkzeug für folgende Aufgabengebiete: Analyse der Rechtschreibung, Lemmatisierung, Annotation der Wortarten, vollständige morphologische Analyse von Wortformen. Das System kann auch im umgekehrten Modus verwendet werden, d.h. Wortformen aus einem gegebenen Lemma und seinen morphologischen Eigenschaften generieren.
Das System deckt die Flexion der albanischen Nomina, Verben, Adjektive, Numeralia, Adverbien und Pronomina ab, sowie die nicht flektierenden Wortarten und die häufigsten Typen der Wortbildung. Es wurde mit einer Reihe von Testlisten aus unterschiedlichen Quellen getestet.
Mit diesen Eigenschaften eröffnet sich für das Morphologie-Werkzeug ein breites Spektrum von Anwendungsfällen in der maschinellen Verarbeitung der albanischen Sprache.
Besim Kabashi wurde 1972 in Istog, Kosovo, geboren. Er studierte Linguistische Informatik, Germanistische Linguistik und Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg und schloss sein Studium im Jahr 2003 mit dem akademischen Grad Magister Artium (M.A.) erfolgreich ab. Seitdem ist er Wissenschaftlicher Mitarbeiter an der Professur für Computerlinguistik bzw. Korpuslinguistik, im Studienfach Linguistische Informatik, wo er sich sowohl mit Lehre als auch Forschung beschäftigt. Er wurde 2014 im Fachbereich Informatik promoviert und erwarb den akademischen Grad eines Doktors der Ingenieurwissenschaften (Dr.-Ing.). Sein Forschungsgebiet war hauptsächlich automatische Wortformerkennung und -produktion. Er veröffentlichte sowohl selbstständig als auch in Zusammenarbeit mit anderen Verfassern eine Reihe von Artikeln im Bereich Linguistische Informatik über automatische Wortformerkennung und -produktion, Computerlexikographie, Wissensressourcen, Korpuslinguistik und Statistik.
Reviews
There are no reviews yet.