Beschreibung
Datenstromsysteme ermöglichen die Auswertung von Anfragen auf kontinuierlich anfallenden Daten in ähnlicher Weise wie relationale Datenbanksysteme auf persistenten Daten. Jedoch speichern Datenstromsysteme die Daten nicht, sondern werten sie direkt beim Eintreffen gemäß den vorhandenen Anfragen aus. Dadurch ist die Verarbeitung großer Mengen stetig eintreffender Daten möglich. Anwendungsbeispiele sind die Infrastrukturüberwachung in Rechenzentren und die Auswertung von Daten drahtloser Sensornetzwerke zur Überwachung von Tieren oder Bereichen in der Natur. Verteilte Datenstromsysteme können gegenüber nicht verteilten Datenstromsystemen eine höhere Leistungsfähigkeit bieten, den Ressourcenbedarf senken und im Falle von drahtlosen Sensornetzwerken deren Lebensdauer erhöhen. Dies ist insbesondere möglich bei verteilten Datenquellen und wenn die Systeme der Datenquellen selbst Teile der Anfrageverarbeitung übernehmen.
Die vorliegende Dissertation untersucht die Zusammenhänge zwischen logischer Optimierung und der Entscheidung, welcher Operator auf welchem System ausgeführt werden soll, im Kontext verteilter Datenstromsysteme auf heterogenen Systemen. Konkret werden mathematische Repräsentationen ausgewählter Optimierungsziele und Nebenbedingungen, wie etwa Ressourcenbeschränkungen, für die kostenbasierte Optimierung beschrieben. Es wird eine Möglichkeit vorgestellt abzuschätzen, ob eine bestimmte logische Optimierung nachteilig für die folgende Zuweisung von Operatoren zu den Systemen sein kann. Mehrere bekannte heuristische Algorithmen werden an das Optimierungsproblem, welches System welche Operatoren ausführen soll, angepasst. In einer Evaluation wird die Eignung der verschiedenen Algorithmen für dieses Optimierungsproblem verglichen. Schließlich wird ein Algorithmus zur Lastverteilung mittels mehrfacher Instanziierung von Operatoren vorgestellt.
Bewertungen
Es gibt noch keine Bewertungen.