Maschinelles Lernen von Generalisierungsregeln für Landnutzungsdaten
Led by: | Thiemann |
Team: | Alessa Retat |
Year: | 2014 |
Duration: | 2014 |
Is Finished: | yes |
Landnutzungsdaten werden in verschiedenen Systemen sowie Maßstäben bereitgestellt. Dazu zählen z.B. das Automatisierte Liegenschaftskataster-Informationssystem (ALKIS), das Amtliche Topographisch-Kartographische Informationssystem (ATKIS) sowie CORINE Land Cover (CLC). Mittels Generalisierung aus den jeweils höheraufgelösten Daten lassen sich die Systeme effizient fortführen. Die Systeme nutzen jeweils unterschiedliche Klassen und Aggregationen, wodurch geometrische und semantische Differenzen resultieren. Daher ist eine direkte Zuordnung einzelner Klassen nicht immer möglich.
Das Ziel der Arbeit war es die bisherigen Generalisierungsregeln für die Ableitung von Landnutzungsdaten aus größeren Maßstäben zu verbessern. Um eine sinnvolle Zuordnung nicht eindeutiger Flächen durchführen zu können, sollten verschiedene Algorithmen getestet werden. Untersucht wurden in dieser Arbeit die logistische Regression, neuronale Netze, Support-Vektor-Maschinen und Baumstrukturen. Dabei ging es um die Fragestellung, welche Ergebnisse die verschiedenen Modelle und Algorithmen in Abhängigkeit von verschiedenen Datensätzen liefern und wie diese verbessert werden können.
Es wurde beobachtet, dass sich das maschinelle Lernen nur bedingt für die Prädiktion von Objektarten aus Landnutzungsdaten eignete. Dies lag allerdings weniger an der Technik des maschinellen Lernens, sondern vielmehr an den verfügbaren Datensätzen. Diese waren zum einen sehr klein, wodurch viele Objektklassen nur selten vorkommen und dadurch schlecht prädiziert werden konnten. Das größere Problem lag aber in den hohen Fehleranteilen der Eingabedaten. Aus den fehlerbehafteten Instanzen erlernen die Algorithmen ein fehlerhaftes Modell, welches die erreichbaren Prädiktionsgenauigkeiten einschränkt. Auffällig bei der Beurteilung der Klassifikation waren einige Landbedeckungsklassen, die schwierig voneinander zu separieren sind. Dazu zählten z.B. Mischnutzungen und Waldflächen. Aber selbst wenn nicht die korrekte Klasse vorhergesagt wurde, konnte in der Regel zumindest die richtige Objektgruppe prädiziert werden. Als geeignete Eingabefeatures haben sich die relativen Nutzungsanteile (ALKIS-TN) der ATKIS-Polygone herausgestellt. Als Klassifikatoren für Landnutzungsdaten eignen sich vor allem die Support-Vektor-Maschinen und die neuronalen Netze.