Klappentext:
Bei statistischen Analysen in den Sozial- und Wirtschaftswissenschaften treten in der Regel alle Merkmalstypen - nominale, ordinale und metrische Merkmale - gemeinsam auf. Da herkömmliche Klassifikationsverfahren nur metrische Merkmale verarbeiten können, werden in der Praxis die Merkmale anderen Typs fast immer wie metrische Merkmale behandelt. Weil dabei von nicht vorhandenen Abstandsinformationen in den Daten ausgegangen wird, führt dieses Vorgehen zu fragwürdigen Ergebnissen. Um nominale und ordinale Daten adäquat verarbeiten zu können, müssen zunächst geeignete Gütekriterien zur Beurteilung einer Klassifikation gefunden werden.
In dieser Arbeit werden verschiedene Konzepte der Streuungsmessung für nominale und ordinale Merkmale umfassend diskutiert, und es wird gezeigt, wie sich aus Streuungsmaßen geeignete Gütekriterien konstruieren lassen. Werden metrische Merkmale in ordinale Merkmale transformiert, so können mit Hilfe dieser Gütekriterien alle Merkmalstypen gemeinsam im Prozeß der Klassenbildung verarbeitet werden. Die sich daran anschließende Frage nach einer geeigneten Transformation metrischer Daten wird ausführlich beantwortet. Auch die wichtigsten numerischen Verfahren zum Auffinden einer bezüglich des gewählten Gütekriteriums optimalen Klassifikation werden anschaulich dargestellt.
In einer umfangreichen Simulationsstudie werden schließlich die vorgestellten Klassifikationsverfahren auf Basis von Streuungsmaßen hinsichtlich ihrer Leistungsfähigkeit gegenüber herkömmlichen Klassifikationsverfahren überprüft.
Inhaltsverzeichnis:
1 Grundlagen und Problemstellung
1.1 Einführung
1.2 Merkmalstypen
1.3 Merkmalstypabhängige Probleme bei Klassifikationsverfahren
1.4 Zielsetzung und Aufbau der Arbeit
2 Gütekriterien zur Partitionierung
2.1 Präzisierung des Klassifikationsproblems
2.2 Maximum-Likelihood-Kriterien für metrischskalierte Merkmale
2.3 Gütekriterien für nominal- und ordinalskalierte Merkmale auf Basis von Streuungsmaßen
2.4 Gütekriterien für gemischtskalierte Merkmale auf Basis von Streuungsmaßen
3 Numerische Verfahren zur Partitionierung
3.1 Zur Notwendigkeit numerischer Verfahren
3.2 Ein heuristisches Verfahren
3.3 Exakte Optimierungsverfahren
4 Verfahren zur Ordinalisierung
4.1 Grundsätzliche Vorgehensweise
4.2 Graphisch explorative Verfahren
4.3 Eindimensionale Klassifikationsverfahren
4.4 Naive Verfahren
4.5 Simulationen
5 Aufbau der Simulationen
5.1 Ergebnisse der Simulationen
5.2 Schlußbemerkungen
Bei statistischen Analysen in den Sozial- und Wirtschaftswissenschaften treten in der Regel alle Merkmalstypen - nominale, ordinale und metrische Merkmale - gemeinsam auf. Da herkömmliche Klassifikationsverfahren nur metrische Merkmale verarbeiten können, werden in der Praxis die Merkmale anderen Typs fast immer wie metrische Merkmale behandelt. Weil dabei von nicht vorhandenen Abstandsinformationen in den Daten ausgegangen wird, führt dieses Vorgehen zu fragwürdigen Ergebnissen. Um nominale und ordinale Daten adäquat verarbeiten zu können, müssen zunächst geeignete Gütekriterien zur Beurteilung einer Klassifikation gefunden werden.
In dieser Arbeit werden verschiedene Konzepte der Streuungsmessung für nominale und ordinale Merkmale umfassend diskutiert, und es wird gezeigt, wie sich aus Streuungsmaßen geeignete Gütekriterien konstruieren lassen. Werden metrische Merkmale in ordinale Merkmale transformiert, so können mit Hilfe dieser Gütekriterien alle Merkmalstypen gemeinsam im Prozeß der Klassenbildung verarbeitet werden. Die sich daran anschließende Frage nach einer geeigneten Transformation metrischer Daten wird ausführlich beantwortet. Auch die wichtigsten numerischen Verfahren zum Auffinden einer bezüglich des gewählten Gütekriteriums optimalen Klassifikation werden anschaulich dargestellt.
In einer umfangreichen Simulationsstudie werden schließlich die vorgestellten Klassifikationsverfahren auf Basis von Streuungsmaßen hinsichtlich ihrer Leistungsfähigkeit gegenüber herkömmlichen Klassifikationsverfahren überprüft.
Inhaltsverzeichnis:
1 Grundlagen und Problemstellung
1.1 Einführung
1.2 Merkmalstypen
1.3 Merkmalstypabhängige Probleme bei Klassifikationsverfahren
1.4 Zielsetzung und Aufbau der Arbeit
2 Gütekriterien zur Partitionierung
2.1 Präzisierung des Klassifikationsproblems
2.2 Maximum-Likelihood-Kriterien für metrischskalierte Merkmale
2.3 Gütekriterien für nominal- und ordinalskalierte Merkmale auf Basis von Streuungsmaßen
2.4 Gütekriterien für gemischtskalierte Merkmale auf Basis von Streuungsmaßen
3 Numerische Verfahren zur Partitionierung
3.1 Zur Notwendigkeit numerischer Verfahren
3.2 Ein heuristisches Verfahren
3.3 Exakte Optimierungsverfahren
4 Verfahren zur Ordinalisierung
4.1 Grundsätzliche Vorgehensweise
4.2 Graphisch explorative Verfahren
4.3 Eindimensionale Klassifikationsverfahren
4.4 Naive Verfahren
4.5 Simulationen
5 Aufbau der Simulationen
5.1 Ergebnisse der Simulationen
5.2 Schlußbemerkungen