PropertyValue
?:abstract
  • "Clusteranalyse ist ein Verfahren der numerischen Klassifikation für den Fall, dass die Klassen noch nicht (vollständig) bekannt sind und aus Daten erst konstruiert werden müssen. Das Fehlen eines generellen Daten- oder statistischen Modells als formales Gerüst für die Konstruktion von Klassifikationen führt zu einer inzwischen kaum mehr überschaubaren Anzahl von Verfahren zur Entdeckung einer Clusterstruktur. Der Erfolg der Anwendung hängt von der 'richtigen' Kombination von Daten und Verfahren ab, die aber - außer bei Simulationsdaten - genau so wenig bekannt ist wie die Clusterstruktur selbst. Im Folgenden behandeln wir zwei Verfahrensklassen, die dem Anwender seit langem in allen großen Statistikpaketen zur Verfügung stehen: agglomerative hierarchische Verfahren und K-Means. Erstere setzen die Wahl von geeigneten numerischen Differenzmaßen und deren Erweiterung auf Aggregate von Einzelbeobachtungen voraus. Sukzessiv werden Einzelbeobachtungen zu Gruppen, und Gruppen zu größeren Gruppen bis zum Erreichen der Gesamtstichprobe zusammengefasst. Die Anzahl möglicher Cluster muss aus der Abfolge der Differenzmaße nach einem 'Ellenbogenkriterium' erschlossen werden. Bei K-Means wird die Anzahl der Cluster vorausgesetzt. Partitionen der Stichprobe werden nach einem Heterogenitätsindex bewertet, der die Homogenität der Cluster und ihre Differenz voneinander misst und eine Startpartition durch einen Austauschalgorithmus in eine Konfiguration überführt, die dem Minimaldistanzkriterium genügt. Unter allen Partitionen mit dieser Eigenschaft befindet sich diejenige mit minimaler Heterogenität. Abschließend stellen wir das TwoStep-Verfahren (SPSS) dar, das eine Verallgemeinerung der agglomerativ-hierarchischen Verfahren zur Verarbeitung extrem großer Stichprobenumfänge ist." Der ALLBUS 2004 wird als Beispieldatensatz zur Clusteranalyse verwendet. (xsd:string)
?:author
?:comment
  • (ALLBUS) (xsd:string)
?:dataSource
  • ALLBUS-Bibliography (xsd:string)
?:dateCreated
  • Aufgenommen: 25. Fassung, März 2011 (xsd:gyear)
?:dateModified
  • 2010 (xsd:gyear)
?:datePublished
  • 2010 (xsd:gyear)
?:duplicate
?:editor
?:fromPage
  • 525 (xsd:string)
is ?:hasPart of
?:issueNumber
  • 21 (xsd:string)
is ?:mainEntity of
?:name
  • Clusteranalyse (xsd:string)
?:publicationType
  • incollection (xsd:string)
?:publisher
?:reference
?:sourceCollection
  • Handbuch der sozialwissenschaftlichen Datenanalyse (xsd:string)
?:sourceInfo
  • Bibsonomy (xsd:string)
  • In Handbuch der sozialwissenschaftlichen Datenanalyse, edited by Wolf, Christof and Best, Henning(21), 525-552, VS Verlag für Sozialwissenschaften, 2010 (xsd:string)
?:studyGroup
  • ALLBUS (xsd:string)
?:tags
  • 2010 (xsd:string)
  • ALLBUS (xsd:string)
  • ALLBUS2004 (xsd:string)
  • ALLBUS_input2010 (xsd:string)
  • ALLBUS_pro (xsd:string)
  • ALLBUS_version25 (xsd:string)
  • FDZ_ALLBUS (xsd:string)
  • checked (xsd:string)
  • incollection (xsd:string)
?:toPage
  • 552 (xsd:string)
rdf:type