Ein neues Verfahren für namensbasierte Zufallsstichproben von Migranten (A New Name-Based Sampling Method for Migrants)
NO. WP-GRLC-2012-02
26 Pages Posted: 31 Mar 2020
Date Written: June 27, 2012
Abstract
German Abstract: Zu den besten Verfahren für die Konstruktion von Migrantenstichproben gehören namensbasierte Stichproben. Hierfür werden bislang entweder ad-hoc-Listen oder namenskundliche Lexika für die Klassifikation von Namen verwendet. In diesem Beitrag wird ein neues Verfahren vorgeschlagen, das auf der automatischen Klassifikation eines Namens anhand der n-Gramme des Namens und der Anwendung des Bayes-Theorems basiert. Das neue Verfahren ist fehlertolerant gegenüber alternativen Schreibweisen und erlaubt auch die Klassifikation von Namen, die sich nicht in den Lexika finden. Das Verfahren wurde anhand der Namen der ca. 1600 Ausländer im PASS-Panel und einer CATI-Studie in Hessen untersucht.
English Abstract: The set of best methods for sampling migrant populations includes name-based sampling. So far this is done using either ad-hoc lists or onomastic dictionaries for the classification of names. This paper proposes a new name-based procedure, which uses a Bayes-classifier for the n-grams of the name. The new procedure is fault-tolerant of alternate spellings, and also allows the classification of names that are not found in dictionaries. It was tested using the names of about 1600 foreigners in the PASS panel. Finally, a CATI survey based on the new method in Hesse is described.
Note: Downloadable document available in German.
Keywords: onomastics, sampling, survey methodology
Suggested Citation: Suggested Citation