Instrument Validity Tests with Causal Trees: With an Application to the Same-sex Instrument

40 Pages Posted: 26 Sep 2018 Last revised: 6 Nov 2018

See all articles by Raphael Guber

Raphael Guber

Max Planck Society for the Advancement of the Sciences - Munich Center for the Economics of Aging (MEA)

Date Written: September 17, 2018

Abstract

English Abstract: The use of instrumental variables (IVs) to identify causal effects is widespread in empirical economics, but it is fundamentally impossible to proof their validity. However, assumptions sufficient for the identification of local average treatment effects (LATEs) jointly generate necessary conditions in the observed data that allow to refute an IV‘s validity. Suitable tests exist, but they may not be able to detect even severe violations of IV validity in practice. In this paper, we employ recently developed machine learning tools as data-driven improvements for these tests. Specifically, we use the causal tree (CT) algorithm from Athey and Imbens (2016) to directly search the covariate space for violations of the LATE assumptions. The new approach is applied to the sibling sex composition instrument in census data from China and the United States. We expect that, because of son preferences, the siblings sex instrument is invalid in the Chinese context. However, existing IV validity tests are unable to detect violations, while our CT based procedure does.

German Abstract: Die Verwendung von Instrumental Variablen (IV’s) zur Identifizierung von kausalen Effekten ist weit verbreitet in der empirischen Wirtschaftsforschung. Es ist jedoch fundamental unmöglich deren Validität zu beweisen. Annahmen zur Identifizierung von local average treatment effects (LATEs) generieren notwendige Bedingungen in den beobachteten Daten, die es erlauben, die Validität von IV’s zu widerlegen. Es existieren bereits entsprechende statistische Tests. Diese sind in der Praxis jedoch möglicherweise nicht in der Lage selbst starke Verletzungen der IV Validität zu entdecken. In diesem Papier verwenden wir neue Werkzeuge aus der Machine Learning Literatur um diese Tests zu verbessen. Insbesondere verwenden wir den Causal Tree (CT) Algorithmus von Athey und Imbens (2016) um im Kovariablen Raum direkt nach Verletzungen der LATE Annahmen zu suchen. Die neue Methode wird auf das „sibling sex“ Instrument in Zensusdaten aus China und den USA angewandt. Wir erwarten, dass das „sibling sex“ Instrument aufgrund von Präferenzen für Söhne statt Töchtern in den chinesischen Daten invalide ist. Wir finden allerdings, dass die existierenden Tests nicht in der Lage sind Verletzungen des IV’s festzustellen, während unser auf dem CT Algorithmus basierender Test Verletzungen findet.

Keywords: Instrument Validity, Recursive Partitioning, Machine Learning

JEL Classification: C12, C18, C26

Suggested Citation

Guber, Raphael, Instrument Validity Tests with Causal Trees: With an Application to the Same-sex Instrument (September 17, 2018). MEA Discussion Paper No. 05-2018. Available at SSRN: https://ssrn.com/abstract=3251210 or http://dx.doi.org/10.2139/ssrn.3251210

Raphael Guber (Contact Author)

Max Planck Society for the Advancement of the Sciences - Munich Center for the Economics of Aging (MEA) ( email )

Amalienstrasse 33
Munich, 80799
Germany

HOME PAGE: http://mea.mpisoc.mpg.de/index.php?id=230&no_cache=1&tx_meamitarbeiteranzeige_pi1%5BshowUid%5D=1224&

Here is the Coronavirus
related research on SSRN

Paper statistics

Downloads
42
Abstract Views
433
PlumX Metrics