Grafos Acíclicos Dirigidos (GAD)
Aprende a crear diagramas para modelar relaciones causales. No hagas econometría sin antes hacer esto.
Esta es la última parte del primer capítulo de Econometría con Python que estoy haciendo. El siguiente post (la próxima semana) ya comenzaré con el capítulo de regresión lineal. El outline está increíble: nos vamos directo a las tripas de la regresión con ejemplos y simulaciones. Todo lo que estoy publicando aquí va a ser en Python, pero el libro también tendrá sus versiones en R. Ya estoy emocionado por todo lo que veremos.
Hay una manera gráfica de representar las relaciones causales. Se llaman Grafos Acíclicos Dirigidos (GAD). Básicamente son dibujos donde se relacionan las variables que nos interesan usando flechas para representar la causalidad.
Los DAG se usan para plantear un modelo del estado del arte del fenómeno que estamos estudiando. También se usan para encontrar posibles problemas que el modelo nos plantea.
Mi primer DAG
Para mostrar el poder de los GAD, comencemos con un ejemplo sencillo.
Considera el siguiente diagrama:
Es sencillo. Muestra únicamente la relación de $D$ con $Y$. Pero es común que las relaciones causales sean afectadas por otros factores externos. Veamos un ejemplo.
El efecto de asistir a una universidad de elite
¿Cuál el efecto que puede tener asistir a una universidad de elite? Existen muchos estudios que estiman que las personas que entran a las universidades Ivy League (Harvard, Stanford, MIT, etc) tienen más ingresos que las personas que estudian en otras instituciones.
Pero como hemos visto antes, la correlación no necesariamente significa que haya causalidad. Hay otros factores detrás de los ingresos de las personas que son difícil separar de la entrada a una universidad particular. Por ejemplo, la educación de los padres o los ingresos familiares pueden influir en la entrada a la universidad. Todos estos aspectos suelen interactuar entre si, lo cual vuelve complejo estudiar causas y efectos.
En 1999 se publicó un estudio hecho por Stacy Berg Dale y Alan Krueger que abordó este problema de una forma ingeniosa. No es posible simplemente comparar los ingresos de aquellos que ingresaron a las universidades de elite con quienes no lo hicieron, pues ambos podrían ser radicalmente diferentes.
Por lo tanto, lo que hicieron ellos fue comparar doppelgängers. Un doppelgänger es un gemelo o réplica idéntica, en este caso de los jóvenes que entraron a las escuelas de élite en los Estados Unidos.
Este tipo de estudios no es muy común. ¿De donde sacaron los doppelgängers para su estudio? Se requiere que sean jóvenes con las mismas características que los chicos que entraron a estas universidades: con mismo nivel socioeconómico, ingresos familiares y educación de los padres en promedio. La única diferencia es que son chicos que no entraron a la universidad de élite.
La respuesta que encontraron a este acertijo fue usar los datos de jóvenes que fueron aceptados, pero que por alguna circunstancia externa al final decidieron enrolarse en otra universidad. Estos alumnos son verdaderos doppelgängers de los alumnos que fueron admitidos y asistieron, pues en teoría tienen todas las otras características que sirven para hacer una comparación: tienen el nivel educativo y probablemente características socioeconómicas comparables.
Continúa leyendo con una prueba gratuita de 7 días
Suscríbete a Marionomics: Economía y Ciencia de Datos para seguir leyendo este post y obtener 7 días de acceso gratis al archivo completo de posts.