Walter Sosa Escudero: “Big data permite ver a la sociedad de una forma más microscópica”

Experto en economía, evalúa los desafíos que enfrenta la Argentina en la administración de ‘una maraña de datos’ que pueden mejorar políticas públicas para luchar contra la pobreza.

Por Gabriel Túñez
lahorasinsombra@gmail.com

Walter Sosa Escudero es investigador principal del CONICET y Doctor en Economía por la Universidad de Illinois en Urbana-Champaign. También director del Departamento de Economía de la Universidad de San Andrés (UdeSA), dice que la gran diferencia entre ‘big data’ y los datos tradicionales con los que el mundo contaba es que ahora la información, además de ser mucha, es espontánea.

Sosa Escudero lo explica en ‘Big data. Breve manual para conocer la ciencia de datos que ya invadió nuestras vidas’, libro recientemente editado por Siglo XII Editores para la colección ‘Ciencia que ladra’. A su tarea como docente e investigador, Sosa Escudero le agrega una relevante agenda de divulgación científica por medio de libros y notas periodísticas que le permitieron ser orador invitado en ‘TEDXRioDeLaPlata’ y reconocido por la Fundación Konex como una de las 100 personalidades más destacadas en las Humanidades (2005-2015).

En diálogo con El Café Diario, Sosa Escudero explica que en el término ‘big data’ están agrupados todos los datos que surgen de la interconexión entre redes sociales, teléfonos celulares, tarjetas de crédito, SUBE, etcétera. “El desafío de un país frente a ‘big data’ es aprovechar esta maraña de información que aparece a borbotones y dotarla de un mecanismo que la haga creíble y confiable”, afirma.

Gran desafío para el Estado

¿Cómo debe manejar el Estado argentino la información de ‘big data’ para, por ejemplo, el diseño de una política pública?

Para diseñar una política pública el Estado tiene que enfrentar desafíos y condiciones, entre ellas la transparencia, la ética, la credibilidad y la ecuanimidad. ¿Qué significa eso? Si decido cambiar la medición de la pobreza todos los meses en un país que tiene un problema de pobreza como la Argentina, voy a tener que discutir si la cifra cambió porque bajó o subió la pobreza o porque yo cambié el instrumento.

El desafío de ‘big data’ para el Estado es aprovechar esta maraña de datos que aparecen a borbotones y dotarlos de un mecanismo que los haga creíbles y confiables”

Una condición que atraviesa la política pública es que muchas veces en busca de esa comparación, se utilizan estrategias que son subóptimas. Por el contrario, lo que te garantiza una encuesta sistemática es que siempre estamos hablando más o menos de lo mismo. Es el mismo instrumento que se aplica durante un período largo y en distintas unidades geográficas. Con ‘big data’ sucede lo contrario. La estadística oficial está sujeta a un acuerdo político que los algoritmos no necesariamente tienen.

El desafío de ‘big data’ para el Estado es aprovechar esta maraña de datos que aparecen a borbotones y dotarlos de un mecanismo que los haga creíbles y confiables. ¿Se puede medir la inflación utilizando los precios que figuran en Internet? Sí, pero no de la misma manera que utilizando las herramientas del Instituto Nacional de Estadística y Censos (INDEC). Hay mucho trabajo de curación que hace el INDEC que ‘big data’ no tiene por qué hacer. El INDEC, por ejemplo, mide ciertas unidades estadísticas pero no de un modo fino porque corre el riesgo de violar la privacidad. Se puede caer muy rápido en eso.

tags
Walter Sosa Escudero. (Foto: Universidad de San Andrés)

El beneficio de contar con muchos datos

¿Qué beneficios podemos encontrar como sociedad en ‘big data’?

Uno de los beneficios es poder contar con muchos datos para analizar. Con más información se está mejor que con menos, y eso es lo primero que salta a la vista. Pero me parece que los beneficios tienen que ver con que el fenómeno de ‘big data’ nos pone ante algunas cosas que antes no se podían ver. Cuando uno tiene pocos datos, saca un promedio y cuesta mucho dar con la heterogeneidad. ¿Qué significa eso? Si yo mido la pobreza en el Gran Buenos Aires, da 35 % sin entrar en discusiones.

Sin embargo, cuando uno se mete en ese 35 %, empieza a ver heterogeneidades más fuertes. Puede encontrar hogares monoparentales con jefas mujeres en los que la tasa de pobreza sube al 70 %. Y si va a un barrio de clase media alta habitado por personas que terminaron la escuela secundaria, la pobreza baja a 2 %. Cuando uno tiene pocos datos cuesta mucho ser preciso en grupos más chiquitos.

No se puede utilizar la Encuesta Permanente de Hogares (EPH) del INDEC para caracterizar la pobreza en un barrio, porque ese tipo de encuestas no es representativa a ese nivel. Si uno pregunta cuánto es la pobreza en las zonas rurales del país si la estadística a nivel nacional es 30 %, seguramente nadie tenga idea porque las encuestas son urbanas. Entonces, lo que permite ‘big data’ es llegar de una forma más microscópica a la sociedad.

Fachada del INDEC
Instituto Nacional de Estadística y Censos (INDEC)

Tarea a futuro del INDEC

¿Cómo debería manejar el INDEC los datos que surgen de ‘big data’?

El INDEC tiene una tarea para el futuro que es generar mediciones específicas para políticas específicas. Nosotros somos un país de desarrollo intermedio que tiene dos problemas: inflación y pobreza. La única forma de medir sistemáticamente el bienestar de la Argentina es la EPH, que es un estudio elemental.

Pero en un país que tiene una tasa de pobreza tan alta no me dice nada que hayas terminado el secundario. Lo que me dice es en qué condiciones lo terminaste, qué sabés y qué no, cómo están las cosas, etc. Es raro que nosotros tengamos los problemas socioeconómicos que tenemos y no tengamos herramientas sistemáticas para medirlas.

El próximo desafío es desarrollar ese tipo de instrumentos finos. Creo que la necesidad de disponer de políticas públicas vendrá de la necesidad de medir correctamente. Y aquí el Estado cumple un rol fundamental porque la estadística social tiene que ser un monopolio del Estado, no por una cuestión de conspiración sino porque es a quien le hemos cedido esa garantía de principios éticos. Pero el Estado no puede ser el sector privado. Hace falta un INDEC que interactúe rápido tanto con el sector científico como con el privado.

Credibilidad perdida

¿Qué opinión tiene del rol del INDEC desde la asunción de Mauricio Macri? ¿El organismo logró recuperar la credibilidad perdida?

La gente cree en el INDEC cuando no se habla del INDEC. Es como el árbitro de fútbol. Cuando hace bien su trabajo, los hinchas no comentan nada de él. Cuando el árbitro se equivoca ocupa el centro de la discusión. Siempre dije que la medida de la credibilidad del INDEC es el espacio que ocupa en la discusión. Cuando tu hijo tiene fiebre la discusión no puede ser el termómetro. Es la discusión equivocada y estás corriendo el foco.

Lo que pasó con el INDEC en los últimos años es que volvió a su rol de irrelevancia. No es muy difícil medir la pobreza y el PBI en la forma tradicional. Mejor dicho: no es que sea fácil sino que está acordado cómo hacerlo. Correr al INDEC de la discusión es bueno porque nos permite concentrar la discusión en la pobreza y la inflación, que son problemas muy serios.

Cuando uno se fija en la discusión que se generó en torno a la eficacia del voto electrónico en Argentina, el sector que fue más cauto frente al cambio resultó el tecnológico”

Hay sospechas de que en época electoral el Estado, con el acceso a los datos que genera la sociedad, pueda inclinar la balanza haciendo una campaña más específica en favor de sus candidatos. ¿Lo ve posible?

Algo de eso ya pasó cuando la Comisión Federal del Comercio de Estados Unidos abrió en 2018 una investigación a Facebook. Lo hizo al conocerse que los datos de unos 50 millones de sus usuarios fueron utilizados por la consultora Cambridge Analytica en favor de sus clientes políticos. El uso de datos se puede dar en múltiples dimensiones y el mecanismo está disponible para un lado y para el otro.

Contratar un ejército de trolls

¿Un partido de la oposición puede acceder a la misma cantidad de datos que el Estado?

Sí, pero el problema es que eventualmente en esa guerra termine ganando el que tenga más plata. Una persona con un celular puede acceder a un montón de datos pero posiblemente no a un nivel de financiamiento que permita contratar un ejército de trolls. En definitiva, el problema no es tanto que acceda o no el Estado a esa información, sino que esa guerra puede ser muy complicada. ‘Big data’ plantea un problema que no es muy distinto al de la transparencia de los fondos de las campañas políticas, si deberían estar reguladas o no las encuestas de opinión, cuándo se deberían dar, etc.

Ciertas cosas deberían ser regulables, como las cuestiones de la privacidad y el respeto a la propiedad del dato que el Estado ejerce porque es el dueño. Me parece que el desafío es confiar. Si uno desconfía o tiene una actitud escéptica de ‘big data’, se va a perder los beneficios. Aunque yo no tendría una actitud 100% a favor ni tampoco inocente. Siempre hay que tener cuidado.

Hay sectores que son bastante buenos en ser guardianes de la información pública. Uno es la comunidad científica”

¿Considera que la dirigencia política debería llegar a un consenso acerca de cómo manejar esos datos a futuro?

Hay sistemas que deberían estar al margen de la política y otros, no. No todo puede estar absorbido por la política. Hay sectores que son bastante buenos en ser guardianes de la información pública. Uno es la comunidad científica. Cuando uno se fija en la discusión que se generó en torno a la eficacia del voto electrónico en Argentina, el sector que fue más cauto frente al cambio resultó el tecnológico. Es el que dijo: “Me da mucho miedo porque percibo que se puede violar el sistema de votación”.

Yo intentaría confiar más en la comunidad científica y en la educativa. Si yo tuviera dudas, que no las tengo, sobre la efectividad de las vacunas, le preguntaría a los científicos. Si tengo dudas acerca de que la Tierra es plana, le pregunto a los astrónomos. No por la superioridad de la ciencia sino por la historia de sus trabajos e investigaciones. La ciencia y la educación, por más que sea una frase hecha, son instituciones relativamente estables. Por eso es tan importante que sigan siéndolo y no estén sujetas a ciclos fuertes, porque aun en períodos álgidos, te pueden garantizar una visión honesta.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *