Cada día se efectúan miles de millones de búsquedas en Internet. Esta data en conjunto constituye una nueva y valiosa fuente de información, especialmente sobre los prejuicios y secretos más íntimos de las personas. Antes de la existencia de los buscadores, las preguntas embarazosas o personales —sobre salud, sexo o inseguridades diversas— se hacían a amigos o parientes experimentados. Actualmente, las respuestas se buscan en Google y servicios similares. Y como millones preguntan, las búsquedas configuran un mapa colectivo de deseos, miedos y esperanzas.
Seth Stephens-Davidowitz es el autor de Everybody lies, libro reciente en el cual analiza diversa información recogida en algoritmos de búsqueda, redes sociales y hasta páginas pornográficas. El autor ha identificado correlaciones sorprendentes que podrían inferir que es bastante común que la gente se engañe a sí misma y mienta a amigos, doctores y encuestadores. En terreno movedizo como este, la información del Internet puede funcionar como un suero de la verdad. Por ejemplo, sobre la base de ella, el autor estima el porcentaje (5%) de norteamericanos gay, identifica cómo predecir la tasa de desempleo semanas antes de las publicaciones oficiales, y descubre prejuicios inconscientes de las familias respecto de sus hijas mujeres.
El big data ya viene usándose para predecir el comportamiento de consumidores: para estimar la morosidad bancaria, así como para pronosticar las películas más taquilleras del próximo fin de semana. El autor afirma que tales algoritmos ya podrían, mejor que las mismas personas, identificar sus gustos e ideas.
Son cuatro las virtudes del big data: 1) ofrece data más verídica sobre temas complejos: prejuicios raciales, sexo, etc.; 2) permite, a costo mínimo, experimentar a gran escala; es decir, ir tanteando hipótesis sobre causa-efecto, lo que antes era laborioso y caro; 3) facilita, por la magnitud disponible de data, lo que anteriormente era estadísticamente imposible: enfocar con mayor precisión en subgrupos específicos de personas; y 4) provee de nuevos tipos de data.
El libro tiene descubrimientos que sorprenden, otros que mueven a risa, algunos que pueden generar repulsión. Por ejemplo, en EEUU la búsqueda de chistes racistas aumenta 30% en el feriado que conmemora a Martin Luther King. En todo caso, hace pensar. De otro lado, en el plano sexual, revela que son cientos de miles los jóvenes atraídos por mujeres mayores; que muchos hombres preferirían que sus mujeres fueran algo más gruesas; sorprende que la pornografía violenta contra mujeres atraiga también a éstas. Más del 75% de búsquedas con el texto “yo quiero tener sexo con…” resultan incestuosas. Es obvio que muchas personas se extravían lúdicamente en su comportamiento digital y que algunos tipos de búsquedas de Google apuntan a lo prohibido, todo lo cual el autor lo aclara y relativiza bien. Pero el autor está convencido de que pensadores como Nietzsche y Freud habrían quedado fascinados y trabajarían por meses con la información disponible que resulta de las búsquedas en los hubs de pornografía en Internet.
Lamentablemente, el autor elabora poco sobre los riesgos y peligros de algunos de estos avances. El impacto de los algoritmos de big data puede también resultar nocivo para el eficaz y justo funcionamiento de los mercados y de las decisiones políticas. Una disponibilidad gratuita y abundante de pornografía puede afectar adversamente la calidad misma de las relaciones humanas. Si hubiera una manera infalible para medir el impacto real de la Internet en el comportamiento humano, es claro que no sólo hay luces obvias, también existen algunas sombras obscuras.