Opinión

Silicon Valley: la gran operación de escuchas

Los nuevos dispositivos tecnológicos manejados a través de la voz son peligrosos. El espionaje es la sombra de la nueva tecnología.

Silicon Valley: la gran operación de escuchas

La competencia por un gigantesco mercado futuro entra en la fase caliente: a mediados de junio, Apple anunció en su propia conferencia de desarrolladores que por primera vez abrirá «Siri», su asistente manejado por voz, a otros proveedores. Así, Siri se transformará en una completa plataforma de software para los más diversos servicios digitales1.

Amazon, Google y Facebook también han anunciado, por su parte, sistemas similares o ya los están ofreciendo. Cada uno de esos asistentes persiguen el mismo objetivo: recurriendo a «inteligencia artificial» nos ayudarán en tareas cotidianas tales como planificar compromisos, regular la luz o pedir un taxi.

Realizar esas tareas parece algo banal a primera vista. Sin embargo, los asistentes manejados por voz podrían inaugurar una nueva era digital: en la década de 1990, la World Wide Web revolucionó nuestras comunicaciones y nuestro comportamiento mediático; una década más tarde, hicieron esto mismo los teléfonos inteligentes y las aplicaciones. En los años venideros, el manejo por voz de computadoras sustituiría a las aplicaciones, con lo que se nos abrirían las puertas de un nuevo mundo de servicios digitales.

No obstante, esta visión tiene dos inconvenientes de magnitud, ya que, por un lado, los asistentes nos brindan solo servicios seleccionados. Los grupos empresariales establecen cuál puerta se abre a sus clientes. Y cuál no. De este modo se convierten en los guardianes –gatekeepers– que por primera vez harían de Internet algo, de hecho, innecesario. Por otro lado, los asistentes digitales deben, para cumplir sus tareas, no solamente conocernos al dedillo sino también espiarnos constantemente, tanto en el ámbito público como en el privado.

Ciencia ficción real

Hasta ahora nos hemos familiarizado con las computadoras que se comunican con nosotros especialmente a través de las películas de ciencia ficción, ya sea la epopeya espacial «La Guerra de las Galaxias», «Odisea 2001» de Stanley Kubrick, o la sátira futurista «Guía del viajero intergaláctico» de Douglas Adams. Allí las computadoras ejecutan obedientemente las órdenes humanas: preparan un té Earl Grey, averiguan dónde se hospedará un miembro de la tripulación o encuentran la respuesta definitiva a la última de todas las preguntas («42»).

La fascinación por la tecnología basada en el diálogo se alimenta de dos cosas. En primer lugar, dicha tecnología hace que la computadora pueda entender las expresiones lingüísticas tal como nosotros las usamos todos los días. Y es por eso mismo que incluso los niños pequeños pueden usar las computadoras. En segundo lugar, basta con una breve orden para que la computadora realice acciones complejas.

Los poderosos desarrollos tecnológicos de los últimos años hacen que este sueño de futuro se haga realidad. Así, el hardware se ha hecho cada vez más potente. Algunos modelos actuales de teléfonos inteligentes cuentan con una capacidad de cálculo similar a la de las laptops de valor elevado. Además, los grupos empresariales que trabajan con Internet apuestan a lo llamados servicios en la nube, que permiten que los datos de los usuarios sean guardados, analizados y procesados en los servidores de las empresas y no en los equipos. De este modo, las empresas acceden también a información importante sobre sus clientes, sus comportamientos y sus relaciones sociales.

También en el ámbito del software se han logrado enormes progresos, entre los cuales los del campo del reconocimiento de voz son de los principales. Las computadoras incluso están pudiendo convertir en texto escrito dictados de varias páginas prácticamente sin errores.

Todo esto conforma también el fundamento del desarrollo decisivo: la así llamada inteligencia artificial, o sea, programas para computadoras que resuelven problemas de aplicación por sí mismos y que amplían de ese modo sus propias capacidades. Al analizar, además, los datos útiles recogidos, el software que aprende podría adaptarse a diferentes contextos y condiciones de manera casi totalmente autónoma.

El bot como caballo de Troya

La medida en la que este enfoque ya ha avanzado queda evidenciada por los planes que Facebook presentó a mediados de abril en su conferencia para desarrolladores «F8».

Este grupo empresarial pretende, por ejemplo, incluir bots (robots de comunicación que se comunican de manera autónoma con los usuarios) en su programa de mensajería instantánea, usado por más de 900 millones de personas en todo el mundo2.Los bots brindarían no solamente respuestas a cualquier pregunta que se formule, sino que cumplirían también deseos particulares de los clientes. Para que se produzca el diálogo comercial directo entre los bots y los usuarios, las empresas tienen que facilitarle a Facebook únicamente interfaces con sus sistemas de tienda y, de ese modo, con sus bancos de datos.

Desde el punto de vista de los usuarios, los bots ofrecen muchas ventajas. En el futuro ya no tendrán que ir de una aplicación a otra para aprovechar diferentes ofertas. En lugar de ello, por medio de Facebook, obtendrán todo de un mismo proveedor. Ya se ven las primeras posibilidades: a través del programa de mensajería instantánea pueden consultarse las últimas noticias y el informe meteorológico; la CNN y el servicio Poncho ofrecen los primeros bots en este ámbito. Y la tienda web «Spring» permite pedir zapatos a través de un chat para ventas.

Facebook tiene un buen motivo para apostar por las computadoras basadas en el diálogo: en el pasado han fracasado lastimosamente sus intentos para quebrar el predominio de Apple y Google en el mercado de los sistemas operativos móviles. Por el contrario, Facebook podría infiltrar su nuevo asistente –igual que un caballo de Troya– en los teléfonos inteligentes de cualquier fabricante. Los sistemas cerrados de Google y Apple podrían ser ocupados, entonces, desde adentro. Es que cuanto más se haga cargo el programa de mensajería instantánea, dotado de inteligencia artificial, de las funciones de las aplicaciones instaladas, más rápido quedará fuera de carrera el familiar sistema de escritorio con sus coloridos iconos3.

Los usuarios probablemente deberán acostumbrarse a la presencia permanente de los robots de comunicaciones. Es que los bots pueden inmiscuirse en todo momento en conversaciones privadas: si dos usuarios acuerdan, a través de un programa de mensajería instantánea, por ejemplo, encontrarse para comer, el asistente propone rápidamente una selección de restoranes en las cercanías. Bastará una breve indicación para reservar la mesa adecuada.

La nueva forma de ir de compras

Sin embargo, los bots presentan una variedad de ofertas muy limitada, ya que los asistentes recurren en primer término a las interfaces de socios cooperativos seleccionados: Amazon en lugar de eBay, Bing en lugar de Google, Spotify en lugar de Deezer, Yelp en lugar de TripAdvisor. De este modo, el sistema resulta igual a un buscador que solo consulta determinadas páginas web, a saber, aquellas cuyos propietarios más pagan a los grupos empresariales. Muy poco en común tiene esto con los principios de una World Wide Web abierta.

Pero es probable que los bots terminen imponiéndose, ya que, tal como muchos opinan, pesará más el deseo de comodidad. Y, de hecho, comprar nunca fue más fácil: el bot solo tiene que preguntar el tamaño, el material y el color para presentar en cuestión de segundos un adecuado surtido de zapatos. De la misma manera puede juntar las noticias de la mañana, recomendar la próxima novela o avisar acerca de un nuevo negocio que ha abierto a muy escasa distancia. Y si ya se han ingresado alguna vez los datos de la tarjeta de crédito y la dirección, los procesos de pago se ejecutan también de forma prácticamente automática y en un segundo plano.

En el mundo feliz de los servicios llevan ventaja los grupos empresariales que ya han extraído y analizado todos los datos de sus usuarios durante los años anteriores. Quien lleva la delantera aquí es especialmente Facebook, que ya conoce a la perfección los intereses de sus aproximadamente 1.300 millones de usuarios en todo el mundo. Pero también el gigantesco buscador Google sabe al detalle qué desean sus clientes.

Los competidores tampoco se duermen y quieren que los bots empiecen a convivir con nosotros. Cómo sería esto es algo que ya ha mostrado de forma impresionante la tienda online Amazon. Su dispositivo digital «Echo» tiene forma cilíndrica y 25 centímetros de altura, allí hay alojados parlantes y un micrófono. Una vez conectado, se pueden pedir con una orden verbal todos los productos que se deseen, buscar títulos de películas o preguntar en qué año se construyó la torre Eiffel.

Este dispositivo puede conseguirse en los Estados Unidos hace más de un año por poco menos de 180 dólares; Amazon ya ha vendido más de tres millones de asistentes. Este éxito ha provocado un gran sobresalto en los rivales. Es por ello que a mediados de mayo Google presentó su correspondiente parlante en red llamado «Google Home».

A los clientes claramente no les molesta que su asistente digital escuche todas las conversaciones. Los sistemas se activan generalmente por gritos. Así, los asistentes de Amazon esperan pacientemente la palabra «Alexa» (tal el nombre de este programa manejado por voz) para responder a indicaciones concretas. Aquí aparecen algunos problemas de funcionamiento: los usuarios informan que «Alexa» reacciona en medio de una conversación sin que medie una petición explícita y encarga en Amazon productos sin una selección previa.

La datafication de la voz

A esto se suma que la «datafication» de millones de voces hará mucho más difícil en el futuro hacer un uso anónimo de la web. Si bien es muy demodé andar con mouse y teclado, esto permite usar los servicios web sin exponer la propia identidad. Incluso al hacer compras uno puede decidirse por formas de pago anónimas como BitCoin.

Pero si en un futuro la voz humana reemplazase al pasaporte, podrá asociarse a cada persona cualquier consulta de información, cualquier orden y prácticamente cualquier conversación escuchada4. Así, el usuario, en tanto no altere su voz artificialmente, ya casi no podrá moverse por la red sin ser reconocido5.

Pero gracias a la escucha permanente, también en el «mundo real» será imposible permanecer sin ser reconocido: una vez que en todos lados hayan sido instalados servicios activados por voz, una gran parte de nuestras conversaciones podrá ser interceptada a cada paso, no solo entre las cuatro paredes de la casa propia sino también en el autobús, en la zona peatonal o en el café.

Del mismo modo, con un esfuerzo relativamente escaso podrían generarse también perfiles completos de movimiento de cada persona y de su entorno social. Es probable que este enorme potencial de vigilancia tampoco haya podido permanecer oculto a los ojos de los servicios de inteligencia. Es por ello que a comienzos de mayo, el periodista estadounidense Matt Novak pidió al FBI que le informara si también utilizaba el «Echo» de Amazon para hacer escuchas secretas de personas6.

Esta sospecha no es muy descabellada: a mediados de mayo se supo que el FBI había instalado en las calles de San Francisco, alrededor de un juzgado federal, micrófonos ocultos por poco menos de un año, y sin contar con la previa autorización de un juez7. El FBI no quiso «confirmar ni negar» que usará asistentes digitales para sus operaciones de escuchas8.

El fin de la utopía

Ya mismo puede vislumbrarse que los asistentes activados por voz producirán enormes consecuencias: en el mercado digital, en nuestras costumbres de consumo y –en no menor medida– en nuestra esfera privada.

La preocupación aquí no se alimenta tanto de un escepticismo frente a la tecnología influido por un pesimismo cultural como del ya inmenso poder de mercado de los grupos empresariales. Actualmente, prácticamente todo hogar alemán cuenta con teléfonos inteligentes, tabletas y computadoras que suelen estar permanentemente conectados a Internet. En estos equipos se ejecutarán en el futuro las aplicaciones controladas por voz con las cuales las empresas podrán inmiscuirse en la esfera privada de las personas aun más de lo que ya se inmiscuyen.

Hay particularmente dos aspectos que hacen esta perspectiva tan amenazante: en primer lugar, los grupos empresariales casi no están sujetos –a diferencia de las autoridades del Estado– a limitaciones legales9. Pero eso es lo que aprovechan precisamente los servicios de inteligencia: hacen uso gustosamente de la falta de controles –de esto nos hemos enterado a partir de las revelaciones de Snowden– para espiar a ciudadanos y ciudadanas en colaboración con los grupos empresariales.

En segundo lugar, ni siquiera los usuarios que deciden no usar tecnología manejada por voz pueden protegerse contra este espionaje. Se torna, pues, más necesario que haya normas vinculantes sobre cuándo y qué datos pueden recoger, guardar y analizar en sus servidores los grupos empresariales. De lo contrario, la utopía optimista se transformará inevitablemente en una distopía de vigilancia bastante oscura. La forma que esta podrá tomar ya nos la han revelado numerosos clásicos de la ciencia ficción tales como «Alphaville», «Minority Report»… o «1984».


Fuente: Blätter für deutsche und internationale Politik 7/2016, https://www.blaetter.de

Traducción: Carlos Díaz Rocca



  • 1.

    Cf. Apple öffnet sich: Aus Funktionen werden Plattformen (“Apple se abre: las funciones se transforman en plataformas”), www.sueddeutsche.de, 14-6-2016.

  • 2.

    La comunicación automatizada con bots ya está muy expandida en las redes sociales: es así que poco más del ocho por ciento de los 320 millones de usuarios de Twitter en todo el mundo tendrían metidos bots en sus perfiles. Cf. www.venturebeat.com, 12-8-2014. E incluso una cuarta parte de quienes siguen por Twitter a Donald Trump son presuntamente bots, según los expertos, cf. www.sueddeutsche.de, 23-5-2016.

  • 3.

    A comienzos de junio, la profesora universitaria estadounidense Kelli Burns expresó sus sospechas de que Facebook ya esté espiando secretamente a usuarios y usuarias con la ayuda de los micrófonos de los teléfonos inteligentes. A partir de lo escuchado, Facebook dirigiría la publicidad a un público preciso. El grupo empresarial desmintió esto de inmediato. Cf. http://news- room.fb.com, 2-6-2016.

  • 4.

    Las características de la voz humana son, en opinión de los expertos en seguridad, tan inconfundibles como una huella digital o el iris. Cf. www.theguardian.com, 19-2-2016.

  • 5.

    Así, Apple, por ejemplo, guarda en sus propios servidores información de voz de sus usuarios por un lapso de dos años. Cf. www.mactechnews.de, 19-4-2016.

  • 6.

    Cf. www.gizmodo.com, 11-5-2016.

  • 7.

    Cf. www.eastbayexpress.com, 11-5-2016.

  • 8.

    La tecnología de reconocimiento de voz fue mejorada especialmente por las investigaciones que desde la década de 1970 lleva adelante el Ministerio de Defensa de los Estados Unidos. Cf. www.engadget.com, 7-7-2014.

  • 9.

    Cf.: Bundesverfassungsgericht: Angriff auf den Großen Lauschangriff (Corte Constitucional de Alemania: Ataque a la gran operación de escuchas), www.spiegel. de, 2-3-2004.