Vallebro Comunicación

Revista de Internet

Internet

¿Qué va a hacer Google con los contenidos generados con IA en su buscador?

Morgan Overholt vio cómo la mitad del tráfico de su página web desaparecía de la noche a la mañana.

«Esto es una broma», escribía otra persona en un foro para dueños de páginas web. «Tengo contenido en formato largo, bien escrito, bien investigado, lleno de contenido con imágenes originales PERDIENDO frente a la basura de 500 palabras generada por inteligencia artificial… Google parece que está forzando a los editores a generar spam de IA o a morir».

Estas son solo dos voces en un gran coro que se queja de que la última actualización de «contenido útil» del motor de búsqueda —que pretende mejorar la calidad de los resultados ofrecidos— ha provocado que sus webs caigan en picado en las clasificaciones.

La nueva actualización, que se ha estado implementando este mes, prometía varios ajustes positivos para castigar a las páginas que se diseñan solo para estar mejor posicionadas en los buscadores. Sin embargo, también ha venido acompañada de una gran red flag que actualmente tiene a muchos propietarios de páginas web preocupados: la autoría humana ya no es necesaria.

Según ha publicado Barry Schwartz, de SEO Roundtable, en su perfil de X (Twitter), Google ha modificado recientemente la documentación que explica cómo define el «contenido útil». Ya no se trata de «contenido útil escrito por personas, para personas», sino simplemente de «contenido útil escrito para personas».

La llegada de este cambio, que ha coincidido con la última actualización del algoritmo de búsqueda, ha puesto nerviosas a muchas páginas web.

Una creadora de contenido que tiene un blog sobre viajes asegura que ha visto cómo el 80% de su tráfico desaparecía en 48 horas, siendo superada en el ranking de búsquedas por páginas que estaban «obviamente redactadas por inteligencia artificial«.

«Ayer vimos una caída del 55% del tráfico normal, y hoy es incluso peor», ha declarado a Business Insider Overholt, que dirige varias webs relacionadas con los viajes. Ha visto cómo páginas que antes ocupaban los primeros puestos para determinados términos caían al quinto, sexto o séptimo lugar en los resultados de búsqueda de Google.

Páginas web que tienen tres o cuatro años ahora se sitúan por encima de ella, ha añadido. (Overholt ha colaborado en el pasado con este medio de comunicación).

Estas variaciones son habituales cuando Google lanza nuevas actualizaciones y los creadores de contenido suelen quejarse cuando cambian cosas tan importantes como esta, pero algunos administradores de páginas web señalan que nunca antes habían visto un cambio como este.

Contenido generado por IA y «refritos»

«El sistema de clasificación de contenido útil fue diseñado para mostrar más contenido en los resultados de búsqueda, que se crea para ayudar o informar a las personas, y menos contenido creado únicamente para posicionarse mejor en la Búsqueda de Google», ha expresado un portavoz de la compañía a Business Insider.

«No nos centramos en el contenido producido por un método concreto, ya sea inteligencia artificial o de otro tipo, sino en la calidad de una página web determinada y su utilidad para los lectores», ha agregado.

Uno de los principales objetivos parece ser reducir las páginas que reutilizan y reajustan información que ya está online con el fin de posicionarse mejor en los resultados de búsqueda.

El problema es que los grandes modelos lingüísticos se entrenan con grandes cantidades de contenido extraído de Internet. Así que, en esencia, estos modelos de IA están repitiendo ingeniosamente lo que ya se ha publicado. Eso es algo que Google debería castigar. Sin embargo, la empresa también está desarrollando sus propios modelos, por lo que está se encuentra en una situación conflictiva.

Uno de los responsables de cómo funcionan las búsquedas de Google, John Mueller, se pasa el día intentando calmar los ánimos de las páginas web mientras explica los objetivos de la reciente actualización de su compañía.

Mueller ha debatido con el propietario de una web que se dedica a registrar el patrimonio neto de los famosos sobre el funcionamiento de su propia página. Schwartz ha explicado este miércoles el problema que tenía con su web en Search Engine Roundtable.

Las respuestas de Mueller muestran la delicada situación en la que se encuentra Google. Por un lado, la empresa dice que el contenido generado por inteligencia artificial está bien, pero, por otro, Mueller critica al propietario de una página por haber utilizado ChatGPT.

«Creo que deberías centrarte en contenidos únicos, convincentes y de alta calidad que aporten algo a tu web», escribió Mueller en X. «Tal y como lo tienes ahora, parece una recopilación de resultados de ChatGPT sobre temas acerca de los que ya han hablado montones de páginas».

En agosto, el responsable de búsquedas de Google abordó cuestiones similares durante una conversación que tuvo lugar en Reddit. Un comentario destacó como una crítica inadvertida los esfuerzos de Google por crear un modelo de IA, que incluye propuestas para que sus bots escriban textos automáticamente.

«Por definición (estoy simplificando), si utilizas inteligencia artificial para escribir tu contenido, va a ser un refrito de otras páginas«, dijo Mueller en aquel momento.

Detectar el contenido generado por IA es prácticamente imposible

En la actualidad, no se puede saber si el contenido que se ha subido a una web ha sido generado por inteligencia artificial o si se trata simplemente de otro contenido escrito por una persona, pero de forma diferente. Esto pone de manifiesto un problema tanto para los usuarios como para Google: actualmente es imposible distinguir entre el contenido generado por un bot y el elaborado por un humano.

La firma de Mountain View sigue afirmando que los contenidos generados con el único fin de aparecer en los primeros puestos de los resultados de búsqueda van a ser castigados, pero ya no dice que va a bloquear el contenido generado por IA, siempre que este supere las pruebas de calidad realizadas por los propios bots de Google.

Se trata de una batalla que la compañía tiene que librar en varios frentes. La inteligencia artificial generativa está facilitando y agilizando la creación de contenidos. Es probable que esto desencadene en una avalancha de contenido generado por bots que inunde la red.

Elegir qué página o qué imagen que hayan sido generados por la IA son mejores que otros, entre miles y miles que traten sobre el mismo tema y que hayan sido publicados automáticamente en pocas horas, será una tarea colosal, incluso para un gigante tecnológico del tamaño de Google.

«El hombre del tanque» generado por inteligencia artificial

El medio especializado 404 informó este miércoles de que una búsqueda sobre «el hombre del tanque» de la Plaza de Tiananmen había ofrecido como resultado una versión de la icónica imagen generada por IA.

Business Insider no ha podido comprobarlo, pero otros usuarios han corroborado el descubrimiento del medio de comunicación, lo que sugiere que Google ha realizado algunos cambios después de que 404 publicase su artículo.

No es la primera vez que el buscador más importante de la historia ofrece una versión artificial de un contenido conocido. El pasado mes de mayo, Futurism también publicó que el primer resultado para «Johannes Vermeer» era una versión generada por inteligencia artificial de La joven de la perla.

Cuando se trata de imágenes y vídeos, puede haber formas de abordar el problema: Google y otras empresas del sector tecnológico están diseñando formas de poner marcas de agua a las imágenes y vídeos generados por IA, lo que podría ayudar a los motores de búsqueda a detectarlos.

Pero los últimos cambios del motor de búsqueda han puesto nerviosa a mucha gente, que cree que la avalancha de contenidos generados por inteligencia artificial ya ha comenzado y que Google le está poniendo pocas trabas.

Ramón Armero