Vallebro Comunicación

Revista de Internet

Internet

Google usará Reddit para entrenar su inteligencia artificial

Después de varios días de rumores, Google y Reddit han oficializado su «asociación extendida». A través de este un nuevo acuerdo, los de Mountain View obtendrán acceso a la API de datos del popular foro y podrán utilizar sus contenidos para entrenar sus modelos de inteligencia artificial, entre otras cuestiones.

Los comunicados de ambas compañías son bastante escuetos con respecto al alcance de esta colaboración. Lo que Reddit sí ha mencionado es que la integración le brindará a Google «modos más eficientes para entrenar sus modelos», sin elaborar mucho más sobre el tema.

Como contraprestación, Reddit tendrá la posibilidad de sacar provecho de Vertex AI. La plataforma la utilizará para mejorar sus búsquedas internas y «otras capacidades», mencionaron los californianos.

Pero que Google acceda a la API de datos de Reddit no solo permitirá que utilice su contenido para «alimentar» a sus modelos de IA. Los de Sundar Pichai también aseguran que esta alianza ayudará a que sea más fácil mostrar resultados e información proveniente de Reddit en sus distintos servicios.

«Al hacer que el contenido y las comunidades de Reddit sean más fáciles de encontrar, podemos mantener nuestra creencia en una Internet abierta y, al mismo tiempo, brindar un mejor servicio a los usuarios actuales y llegar a nuevas audiencias», indicó la compañía dirigida por Steve Huffman.

Google entrenará su IA con contenido de Reddit

Si bien el nuevo acuerdo entre las empresas no revela demasiado, lleva varios días generando ruido. Horas atrás, de hecho, Reuters reportó que Google le pagaría 60 millones de dólares al año a Reddit para licenciar el contenido de su sitio. Por lo pronto, ambas firmas han evitado referirse al costado monetario de este asunto.

Lo que no está claro es cómo usará Google las publicaciones de Reddit para entrenar sus modelos de lenguaje. Específicamente, si los de Mountain View realizarán algún tipo de filtrado sobre las publicaciones. O si directamente le lanzarán todo lo incluido en los distintos subreddits a su inteligencia artificial, sin ningún tipo de distinción.

Si bien Reddit es extremadamente popular, no es ajeno a las polémicas. En especial, por la falta de moderación de contenido en algunas de sus comunidades. Tengamos en cuenta que, más allá de los memes y el entretenimiento, existen subreddits en los que se chantajea a mujeres con fotos y vídeos sexuales, así como otros en los que se comparte material de violencia gráfica o pro Nazi, por solo mencionar algunos ejemplos.

Este acuerdo también se presenta como una suerte de victoria para Reddit. En octubre pasado, la compañía amenazó con bloquear los rastreadores de búsqueda de Google y Bing para evitar que su contenido apareciera en sus respectivas páginas de resultados. Esto, para evitar que empresas como OpenAI utilizaran el contenido del sitio para entrenar sus modelos de IA sin licenciarlo previamente.

Según Reuters, el dinero proveniente de Google ayudará a Reddit a generar nuevos ingresos sin depender exclusivamente de los anuncios en línea. Algo crucial para demostrar que es financieramente sostenible de cara a su inminente salida a la bolsa.

Por lo pronto, Reddit ha comentado que el acuerdo con Google no modifica los términos de acceso a su API de datos. Esto significa que el contenido de la misma no se puede usar para fines comerciales sin autorización previa.