Google usará los datos públicos de Internet para entrenar sus IA

IA como ChatGPT han revolucionado el mundo entero, pues en apenas unos meses la usan decenas de millones de personas y es conocida en todo el mundo. A pesar de su éxito, ChatGPT y otras IA semejantes no se han creado en un día, pues se basan en LLM que necesitan entrenarse con enormes cantidades de datos. Ahora Google ha aprovechado para actualizar su política de privacidad, por lo que a partir de ahora empleará .

Google lleva un tiempo en el que está intentando ser rival de ChatGPT. Para ello, lanzó Google Bard, una IA que acabó siendo bastante inferior a la alternativa de OpenAI. Bard también se encargaba de responder nuestras preguntas al igual que ChatGPT, con la diferencia de que sus respuestas no eran tan precisas. De hecho, durante su desarrollo, los propios empleados de Google Bard ya decían que su IA mentía en las respuestas. Estaba claro que Google no se iba a conformar con unos resultados mediocres y por ello, empezó a hacer cambios.

Google cambia su política y usará los datos públicos para entrenar sus IA

Poco tiempo después, Google fusionó sus divisiones DeepMind y Brain para formar Google DeepMind. Otra de sus novedades es que anunció PaLM 2, una nueva familia de modelos lingüísticos (LLM) que tiene como objetivo competir contra GPT-4 de OpenAI. Ahora volvemos con este gigante tecnológico, pues ahora ha decidido dar un paso más para no quedarse atrás en el sector de la IA.

Google acaba de actualizar su política de privacidad, donde vemos una serie de cambios a la hora de acceder a la información. Aquí vemos como Google se encargará de usar los datos públicos online para poder entrenar sus propios modelos de IA como Google Translate, Bard y los servicios de la nube.

Google podrá utilizar cualquier información disponible en Internet

Google está apostando todo por la IA, pues esta es una oportunidad de negocio que no puede perderla. Al igual que ha dominado en otros sectores, este gigante tecnológico busca también tener un hueco en la inteligencia artificial. El problema es que vencer a OpenAI parece ser una tarea imposible, cuando su ChatGPT no tiene competencia de ningún tipo por el momento.

La decisión de Google de utilizar los datos públicos para entrar sus modelos de IA es bastante desesperada, si tenemos en cuenta la repercusión que tiene sobre los usuarios. Y es que, a grandes rasgos lo que publiquemos en Internet se puede utilizar para entrenar a Google Bard y cualquier otra IA generativa de la compañía que aparezca en un futuro. Esto implica también la información de empresas y cualquier dato útil que sirva para el entrenamiento.

Teniendo en cuenta que el Google y su motor de búsqueda dominan totalmente Internet con más del 90% de los usuarios del mundo usándolo, este cambio va a crear mucha controversia. Ahora las páginas web y la información que almacenen en ellas serán la biblioteca a la que acudirá Google Bard para aprender. Google está teniendo un enfoque muy agresivo con lo que imponerse como líder en IA, algo que también vimos con Google SGE y Plagiarism Engine.

La entrada Google usará los datos públicos de Internet para entrenar sus IA aparece primero en El Chapuzas Informático.