El sesgo de la IA seguirá siendo un desafío para los proveedores de plataformas de IA generativa. Depende de estas plataformas incorporar mecanismos de verdad desde el principio.
por Frank Palermo
La esencia
- Cambio de rumbo en las búsquedas. Los motores de búsqueda que originalmente se propusieron organizar la información mundial y hacerla accesible y útil para todos pueden estar desplazándose hacia el negocio de la interpretación de la información.
- Sobrecompensación de sesgos. La reciente falla muy publicitada de la plataforma Gemini de Google ilustra cómo estas plataformas de IA generativa están comenzando a sobrecompensar los sesgos heredados en los datos y algoritmos.
- Desafío de la IA. El sesgo de la IA seguirá siendo un desafío para los proveedores de plataformas de IA generativa y puede requerir repensar el modelo para proporcionar citas y parametrización que permitan a los usuarios tener más transparencia.
- Embajadores de la verdad. Existe una gran oportunidad para que los desarrolladores de IA generativa se conviertan en embajadores de la verdad al garantizar fuentes de datos de alta calidad y aumentar la transparencia al proporcionar citas de la información de origen.
Se está produciendo un cambio preocupante en las plataformas de información que utilizamos a diario. Los motores de búsqueda que originalmente se propusieron organizar la información del mundo y hacerla accesible y útil para todos pueden estar desplazándose hacia el negocio de la interpretación de la información. Esta tendencia es particularmente evidente en las plataformas de inteligencia artificial generativa, que influyen cada vez más en la forma en que se presenta y se entiende la información.
¿Qué ha pasado con la búsqueda?
Esto se está haciendo más evidente en la era de la IA, donde las plataformas de IA generativa parecen estar creando una capa de interpretación entre nuestras indicaciones y las fuentes de datos para filtrar las respuestas. Supuestamente, la motivación es “proteger” a los usuarios de sesgos, contenido controvertido e inexactitudes.
Sin embargo, es posible que estas correcciones estén introduciendo algunos sesgos e imprecisiones nuevos que pueden reflejar sesgos organizacionales. Recientemente, ha habido ejemplos muy publicitados de respuestas de plataformas de IA generativa que están “corrigiendo en exceso” sus respuestas para compensar los sesgos previstos en los datos de entrenamiento.
Es muy peligroso cruzar esta línea.
El servicio de búsqueda original ofrecía la posibilidad de indexar cantidades masivas de contenido en línea y de proporcionar una interfaz intuitiva y sencilla para la recuperación de información. Básicamente, proporcionaba acceso directo a la información de otros en función de su relevancia, sin ninguna interpretación.
Lo que ha surgido es un servicio de interpretación de la información. Se trata de un producto y un paradigma muy diferentes de la misión original. Estas plataformas de IA generativa actúan ahora como una capa de agregación, síntesis, filtrado e interpretación. Si bien esto puede ser útil en algunos niveles, tiene implicaciones obvias.
La pregunta fundamental es ¿cómo obtenemos la verdad?
Desafíos continuos para el equipo de inteligencia artificial de Google
Cuando OpenAI lanzó ChatGPT en noviembre de 2022, Google fue muy criticado por quedar al margen de la carrera de la IA. La expectativa era que Google tuviera acceso a gran parte de la información y los datos de búsqueda del mundo, lo que le permitiría ser un líder destacado en la carrera de la IA.
La justificación fue que Google tenía una tecnología superior pero era demasiado cauteloso con respecto a su negocio, su reputación y sus relaciones con los clientes. Google analiza activamente cómo estas posibles reacciones negativas podrían dañar su reputación.
Pero luego Google pareció volver a encaminarse hacia la IA, primero con el lanzamiento de Bard y luego, más recientemente, con el cambio de nombre de toda su suite de IA a Gemini. Sin embargo, justo cuando las cosas parecían estar avanzando, ocurrió el desastre.
Gemini comenzó a dar respuestas controvertidas a preguntas básicas. Por ejemplo, generó imágenes de los padres fundadores de Estados Unidos y del Papa en géneros y etnias que son históricamente inconsistentes. Otras preocupaciones, como llamar “fascista” al primer ministro de la India, Modi, y comparar a Elon Musk con Hitler, dieron inicio a una serie de acusaciones que calificaban a Gemini de “ ultraconsciente ”.
El director ejecutivo de Google, Sundar Pichai, respondió en un correo electrónico interno calificando las respuestas de Gemini de “completamente inaceptables” y prometió que Gemini se implementaría después de un conjunto claro de acciones. La empresa tuvo que cerrar la plataforma para abordar las preocupaciones. Se espera que los cambios probablemente incluyan cambios estructurales, pautas actualizadas de productos, procedimientos de lanzamiento mejorados, mejores pruebas y equipos de trabajo.
La controversia sobre Gemini afectó rápidamente los resultados de Alphabet, que perdió más de 90 mil millones de dólares en valor de mercado mientras las acciones caían un 4%.
Plataformas de IA generativa: el filtrado de información nunca fue un objetivo
El concepto de organizar información compleja y proporcionar acceso a través de un sistema de recuperación centralizado no es nuevo.
En 1945, Vannevar Bush , un ingeniero estadounidense, describió un sistema de recuperación de información que permitiría a un usuario acceder a una gran cantidad de información, todo desde un solo escritorio. El sistema se llamó memex y se describió inicialmente en un artículo de Atlantic Monthly titulado ” As We May Think “. El memex tenía como objetivo brindar a los usuarios la capacidad de superar la creciente dificultad de localizar información en índices cada vez más centralizados de trabajo científico.
En realidad, el primer motor de búsqueda web no fue creado por Google. Se llamaba Archie y lo creó Alan Emtage, un estudiante de la Universidad McGill de Montreal, en 1990. El buscador web se centraba inicialmente en la indexación de sitios FTP, pero fue la primera herramienta para indexar contenido.
Además, los primeros servicios de localización de Internet, como WHOIS, también se utilizaron como plataformas de búsqueda y recuperación de usuarios, servidores e incluso información. Algunas de estas plataformas incluso existían antes del debut de la Web en diciembre de 1990, y WHOIS se remonta a 1982.
Es sorprendente observar que antes de septiembre de 1993, la World Wide Web se indexaba completamente a mano. Tim Berners-Lee actualizaba manualmente la lista de servidores.
Google apareció en escena en 1996 para revolucionar el funcionamiento de los algoritmos de búsqueda. A finales de los años 90 y principios de los 2000, se produjo una proliferación de motores de búsqueda como Yahoo!, AltaVista, Excite, Lycos, Microsoft MSN y otros. Muchas de estas plataformas de búsqueda han sido adquiridas y desaparecieron, pero Google todavía mantiene más del 80% de la cuota de mercado de búsquedas.
El sesgo de búsqueda se ha ido introduciendo con el tiempo, motivado por influencias comerciales, políticas y sociales. Por ejemplo, la posibilidad de comprar determinadas palabras clave para mejorar la relevancia de la búsqueda genera un sesgo en los resultados de búsqueda nativos. O la decisión de un motor de búsqueda de no indexar determinados sitios con motivaciones políticas también restringe el acceso a la información.
El punto importante a destacar es que ninguna de estas plataformas fue diseñada inicialmente con la intención de filtrar o interpretar información. El acceso a la información “en bruto” y la capacidad de búsqueda eran primordiales. El objetivo era presentar la información más relevante al usuario en función de los algoritmos de clasificación de búsqueda. Luego, el usuario podía navegar por la lista de búsqueda y seleccionar los enlaces que parecían más relevantes para su intención de búsqueda.
Fuente: https://www.cmswire.com/digital-experience/ai-bias-overcoming-challenges-in-generative-ai-platforms/