¿Cómo funcionan los sistemas de recomendación en plataformas digitales? | Grupo Co., Ltd del nuevo comienzo de Hainan

Pocas cosas son tan vitales para la democracia como el libre flujo de información. Si una ciudadanía ilustrada es esencial para la democracia, como sugirió Thomas Jefferson, entonces los ciudadanos necesitan una forma de mantenerse informados. Durante la mayor parte de la era moderna, ese papel lo ha desempeñado la prensa, y especialmente los editores y productores que ejercen el control sobre qué noticias publicar y transmitir.

Sin embargo, a medida que ha cambiado el flujo de información, la distribución y el consumo de noticias se ha alejado cada vez más de los medios tradicionales y hacia las redes sociales y las plataformas digitales, con más de una cuarta parte de los estadounidenses ahora recibiendo noticias solo de YouTube y más de la mitad de las redes sociales. Mientras que los editores alguna vez decidieron qué historias deberían recibir el alcance más amplio, hoy en día los sistemas de recomendación determinan qué contenido encuentran los usuarios en las plataformas en línea y qué información disfruta de la distribución masiva. Como resultado, los sistemas de recomendación subyacentes a estas plataformas, y los algoritmos de recomendación y los modelos entrenados que abarcan, han adquirido una nueva importancia. Si la información precisa y confiable es el alma de la democracia, los sistemas de recomendación sirven cada vez más como su corazón.

A medida que los sistemas de recomendación han crecido hasta ocupar un papel central en la sociedad, un creciente cuerpo de estudios ha documentado vínculos potenciales entre estos sistemas y una variedad de daños, desde la difusión de discursos de odio hasta la propaganda extranjera y el extremismo político. No obstante, los modelos en sí siguen siendo poco conocidos, tanto entre el público como entre las comunidades políticas encargadas de regularlos y supervisarlos. Dada su gran importancia y la necesidad de una supervisión informada, este artículo tiene como objetivo desmitificar los sistemas de recomendación al analizar cómo han evolucionado y cómo funcionan los algoritmos y modelos de recomendación modernos. El objetivo es ofrecer a los investigadores y legisladores una línea de base a partir de la cual, en última instancia, puedan tomar decisiones informadas sobre cómo supervisarlos y gobernarlos.

Supongamos que ejecuta una red social o una plataforma digital. Cada vez que sus usuarios abren su aplicación, desea mostrarles contenido atractivo en un segundo. ¿Cómo harías para sacar a la superficie ese contenido?

El enfoque más rápido y eficiente es simplemente ordenar el contenido por tiempo. Dado que la mayoría de las redes sociales y las plataformas digitales tienen un gran catálogo de contenido, es más probable que el contenido más reciente o "más reciente" sea convincente que el contenido seleccionado al azar. Simplemente mostrar los elementos más recientes en orden cronológico inverso es, por lo tanto, un buen lugar para comenzar. Como beneficio adicional, este enfoque es fácil de implementar y fácil de entender: sus usuarios siempre tendrán una idea clara de por qué están viendo un contenido determinado y un modelo mental preciso de cómo se comporta la aplicación. Si bien la industria ha ido más allá de ellos, los algoritmos de recomendación cronológica inversa impulsaron la primera generación de feeds de redes sociales y son la razón por la cual la mayoría de los feeds todavía se conocen hoy como "líneas de tiempo".

Si bien son atractivos por su simplicidad, las transmisiones cronológicas puramente inversas tienen una gran desventaja: no escalan bien. A medida que las plataformas se expanden, la cantidad de contenido que alojan crece exponencialmente, pero no así el tiempo libre de un usuario. Por lo tanto, el contenido agregado más recientemente servirá como un proxy cada vez menos efectivo para el contenido más atractivo. Peor aún, los usuarios que desean generar una audiencia amplia inundarán la plataforma con contenido nuevo en un intento por mantenerse en la parte superior de los feeds de otros usuarios. Como resultado, su aplicación se inclinará rápidamente hacia los usuarios más activos en lugar de los más interesantes. El contenido menos atractivo, o incluso el spam, comenzará a inundar las líneas de tiempo de los usuarios.

Para abordar ese problema, puede crear reglas codificadas para priorizar entre el contenido más reciente. Por ejemplo, podría escribir una regla que diga: Si a Nicole le han gustado las publicaciones de Dia más que a cualquier otro usuario, entonces muestre la última publicación de hoy de Nicole Dia antes que cualquier otra cosa. O podría escribir una regla que diga: Si a Nicole le gustó más el video que cualquier otra forma de contenido, entonces el video agregado más recientemente de sus amigos debe mostrarse a Nicol primero, antes que cualquier otro contenido. Al mezclar y hacer coincidir estas reglas manuales, los algoritmos de recomendación basados en atributos y categorías pueden mostrar contenido convincente de manera más confiable que una fuente cronológica puramente inversa.

Sin embargo, confiar en reglas codificadas a mano también tiene sus inconvenientes. Obliga a los desarrolladores a hacer muchas suposiciones sobre lo que más les interesará a los usuarios, muchas de las cuales pueden no ser ciertas. ¿A los usuarios siempre les gusta más el video que el texto? Y cuando a un usuario le gusta una publicación determinada, ¿siempre quiere ver más de su autor? Siempre que un algoritmo de recomendación esté codificado puramente a mano, los algoritmos estarán sesgados hacia las suposiciones de los desarrolladores sobre lo que los usuarios están más interesados en ver. Este enfoque tampoco escala bien: Cuantas más reglas se agregan manualmente, cada nueva regla incremental será menos efectivo y hará que el código base sea más difícil de mantener.

Con un tamaño determinado, el mejor enfoque para mostrar contenido atractivo de manera eficiente es confiar en el aprendizaje automático. Al basarse en datos de usuarios anteriores, los algoritmos de recomendación de aprendizaje profundo, y los modelos de recomendación de aprendizaje profundo entrenados en ellos, han demostrado ser particularmente efectivos para "aprender" qué contenido encontrarán atractivo los usuarios y sacarlo a la luz. Cada plataforma importante ahora se basa en alguna versión de aprendizaje profundo para elegir qué contenido mostrar, pero estos enfoques tienen un costo: mientras que los algoritmos cronológicos inversos son fáciles de implementar y comprender, los algoritmos de aprendizaje profundo a gran escala son complejos de implementar y efectivos. imposible de comprender e interpretar.

El algoritmo de recomendación que funcione mejor para su plataforma dependerá de las compensaciones entre el rendimiento, el costo y la interpretabilidad, o qué tan fácil sea identificar por qué el algoritmo se comporta de cierta manera. Para las grandes redes sociales y plataformas digitales, las ganancias de rendimiento de los algoritmos de recomendación de aprendizaje profundo superan con creces tanto el costo de desarrollarlos como la disminución correspondiente en la interpretabilidad.

Si bien esa compensación puede hacer que los usuarios continúen interactuando con el contenido de la plataforma, tiene importantes externalidades para las sociedades democráticas. Solo en los Estados Unidos, los investigadores han documentado cómo los sistemas de recomendación expusieron claramente a los usuarios a movimientos de extrema derecha, así como a teorías de conspiración sobre el COVID-19 y el resultado de las elecciones de 2020. A pesar del papel que jugaron los sistemas de recomendación en la difusión de contenido relacionado con esos movimientos y narrativas, que han sido fundamentales para fomentar la violencia política reciente, siguen siendo poco entendidos tanto por los legisladores como por el público. Comprender cómo funciona la tecnología es, por lo tanto, un primer paso vital hacia una "ciudadanía ilustrada" capaz de gobernarla.

Aunque los detalles varían ligeramente según la plataforma, los sistemas de recomendación a gran escala generalmente siguen los mismos pasos básicos. Como muestra la Figura 1, los sistemas de recomendación generalmente primero producen un inventario de contenido disponible y luego lo filtran de acuerdo con sus políticas de moderación de contenido, después de lo cual reducen el inventario a solo los elementos en los que es más probable que los usuarios estén interesados.

En los últimos años, muchas de las conversaciones sobre políticas en torno a la mitigación de los daños vinculados a las plataformas digitales se han centrado en el paso de la integridad, especialmente las políticas de moderación de contenido que determinan si un contenido puede publicarse o compartirse, pero se debe prestar mucha más atención. al paso de clasificación. Si, de hecho, los sistemas de recomendación están teniendo un impacto significativo en todo, desde la integridad electoral hasta la salud pública, entonces el proceso mediante el cual los sistemas de recomendación ordenan y clasifican el contenido también es muy importante. Al comprender mejor el complejo sistema detrás de la clasificación de contenido, los formuladores de políticas estarán en una mejor posición para supervisar su uso.

Aunque las plataformas de redes sociales diseñan sus algoritmos de clasificación de manera ligeramente diferente a otras plataformas digitales, en general, casi todas las plataformas grandes ahora usan una variante de lo que se conoce como arquitectura de "dos torres" para clasificar elementos.

Para ver lo que eso significa en la práctica, imagine que tiene dos hojas de cálculo diferentes. La primera es una hoja de cálculo en la que cada fila es un usuario y cada columna es un atributo del usuario (por ejemplo, edad, ubicación, historial de búsqueda). En la segunda hoja de cálculo, cada fila es una pieza de contenido y cada columna es un atributo de contenido (p. ej., tipo de contenido, título, número de Me gusta). Al modelar la información en cada hoja de cálculo en partes separadas de una red neuronal profunda, un algoritmo cuya estructura es (muy) vagamente análoga a la forma en que las neuronas se conectan en el cerebro, un enfoque de "dos torres" aprende con el tiempo la probabilidad de que un un usuario dado se involucrará con una pieza particular de contenido.

Aunque este enfoque ha demostrado ser notablemente exitoso, las plataformas con una gran base de usuarios y un amplio catálogo de contenido terminan necesitando entrenar modelos que son extremadamente grandes. Una plataforma con mil millones de usuarios y un billón de piezas de contenido, por ejemplo, necesitaría aprender un modelo capaz de generalizar eficientemente a 10^21 pares potenciales de usuario-elemento, un desafío que se vuelve aún más desalentador por el hecho de que la mayoría de los usuarios nunca interactuar con la gran mayoría del contenido. Como resultado, deben incluir una cantidad extraordinariamente grande de parámetros de modelo, o "neuronas" en una red neuronal, para funcionar bien en tantos pares de elementos de usuario diferentes. Los algoritmos de recomendación son mucho más grandes que otras formas de aprendizaje profundo por este motivo. Mientras que GPT-3, un poderoso modelo de lenguaje grande lanzado en 2020 por OpenAI, tenía 175 000 millones de parámetros o "neuronas" en su red neuronal profunda, el modelo de recomendación que impulsa el suministro de noticias de Facebook tiene 12 billones de parámetros. Con tantos parámetros, es imposible comprender y razonar acerca de cómo se comporta el modelo simplemente examinando el propio modelo entrenado.

La arquitectura de los sistemas de recomendación modernos tiene implicaciones importantes para los formuladores de políticas y el público en general, pero es posible que no sean evidentes para las audiencias no técnicas. Las siguientes implicaciones son especialmente importantes:

Dado que la arquitectura de los grandes sistemas de recomendación hace que sea difícil comprender cómo se comportan, es vital encontrar mejores formas de evaluar su comportamiento. Los reguladores, los investigadores y la industria de la tecnología pueden tomar medidas para evaluar mejor los modelos. Desde colaboraciones de plataformas e investigadores hasta entornos simulados y otras técnicas de preservación de la privacidad, es posible obtener una mayor claridad sobre el comportamiento y el impacto de los sistemas de recomendación de lo que disfrutamos actualmente.

Aprovechar esas oportunidades será cada vez más vital a medida que los sistemas de recomendación sigan creciendo en importancia. TikTok, una aplicación de video viral, eclipsó recientemente a Google en el tráfico de Internet en gran parte gracias a su sistema de recomendación mejorado, que muestra contenido de toda la base de usuarios de la aplicación en lugar de solo las conexiones de un usuario. En respuesta, las plataformas de redes sociales como Facebook y Twitter han comenzado a expandir de manera similar el "inventario" que inicialmente apareció en sus sistemas de recomendación para incluir más contenido de toda la plataforma. Mark Zuckerberg, por ejemplo, dijo recientemente que espera que para 2023 más del 30 % de los elementos en el feed de un usuario en Instagram y Facebook provengan de cuentas a las que un usuario no es amigo ni sigue. A medida que otras plataformas se apresuran a seguir el ritmo, también aumentarán su confianza en el contenido puramente recomendado.

A su vez, el impacto potencial de los sistemas de recomendación en las sociedades democráticas solo crecerá, al igual que la importancia de comprender cómo funcionan.

Chris Meserolees miembro de Política Exterior en la Institución Brookings y director de investigación de la Iniciativa de Tecnología Emergente e Inteligencia Artificial de Brookings.

Facebook y Google brindan apoyo financiero a Brookings Institution, una organización sin fines de lucro dedicada a la investigación rigurosa, independiente y profunda de políticas públicas.

Procesos de Integridad de Inventario Generación de Candidatos. Clasificación Reclasificación La métrica de resultados es importante. Mucho Son demasiado grandes para explicarlos e interpretarlos Frecuentes reentrenamientos y actualizaciones del modelo hacen que la evaluación sea un desafío Los impactos algorítmicos no se pueden evaluar a través de la auditoría del código subyacente y el modelo entrenado solo Chris Meserole