El gran robo de IA de Perplexity
¿Más bien Perfidy?
En cada ciclo de hype, surgen ciertos patrones de engaño. En el último boom de las criptomonedas, fue «ponzinomics» y «tirones de alfombra». En los autos autónomos, era «¡solo faltan cinco años!» En la IA, se trata de ver cuánta basura poco ética puedes salirse con la suya.
Perplexity es básicamente un intermediario que busca rentas en fuentes de alta calidad
Perplexity, que está en conversaciones en curso para recaudar cientos de millones de dólares, está tratando de crear un competidor de Google Search. Sin embargo, Perplexity no está tratando de crear un «motor de búsqueda»; quiere crear un «motor de respuestas». La idea es que, en lugar de buscar entre un montón de resultados para responder tu propia pregunta con una fuente primaria, simplemente obtendrás una respuesta que Perplexity ha encontrado para ti. «La veracidad y precisión es lo que nos importa», dijo el CEO de Perplexity, Aravind Srinivas.
Eso significa que Perplexity es básicamente un intermediario que busca rentas en fuentes de alta calidad. La propuesta de valor de la búsqueda, originalmente, era que al raspar el trabajo realizado por periodistas y otros, los resultados de Google enviaban tráfico a esas fuentes. Pero al proporcionar una respuesta, en lugar de dirigir a las personas a hacer clic en una fuente primaria, estos llamados «motores de respuestas» privan a la fuente primaria de ingresos publicitarios, manteniendo esos ingresos para sí mismos. Perplexity está entre un grupo de vampiros que incluye Arc Search y Google mismo.
Pero Perplexity ha ido un paso más allá con su producto Pages, que crea un «informe» resumen basado en esas fuentes primarias. No solo está citando una o dos oraciones para responder directamente a la pregunta de un usuario, sino que está creando un artículo agregado completo, y es preciso en el sentido de que está plagiando activamente las fuentes que utiliza.
Forbes descubrió que Perplexity estaba esquivando el muro de pago de la publicación para proporcionar un resumen de una investigación que la publicación realizó sobre la empresa de drones del ex CEO de Google, Eric Schmidt. Aunque Forbes tiene un muro de pago medido en algunos de sus trabajos, el trabajo premium, como esa investigación, está detrás de un muro de pago rígido. No solo Perplexity de alguna manera esquivó el muro de pago, sino que apenas citó la investigación original y usó el arte original para su informe. (Para los que llevan la cuenta en casa, el uso del arte es una infracción de derechos de autor).
«Alguien más lo hizo» es un buen argumento para un niño de cinco años
La agregación no es un fenómeno particularmente nuevo, pero la escala a la que Perplexity puede agregar, junto con la violación de derechos de autor al usar el arte original, es bastante, hmm, notable. En un intento de calmar a todos, el director comercial de la empresa fue a Semafor para decir que Perplexity estaba desarrollando planes de reparto de ingresos con las publicaciones, y ¡oh vaya!, ¿por qué todos estaban siendo tan malos con un producto aún en desarrollo?
En este punto, Wired intervino, confirmando un hallazgo de Robb Knight: el raspado del trabajo de Forbes por parte de Perplexity no fue una excepción. De hecho, Perplexity ha estado ignorando el código robots.txt que explícitamente pide a los rastreadores web que no raspen la página. Srinivas respondió en Fast Company que en realidad, Perplexity no estaba ignorando robots.txt; solo estaba usando raspadores de terceros que lo ignoraban. Srinivas se negó a nombrar al raspador de terceros y no se comprometió a pedirle a ese rastreador que dejara de violar robots.txt.
«Alguien más lo hizo» es un buen argumento para un niño de cinco años. Y considera la respuesta más a fondo. Si Srinivas quería ser ético, tenía algunas opciones aquí. La opción uno es terminar el contrato con el raspador de terceros. La opción dos es tratar de convencer al raspador para que respete robots.txt. Srinivas no se comprometió con ninguna de las dos, y me parece que hay una razón clara para ello. Incluso si Perplexity en sí no está violando el código, depende de que alguien más lo viole para que su «motor de respuestas» funcione.
Para añadir insulto a la herida, Perplexity plagió el artículo de Wired sobre él, a pesar de que Wired bloquea explícitamente a Perplexity en su archivo de texto. La mayor parte del artículo de Wired sobre el plagio trata sobre recursos legales, pero me interesa lo que está pasando aquí con robots.txt. Es un acuerdo de buena fe que ha aguantado durante décadas, y se está desmoronando gracias a empresas de IA sin escrúpulos, sí, Perplexity no es la única, que están absorbiendo casi cualquier cosa que esté disponible para entrenar sus modelos de basura. Y recuerda cómo Srinivas dijo que estaba comprometido con la «veracidad»? No estoy seguro de que eso sea cierto tampoco: Perplexity ahora está mostrando resultados generados por IA y desinformación real, según informa Forbes.
A mi oído, Srinivas estaba presumiendo de lo encantador e ingenioso que era su mentira
Hemos visto a muchos gigantes de la IA participar en prácticas de legalidad cuestionable y ética discutible para obtener los datos que quieren. Para demostrar el valor de Perplexity a los inversores, Srinivas construyó una herramienta para raspar Twitter fingiendo ser un investigador académico utilizando acceso API para investigación. «Llamaría a mis [falsos proyectos académicos] algo así como Brin Rank y todas esas cosas», dijo Srinivas a Lex Fridman en el podcast de este último. Supongo que «Brin Rank» es una referencia al cofundador de Google, Sergey Brin; a mi oído, Srinivas estaba presumiendo de lo encantador e ingenioso que era su mentira.
No soy yo quien te está diciendo que la base de Perplexity es mentir para esquivar principios establecidos que sostienen la web. Es su CEO. Eso es esclarecedor sobre la verdadera propuesta de valor de los «motores de respuestas». Perplexity no puede generar información real por sí misma y depende en cambio de terceros cuyas políticas abusa. El «motor de respuestas» fue desarrollado por personas que se sienten libres de mentir siempre que sea más conveniente, y esa preferencia es necesaria para el funcionamiento de Perplexity.
Así que esa es la verdadera innovación de Perplexity aquí: romper los cimientos de la confianza que construyó Internet. La pregunta es si alguno de sus usuarios o inversores se preocupa por ello.
Planes de Suscripción para Agencias Podemos publicar todas tus notas de prensa con estos planes.
- Breaking20.341
- Deportes2.989
- Economía16
- Entretenimiento9
- Mundo18
- Negocios14
- Política25
- Salud156
- Sucesos1.374
- Tecnología331