Dans une démarche visant à protéger ses données, Reddit a engagé des poursuites judiciaires contre Perplexity pour avoir prétendument exploité illégalement le contenu de sa plateforme. Cette affaire soulève des questions importantes sur la manière dont les entreprises d’intelligence artificielle accèdent et utilisent les données en ligne pour développer leurs modèles. Découvrez les détails de cette confrontation légale qui pourrait avoir des répercussions sur l’industrie technologique.
L’essentiel à retenir
Reddit a déposé une plainte auprès d’un tribunal fédéral à New York, accusant Perplexity d’avoir illégalement copié des données de la plateforme. Selon Reddit, Perplexity, ainsi que trois autres entreprises, ont accédé à des milliards de publications en contournant les mesures de sécurité mises en place. Ces données auraient ensuite servi à entraîner le moteur de recherche IA de Perplexity.
Face à ces accusations, Perplexity a défendu publiquement son approche, la qualifiant de «principielle et responsable», et a affirmé son intention de se défendre vigoureusement devant le tribunal. D’autres entreprises impliquées, telles que SerpApi et Oxylabs, ont également exprimé leur désaccord avec les allégations de Reddit. SerpApi a déclaré être en «profond désaccord» avec les accusations, tandis qu’Oxylabs s’est dit «choqué et déçu» de l’absence de communication de Reddit avant le dépôt de la plainte.
Reddit a déjà accordé des licences à des géants de la technologie comme Google et OpenAI, leur permettant d’utiliser ses données de manière légale. Reddit et Google ont par exemple signé un accord de 60 millions de dollars par an, autorisant Google à afficher les publications Reddit dans ses résultats de recherche et à utiliser ces données pour entraîner les modèles d’IA Gemini. Toutefois, selon Reddit, Perplexity n’a jamais reçu une telle autorisation, d’où la procédure judiciaire engagée.
Cette affaire met en lumière les tensions croissantes entre les plateformes de contenu et les entreprises d’IA concernant l’accès et l’utilisation des données en ligne. À mesure que l’intelligence artificielle devient un outil incontournable, la question de l’accès aux données de haute qualité pour l’entraînement des modèles se pose avec acuité. Les résultats de cette affaire pourraient définir de nouvelles normes en matière de droits d’utilisation des données et de responsabilité des entreprises technologiques.
Créée en 2005, Reddit s’est imposée comme une plateforme incontournable pour les discussions en ligne, regroupant des millions d’utilisateurs autour de sujets variés. Au fil des ans, le site est devenu une mine d’or pour les données de contenu généré par les utilisateurs, attirant l’intérêt des entreprises d’intelligence artificielle. Reddit a récemment mis en place des restrictions plus strictes sur l’utilisation de ses données, cherchant à protéger ses intérêts tout en monétisant l’accès à ses précieuses informations de contenu.