شکایت Reddit از Perplexity به اتهام سرقت داده برای آموزش مدل های هوش مصنوعی

رایزمگ

1404/08/01

شرکت Reddit به طور رسمی از Perplexity AI به دلیل «سرقت سازمان یافته داده ها و محتوای دارای حق نشر» شکایت کرده است. بر اساس جزئیات منتشرشده، ردیت مدعی است که این شرکت به همراه سه سرویس دهنده ی استخراج داده یعنی SerpApi، Oxylabs و AWMProxy به صورت غیرقانونی از لایه های امنیتی ردیت عبور کرده و محتوای کاربران را برای آموزش مدل های هوش مصنوعی خود جمع آوری کرده اند.

در متن شکایت آمده است که رفتار این شرکت ها شبیه به «سارقان بانک» است که چون نمی توانند به خزانه نفوذ کنند، به خودروهای حمل پول حمله می کنند. ردیت تأکید کرده که پرپلکسیتی برای دستیابی به داده هایش «از هر روشی جز مذاکره قانونی استفاده کرده است»، در حالی که سایر شرکت ها مانند گوگل و OpenAI برای دسترسی به داده ها، قرارداد رسمی امضا کرده اند.

ردیت در مه 2024 نامه ای رسمی برای توقف فعالیت های استخراج داده به پرپلکسیتی ارسال کرده و هشدار داده بود که دسترسی غیرمجاز به محتوای پلتفرم باید فوراً متوقف شود. اما به گفته ی Reddit، نه تنها پرپلکسیتی به این هشدار توجهی نکرد، بلکه پس از ارسال نامه، میزان داده های جمع آوری شده و ارجاعات مرتبط با Reddit در سرویس پرپلکسیتی افزایش یافته است.

یکی از شواهد کلیدی ردیت، مربوط به پستی است که تنها از طریق موتور جستجوی گوگل قابل مشاهده بوده، اما پرپلکسیتی ظرف چند ساعت همان محتوا را در پاسخ های خود منتشر کرده است. به گفته ی Reddit، این مسئله نشان می دهد که پرپلکسیتی داده ها را از نتایج جستجوی گوگل استخراج و سپس مستقیماً در مدل خود استفاده کرده است.

ردیت پیش تر قراردادهایی را با OpenAI و گوگل امضا کرده تا به صورت رسمی و کنترل شده از داده هایش برای آموزش مدل های هوش مصنوعی استفاده شود. بااین حال، اکنون در تلاش است تا از شرکت هایی که بدون مجوز قانونی داده ها را استخراج می کنند، شکایت کند. پیش از این، Reddit از شرکت Anthropic (سازنده مدل Claude) نیز به دلیل رفتار مشابه شکایت کرده بود.

«بن لی» (Ben Lee)، مدیر حقوقی Reddit، در بیانیه ای اعلام کرد:

«شرکت های فعال در حوزه ی هوش مصنوعی در رقابت شدیدی برای دسترسی به محتوای انسانی باکیفیت هستند. این رقابت، یک اقتصاد خرابکارانه برای استخراج داده ایجاد کرده است. اسکرپرها با دور زدن محافظت ها، داده ها را سرقت کرده و به مدل هایی می فروشند که برای یادگیری به این محتوا وابسته اند. Reddit هدف اصلی است، چون یکی از بزرگ ترین مخازن مکالمات انسانی در تاریخ محسوب می شود.»

در مقابل، «جسی دوایر» (Jesse Dwyer)، سخنگوی Perplexity، در واکنش به این شکایت گفت:

«ما هنوز شکایت رسمی را دریافت نکرده ایم، اما با تمام توان از حق کاربران برای دسترسی آزاد و منصفانه به دانش عمومی دفاع می کنیم. رویکرد ما در استفاده از داده ها شفاف، اخلاقی و در راستای منافع عمومی است.»

این پرونده می تواند به یکی از پر سر و صداترین دعواهای حقوقی میان پلتفرم های اجتماعی و شرکت های سازنده هوش مصنوعی تبدیل شود. نتیجه ی آن احتمالاً مسیر تعامل داده های کاربران با فناوری های هوش مصنوعی را در آینده تعیین خواهد کرد و بر سیاست های جهانی در زمینه ی مالکیت داده تأثیر خواهد گذاشت.

0 نظر ثبت شده

ثبت یک نظر

آدرس ایمیل شما منتشر نخواهد شد. فیلدهای الزامی مشخص شده اند *

نام

پست الکترونیکی

پیام شما

0 نظر ثبت شده

تمام حقوق محفوظ است

شکایت Reddit از Perplexity به اتهام سرقت داده برای آموزش مدل های هوش مصنوعی

رایزمگ

«بن لی» (Ben Lee)، مدیر حقوقی Reddit، در بیانیه ای اعلام کرد:

0 نظر ثبت شده

ثبت یک نظر

0 نظر ثبت شده

جستجو

بهترین های هفته

بازسازی خانه ها با استفاده از مصالح ضد آتش: تجربه ای از کلرادو

بازسازی و توسعه پارک های طبیعی: تجربه ای نوین از چشم اندازهای طبیعی

بازسازی خانه قدیمی: ترکیب سنت و مدرنیته با حفظ اصالت

ما را دنبال کنید