کدخبر :283930 پرینت
23 مرداد 1402 - 12:19

جمع‌آوری اطلاعات از اینترنت برای چت‌جی‌پی‌تی توسط بات جدید اوپن‌ای‌آی

اوپن‌ای‌آی بات جدیدی ساخته است که در اینترنت می‌چرخد و به منظور آموزش دادن به سیستم‌های هوش مصنوعی، اطلاعات جمع‌آوری می‌کند و اپراتور وب‌سایت‌ها در صورتی که بخواهند مانع از این شوند که این بات از سایت آن‌ها داده‌ دریافت کند، مجبور خواهند شد که بات را بلاک کنند.

متن خبر

به گزارش سیتنا به نقل از ایندیپندنت، اپراتور وب‌سایت‌ها در صورتی که بخواهند مانع از این شوند که بات جدید اوپن‌ای‌آی از سایت آن‌ها داده‌ دریافت کند، مجبور خواهند شد این موضوع را قبول نکنند و بات را بلاک کنند.

سیستم‌های هوش مصنوعی مانند چت‌جی‌پی‌تی اوپن‌ای‌آی به منظور آموزش دادن به مدل‌هایشان و یادگیری نحوه ارائه خروجی‌های درست، به حجم زیادی از داده‌ها متکی‌اند. تا کنون بسیاری از این داده‌‌ها به رایگان از اینترنت برداشته شده‌اند.

این مسئله شکایت‌های متعدد نویسندگان و سایر کاربران اینترنت را به دنبال داشته است. بسیاری از اوپن‌ای‌آی و سایرین به دلیل استفاده از اطلاعات شخصی و محتوای دارای حق نشر برای آموزش مدل‌هایشان که از این متن‌‌ها به طور بالقوه به عنوان اطلاعات استفاده می‌کنند یا حتی این متن‌ها در پاسخ‌های سیستم تکرار می‌شوند، انتقاد کرده‌اند.

شرکت‌های هوش مصنوعی با انتقاد افراد دیگری نیز مواجه شده‌اند که ادعا می‌کنند چنین وب‌گرد‌هایی یا اصطلاحا خزندگان وب زیرساخت وب‌ آن‌ها را مجبور می‌کنند از نهایت ظرفیتش استفاده کند. به عنوان نمونه، ایلان ماسک گفته که بار این بات‌‌ها توییتر را مجبور کرده است تعداد پست‌هایی را که کاربران می‌توانند در سایت مشاهده کنند، محدود کند.

چت‌جی‌پی‌تی ۳.۵ و ۴ موجود اوپن‌ای‌آی بر اساس داده‌های برداشته‌شده از اینترنت تا اواخر سال ۲۰۲۱ آموزش داده شده‌اند. برای مالکان آن داده‌ها یا برای وب‌سایت‌هایی که این داده‌ها از آن‌ها جمع‌آوری شده‌اند، هیچ راهی وجود ندارد که این اطلاعات را از مدل‌های اوپن‌ای‌آی حذف کنند.

اینک اوپن‌ای‌آی می‌گوید سیستم جدید که «جی‌پی‌تی‌بات» نام دارد، در میان داده‌ها و متن‌ها در وب می‌چرخد تا برای آموزش دادن به مدل‌های آتی، اطلاعات بیشتری جمع‌آوری کند.

به مدیران وب‌سایت‌ها گفته شده که اگر نمی‌خواهند این اطلاعات جمع‌آوری شود، باید برای بات دستورالعمل‌هایی قرار دهند تا از چرخیدن آن در وب‌سایتشان جلوگیری کنند. مدیران می‌توانند چنین اطلاعاتی را در فایلی به نام robots.txt قرار دهند که به سایر خزندگان وب‌ مانند خزندگان وبی که گوگل برای نتایج جست‌وجویش از آن‌ها استفاده می‌کند دستورالعمل‌هایی می‌دهد.

اوپن‌ای‌آی می‌گوید از این بات «احتمالا ممکن است به منظور بهبود مدل‌های آینده استفاده شود». همچنین می‌گوید که این بات برای «حذف منابعی» ساخته شده است که به پی‌وال (Paywall) محتواهایی روی اینترنت که برای مشاهده آن باید پول پرداخت کرد نیاز دارند، اطلاعات شخصی قابل‌شناسایی را گرآوری می‌کنند یا متنی دارند که قوانین اوپن‌ای‌آی را نقض می‌کنند.

اوپن‌ای‌آی می‌گوید که اجازه دادن به بات‌ها برای دسترسی به سایت‌ها «می‌تواند به مدل‌های هوش مصنوعی کمک کند دقیق‌تر شوند و قابلیت‌های عمومی و ایمنی‌ را بهبود ببخشند».

انتهای پیام

نظرات خود را با ما درمیان بگذارید

افزودن دیدگاه جدید

کپچا
CAPTCHA ی تصویری
کاراکترهای نمایش داده شده در تصویر را وارد کنید.