کدخبر :285589 پرینت
06 مهر 1402 - 07:39

چت جی‌پی‌تی حالا می‌تواند ببیند، بشنود و حرف بزند

بنا بر اعلام شرکت اوپن ای‌آی، چت‌ جی‌پی‌تی یک به‌روز‌رسانی جدید دارد که به این ابزار فراگیر هوش مصنوعی امکان می‌دهد ببیند، بشنود و صحبت کند.

متن خبر

به گزارش سیتنا به نقل از ایندیپندنت، شرکت اوپن ای‌آی در پستی وبلاگی اعلام کرد که به‌روزرسانی ربات چت هوش مصنوعی اوپن ای‌آی به کاربران اجازه خواهد داد تا مکالمه صوتی با این ربات چت هوش مصنوعی داشته باشند و همچنین با استفاده از تصویر، با آن تعامل داشته باشند.

این شرکت همچنین در پستی در اکس/توییتر نوشت: «چت جی‌پی‌تی حالا می‌تواند ببیند، بشنود، و صحبت کند.»

این قابلیت‌ها «در دو هفته آینده» در دسترس خواهد بود و به کاربران امکان می‌دهد «با استفاده از صدا، مکالمه‌ای دوطرفه» با دستیار هوش مصنوعی داشته باشند.

به گفته اوپن‌ ای‌آی، با این قابلیت‌های جدید، چت جی‌پی‌تی می‌تواند برای «درخواست قصه شب برای خانواده‌تان، یا حل‌و‌فصل بحث سر میز شام» کاربرد داشته باشد، که چت جی‌پی‌تی را به خدماتی که دستیار هوش مصنوعی الکسای آمازون یا سیری اپل ارائه می‌دهند نزدیک‌تر می‌کند.

اوپن ای‌آی برای نمایش نمونه‌ای از نحوه کارکرد این قابلیت، ویدیویی را به اشتراک گذاشت که در آن کاربری از چت جی‌پی‌تی می‌خواهد داستانی درباره «خارپشت معرکه آفتاب‌گردانی به نام لری» بگوید.

ربات چت با صدایی شبیه انسان به سوال پاسخ می‌دهد و همچنین به سوال‌هایی مانند «خانه‌اش چه شکلی است؟» و «دوست صمیمی‌اش چه کسی است؟» جواب می‌دهد.

چت جی‌پی‌تی الان می‌تواند ببیند، بشنود، و حرف بزند. در دو هفته آینده در دسترس خواهد بود. کاربران می‌توانند مکالمه‌های صوتی با چت جی‌پی‌تی داشته باشند (آی‌اواس و اندروید) و تصاویر را به گفت‌و‌گوها اضافه کنند (روی تمام بسترها).

به گفته اوپن ای‌آی، قابلیت صوتی با استفاده از یک مدل تبدیل متن به گفتار پشتیبانی می‌شود که از متن و نمونه گفتاری چند ثانیه‌ای صدای شبیه انسان تولید می‌کند.

این شرکت گفت: «ما برای خلق هر کدام از این صداها، با صداپیشگان حرفه‌ای همکاری کردیم. ما همچنین از ویسپر، سیستم تشخیص گفتار متن‌باز شرکت خودمان، استفاده کردیم تا صحبت‌های شفاهی شما را به شکل متن رونویسی کنیم.»

این شرکت هوش مصنوعی معتقد است که فناوری صوتی جدید قادر است از فقط چند ثانیه گفتار واقعی، صداهای مصنوعی شبیه واقعی بسازد، و می‌تواند راه را برای اپلیکیشن‌های خلاقانه زیادی باز کند.

با وجود این، شرکت اوپن ای‌آی همچنین هشدار داده است که قابلیت‌های جدید ممکن است خطرهای جدیدی ایجاد کنند «مانند این احتمال که افراد دارای سوءنیت خود را جای چهره‌های سرشناس جا بزنند یا اقدام به کلاهبرداری کنند».

به‌روز‌رسانی مهم دیگر این ربات چت هوش مصنوعی به کاربران امکان می‌دهد که تصویری را بارگذاری گنند و از چت جی‌پی‌تی در موردش سوال کنند.

اوپن ای‌آی توضیح داد: «علت روشن نشدن کباب‌پز را عیب‌یابی کنید، محتویات یخچال را وارسی و برای غذا برنامه‌ریزی کنید، یا یک نمودار پیچیده را برای داده‌های مرتبط با کار تجزیه و تحلیل کنید.»

به گفته این شرکت، قابلیت جدید همچنین به کاربران امکان می‌دهد با استفاده از ابزار ترسیم اپلیکیشن موبایل چت جی‌پی‌تی، روی بخش خاصی از تصویر تمرکز کنند.

این نوع تشخیص چندوجهی ربات چت از مدتی قبل پیش‌بینی می‌شد، و این شناخت تصویری جدید با مدل چندوجهی جی‌پی‌تی‌ـ۳.۵ (GPT-3.5) و جی‌پی‌تی-۴ (GPT-4) پشتیبانی می‌شود.

این مدل‌ها می‌توانند مهارت‌های منطق زبانی‌شان را برای انواع تصاویر، از جمله عکس، نماگرفت (اسکرین‌شات) و مدارک، به کار ببرند.

به گفته اوپن ای‌آی، قابلیت‌های جدید ظرف دو هفته آینده برای مشترکان پولی سرویس‌های چت جی‌پی‌تی پلاس و اینترپرایز در اپلیکیشن در دسترس خواهد بود.    

این شرکت هوش مصنوعی گفت: «هیجان‌زده‌ایم که پس از آن، به‌زودی این قابلیت‌ها را در دسترس سایر گروه‌های کاربران، از جمله طراحان و سازندگان، قرار دهیم.»

انتهای پیام

نظرات خود را با ما درمیان بگذارید

افزودن دیدگاه جدید

کپچا
CAPTCHA ی تصویری
کاراکترهای نمایش داده شده در تصویر را وارد کنید.