چت جیپیتی حالا میتواند ببیند، بشنود و حرف بزند
بنا بر اعلام شرکت اوپن ایآی، چت جیپیتی یک بهروزرسانی جدید دارد که به این ابزار فراگیر هوش مصنوعی امکان میدهد ببیند، بشنود و صحبت کند.
به گزارش سیتنا به نقل از ایندیپندنت، شرکت اوپن ایآی در پستی وبلاگی اعلام کرد که بهروزرسانی ربات چت هوش مصنوعی اوپن ایآی به کاربران اجازه خواهد داد تا مکالمه صوتی با این ربات چت هوش مصنوعی داشته باشند و همچنین با استفاده از تصویر، با آن تعامل داشته باشند.
این شرکت همچنین در پستی در اکس/توییتر نوشت: «چت جیپیتی حالا میتواند ببیند، بشنود، و صحبت کند.»
این قابلیتها «در دو هفته آینده» در دسترس خواهد بود و به کاربران امکان میدهد «با استفاده از صدا، مکالمهای دوطرفه» با دستیار هوش مصنوعی داشته باشند.
به گفته اوپن ایآی، با این قابلیتهای جدید، چت جیپیتی میتواند برای «درخواست قصه شب برای خانوادهتان، یا حلوفصل بحث سر میز شام» کاربرد داشته باشد، که چت جیپیتی را به خدماتی که دستیار هوش مصنوعی الکسای آمازون یا سیری اپل ارائه میدهند نزدیکتر میکند.
اوپن ایآی برای نمایش نمونهای از نحوه کارکرد این قابلیت، ویدیویی را به اشتراک گذاشت که در آن کاربری از چت جیپیتی میخواهد داستانی درباره «خارپشت معرکه آفتابگردانی به نام لری» بگوید.
ربات چت با صدایی شبیه انسان به سوال پاسخ میدهد و همچنین به سوالهایی مانند «خانهاش چه شکلی است؟» و «دوست صمیمیاش چه کسی است؟» جواب میدهد.
چت جیپیتی الان میتواند ببیند، بشنود، و حرف بزند. در دو هفته آینده در دسترس خواهد بود. کاربران میتوانند مکالمههای صوتی با چت جیپیتی داشته باشند (آیاواس و اندروید) و تصاویر را به گفتوگوها اضافه کنند (روی تمام بسترها).
به گفته اوپن ایآی، قابلیت صوتی با استفاده از یک مدل تبدیل متن به گفتار پشتیبانی میشود که از متن و نمونه گفتاری چند ثانیهای صدای شبیه انسان تولید میکند.
این شرکت گفت: «ما برای خلق هر کدام از این صداها، با صداپیشگان حرفهای همکاری کردیم. ما همچنین از ویسپر، سیستم تشخیص گفتار متنباز شرکت خودمان، استفاده کردیم تا صحبتهای شفاهی شما را به شکل متن رونویسی کنیم.»
این شرکت هوش مصنوعی معتقد است که فناوری صوتی جدید قادر است از فقط چند ثانیه گفتار واقعی، صداهای مصنوعی شبیه واقعی بسازد، و میتواند راه را برای اپلیکیشنهای خلاقانه زیادی باز کند.
با وجود این، شرکت اوپن ایآی همچنین هشدار داده است که قابلیتهای جدید ممکن است خطرهای جدیدی ایجاد کنند «مانند این احتمال که افراد دارای سوءنیت خود را جای چهرههای سرشناس جا بزنند یا اقدام به کلاهبرداری کنند».
بهروزرسانی مهم دیگر این ربات چت هوش مصنوعی به کاربران امکان میدهد که تصویری را بارگذاری گنند و از چت جیپیتی در موردش سوال کنند.
اوپن ایآی توضیح داد: «علت روشن نشدن کبابپز را عیبیابی کنید، محتویات یخچال را وارسی و برای غذا برنامهریزی کنید، یا یک نمودار پیچیده را برای دادههای مرتبط با کار تجزیه و تحلیل کنید.»
به گفته این شرکت، قابلیت جدید همچنین به کاربران امکان میدهد با استفاده از ابزار ترسیم اپلیکیشن موبایل چت جیپیتی، روی بخش خاصی از تصویر تمرکز کنند.
این نوع تشخیص چندوجهی ربات چت از مدتی قبل پیشبینی میشد، و این شناخت تصویری جدید با مدل چندوجهی جیپیتیـ۳.۵ (GPT-3.5) و جیپیتی-۴ (GPT-4) پشتیبانی میشود.
این مدلها میتوانند مهارتهای منطق زبانیشان را برای انواع تصاویر، از جمله عکس، نماگرفت (اسکرینشات) و مدارک، به کار ببرند.
به گفته اوپن ایآی، قابلیتهای جدید ظرف دو هفته آینده برای مشترکان پولی سرویسهای چت جیپیتی پلاس و اینترپرایز در اپلیکیشن در دسترس خواهد بود.
این شرکت هوش مصنوعی گفت: «هیجانزدهایم که پس از آن، بهزودی این قابلیتها را در دسترس سایر گروههای کاربران، از جمله طراحان و سازندگان، قرار دهیم.»
انتهای پیام
افزودن دیدگاه جدید