هوش مصنوعی در خط مقدم درمان
دو پژوهش تازه در رواندا و پاکستان نشان میدهد چتباتهای مبتنی بر مدلهای زبانی بزرگ، نهتنها در محیطهای آزمایشگاهی، بلکه در شرایط واقعی و کممنابع نیز میتوانند دقت تشخیص پزشکی را افزایش دهند؛ آن هم با هزینهای بسیار کمتر از پزشکان انسانی.
به گزارش سیتنا،در یکی از این مطالعات، حدود ۱۰۰ بهورز در رواندا بیش از ۵۶۰۰ پرسش بالینی بیماران را ثبت کردند. پژوهشگران سپس پاسخ پنج مدل زبانی بزرگ را با پاسخ پزشکان محلی به حدود ۵۰۰ پرسش مقایسه کردند.
نتایج نشان داد که چتباتها در تمام ۱۱ معیار ارزیابی از جمله تطابق با اجماع پزشکی، درک درست پرسش و احتمال ایجاد آسیب امتیاز بالاتری نسبت به پزشکان محلی کسب کردند. ارزیابیها بر اساس یک مقیاس پنجنمرهای انجام شد.
نکته قابل توجه دیگر، توانایی این مدلها در پاسخگویی به حدود ۱۰۰ پرسش به زبان ملی رواندا بود؛ قابلیتی که اهمیت سازگاری زبانی و فرهنگی هوش مصنوعی را برجسته میکند.
از نظر اقتصادی نیز اختلاف چشمگیر است. پاسخ پزشکان بهطور میانگین ۵.۴۳ دلار و پاسخ پرستاران ۳.۸۰ دلار هزینه داشت، در حالی که هر پاسخ مدل زبانی بزرگ تنها حدود ۰.۰۰۳۵ دلار به انگلیسی و ۰.۰۰۴۴ دلار به زبان رواندا هزینه داشت. افزون بر این، چتباتها بهصورت ۲۴ ساعته در دسترس بهورزان هستند؛ امتیازی که برای پزشکان انسانی بهسادگی ممکن نیست.
با این حال، پژوهشگران تأکید میکنند که مقایسه مستقیم پاسخهای متنی مدلها با عملکرد واقعی انسانها محدودیتهایی دارد و لزوماً بازتاب کامل واقعیت بالینی نیست.
پاکستان؛ افزایش دقت تشخیص با کمک هوش مصنوعی
در مطالعهای دیگر در پاکستان، تیمی به سرپرستی احسان قاضی از دانشگاه مدیریت علوم لاهور نشان داد که استفاده از مدلهای زبانی بزرگ میتواند خطاهای تشخیصی را در سیستمهای کممنابع کاهش دهد؛ سیستمهایی که با کمبود متخصص و حجم بالای بیماران مواجهاند.
در یک آزمایش تصادفی کنترلشده، ۵۸ پزشک مجاز پس از ۲۰ ساعت آموزش برای استفاده از مدلهای زبانی بزرگ و آشنایی با خطرات احتمالی آنها، در فرآیند تشخیص بیماران شرکت کردند.
پزشکانی که به مدل GPT-4o دسترسی داشتند، بهطور میانگین به دقت تشخیصی ۷۱ درصد رسیدند، در حالی که این رقم برای پزشکانی که فقط از PubMed و جستوجوی اینترنتی استفاده میکردند، ۴۳ درصد بود.
تحلیل تکمیلی نشان داد که خود مدلهای زبانی بزرگ، در مجموع عملکرد بهتری از پزشکانی داشتند که از آنها کمک میگرفتند؛ هرچند در ۳۱ درصد موارد، پزشکان عملکرد دقیقتری نشان دادند. این موارد عمدتاً شامل نشانههای هشداردهنده و عوامل زمینهای بود که مدلها از آن غفلت کرده بودند.
قاضی معتقد است این نتایج میتواند به کشورهای دیگر نیز تعمیم داده شود، هرچند تأکید میکند که تکرار این مطالعات با چتباتهای مختلف ضروری است. به گفته او، این پژوهشها مسیرهای تازهای برای ادغام ایمنتر و مؤثرتر هوش مصنوعی در نظام سلامت باز میکنند.
استفاده با احتیاط، نه جایگزینی کامل
کارولین گرین، مدیر تحقیقات مؤسسه اخلاق در هوش مصنوعی دانشگاه آکسفورد، میگوید این مطالعات نشان میدهند آموزش پزشکان برای استفاده تخصصی از هوش مصنوعی تا چه اندازه حیاتی است.
با این حال، او هشدار میدهد که مدلهای زبانی بزرگ همچنان با چالشهایی مانند سوگیری و حفظ حریم خصوصی دادههای بیماران روبهرو هستند و نباید تصور کرد که میتوانند بهطور کامل جایگزین مراقبتهای بهداشتی انسانی شوند.
انتهای پیام
افزودن دیدگاه جدید