امنیت هوشمند با هوش مصنوعی مولد
مدلهای زبانی بزرگ (LLM)، میتواند در ارتقای امنیت سازمانی موثر باشد و شرکت امنافزار گستر شریف که به اهمیت استفاده از تکنولوژیهای جدید حوزه هوش مصنوعی و بهطور خاص LLMها در زمینه امنیت سایبری آگاه است، در تعدادی از محصولات خود از مدلهای زبانی بزرگ بهره برده است.
به گزارش سیتنا، واحد تحقیق و توسعه شرکت امنافزار گستر شریف در گزارش ارسالی برای سیتنا، توضیح داد:
هوش مصنوعی مولد Generative AI، عبارت از به کارگیری شبکه های عصبی مصنوعی برای تولید عکس، متن، ویدیو و الگوهای دیگر است. در هوش مصنوعی مولد، یک مغز مصنوعی با شبکه های عصبی ساخته می شود که با حجم وسیعی از داده های آموزش داده شده و الگوها و ساختارهای پنهان در داده ها را یاد می گیرد و بر اساس آن الگوها و ساختارها، به تولید نمونه های جدید می پردازد.
مدلهای زبانی بزرگ بخش از هوش مصنوعی مولد هستند که به یادگیری و تولید متن متمرکز شده اند. واحد تحقیق و توسعه شرکت امن افزار گستر شریف به عنوان یک شرکت پیشرو با ماموریت تولید محصولات آینده به تحقیق و تولید نمونه اولیه محصولات پیشرو می پردازد.
مدلهای زبانی بزرگ (LLM)
مدلهای زبانی بزرگ، نوعی از سیستمهای هوش مصنوعی هستند که برای پردازش و تجزیه و تحلیل حجم وسیعی از دادههای زبان طبیعی طراحی شدهاند. مدلهای زبانی بزرگ از این اطلاعات برای ایجاد پاسخ به درخواستهای کاربر استفاده میکنند. این سیستمها بر روی مجموعه دادههای عظیم با استفاده از الگوریتمهای پیشرفته یادگیری ماشین برای یادگیری الگوها و ساختارهای زبان انسانی آموزش دیدهاند و قادر به ایجاد پاسخهای زبان طبیعی به طیف گستردهای از ورودیهای نوشتاری هستند. مدلهای زبانی بزرگ در کاربردهای مختلف مانند پردازش زبان طبیعی، ترجمه ماشینی، خلاصهسازی متن، تولید متن، تولید کد و موارد دیگر اهمیت فزایندهای پیدا کردهاند.
تاریخچه کوتاه از توسعه LLMها
خلاصهای از نحوه تکامل مدلهای زبانی تا دستیابی به LLMها در شکل 1 آورده شده است.
کاربرد مدلهای زبانی بزرگ در امنیت سایبری
افزایش تعداد تهدیدات سایبری نیاز به مکانیزمهای امنیتی قوی را بیشتر کرده است. روشهای سنتی، اگرچه هنوز ضروری هستند، در مواجهه با حملات سایبری پیچیده ناکافی و غیر کارآمد هستند. مدلهای زبانی بزرگ (LLM)، میتواند در ارتقای امنیت سازمانی موثر باشد. این مدلهای جدید در تشخیص اسکریپتهای مخرب، تشخیص تهدیدات و آسیبپذیریها، هوش تهدید و تحلیل لاگها در سامانههای امنیتی مانند SIEM، به کارشناسان امنیت کمک میکنند.
- تحلیل الگوهای تهدید: LLMها دارای ویژگی یافتن الگو هستند و میتوان از آنها برای تجزیه و تحلیل رفتارها و تاکتیکهای تهدیدات پیشرفته به منظور شناسایی بهتر حوادث و کاهش آنها بهصورت بلادرنگ استفاده کرد.
- پاسخگویی خودکار: LLMها پتانسیل زیادی در مرکز عملیات امنیتی (SOC) و خودکارسازی پاسخ دارند. اسکریپتها، ابزارها و حتی گزارشها را میتوان با استفاده از این مدلها نوشت و کل زمان مورد نیاز متخصصان امنیت را کاهش داد.
- تشخیص ایمیلهای فیشینگ: با fine-tune (تنظیم دقیق) کردن یک LLM بر روی یک مجموعه داده بزرگ از ایمیلهای فیشینگ و ایمیلهای معمولی، میتوان از این LLM جدید برای تشخیص ایمیلهای فیشینگ استفاده کرد.
- یافتن اسکریپتهای مخرب: بهطور مشابه، با fine-tune کردن یک LLM بر روی مجموعه داده بزرگی از کدهای موجود در گیتهاب، کدهای مربوط به بدافزارها و کدهای اختصاصی، میتوان این LLM را برای تشخیص اسکریپتهای مخرب از اسکریپتهای بیخطر و معمولی بکار برد.
استفاده از ابزارهای امنیتی مبتنی بر LLM موجب کوتاه شدن زمان تحلیل رخدادهای امنیتی میگردد. بنابراین، متخصصان امنیت میتوانند با بهرهگیری از این ابزارها، بسیاری از کارهای نیازمند به تحلیل بالا را در زمان کوتاهی انجام دهند. همچنین، با بهرهگیری از ابزارهای امنیتی مبتنی بر LLM، کارهای سادهتر امنیتی توسط کارشناسان معمولی IT انجام میگیرد و متخصصان حرفهای امنیت زمان باارزش خود را صرف تحلیلهای پیچیده امنیتی خواهند کرد.
نمونههایی از کاربرد LLMها در امنیت سایبری
با توجه به جدید بودن تکنیک fine-tune کردن مدلهای زبانی بزرگ برای کاربردهای خاص و از جمله امنیت، هنوز شرکتهای محدودی در حوزه LLM تخصصی امنیتی به تولید محصول پرداختهاند.
شرکت گوگل
گوگل یک نسخه تخصصی از PaLM 2 (مدل زبانی بزرگ گوگل) به نام Sec-PaLM منتشر کرده است که روی use caseهای امنیتی آموزش دیده است. این ابزار بر روی اطلاعات هوش تهدید Mandiant و گوگل fine-tune شده است. این اطلاعات شامل آسیبپذیریها، بدافزارها، شاخصهای تهدید، مخزنهای گیتهابهای امنیتی، چارچوب MITRE و پروفایلهای رفتاری مهاجمان میباشد (شکل 2). وب سایت virustotal از Sec-PaLM برای ارائه تشخیص فایلها و اسکریپتهای مخرب استفاده میکند.
شرکت Elasticsearch
شرکت Elastic دستیار Elastic AI Assistant را معرفی کرده است که از هوش مصنوعی مولد برای تقویت SIEM استفاده می کند. بدین ترتیب، کاربرانElastic میتوانند برای کارهایی مانند بررسی هشدار، پاسخ به حادثه، و ایجاد پرس و جو با استفاده از زبان طبیعی با SIEM تعامل داشته باشند. Elastic AI Assistant از APIهای دو مدل زبانی بزرگ OpenAI و Azure OpenAI Service استفاده میکند.
شرکت Splunk
شرکت Splunk یک تشخیصگر ایمیل فیشینگ با استفاده از مدل BERT ساخته است. بدین منظور، مدل BERT با استفاده از مجموعه داده ای شامل 181،781 متن ایمیل با برچسب فیشینگ یا غیرفیشینگ fine-tune شده است.
بیشتر شرکتهای امنیتی بزرگ دنیا مانند Palo Alto، Cisco و Fortinet به دنبال یکپارچهسازی ابزارهای LLM به انواع محصولات خود میباشند.
شرکت امنافزار گستر شریف که طی 21 سال گذشته همواره یکی از شرکتهای پیشرو در حوزه تولید محصولات امنیتی تکنولوژی بالا در کشور بوده است، به اهمیت استفاده از تکنولوژیهای جدید حوزه هوش مصنوعی و بهطور خاص LLMها در زمینه امنیت سایبری آگاه است. شرکت امنافزار گستر شریف در تعدادی از محصولات خود از مدلهای زبانی بزرگ بهره برده است. بهطور خاص، نسخه جدید محصول SIEM شرکت، مبتنی بر یک LLM که برای مقاصد امنیتی fine-tune شده میباشد.
انتهای پیام
افزودن دیدگاه جدید