از کجا بفهمیم یک ویدیو کار هوش مصنوعی است؟
در شبکههای اجتماعی ویدیوهای بیکیفیت ساختهشده با هوش مصنوعی رو به افزایش است و به گفته یک استاد علوم کامپیوتر در دانشگاه کالیفرنیا، سه چیزی که باید به آنها توجه کنید وضوح، کیفیت و طول ویدیو است.
به گزارش سیتنا، فید شبکههای اجتماعیتان پر شده از ویدیوهای بیکیفیت ساختهشده با هوش مصنوعی.
یک نشانه ساده برای تشخیص جعلیها وجود دارد: کیفیتش آنقدر افتضاح است که انگار با دوربین عهد بوق گرفته شده است. کار تمام است. قرار است فریب بخورید، شاید تا حالا هم خوردهاید.
در شش ماه گذشته، تولیدکنندههای ویدیوی هوش مصنوعی آنقدر پیشرفته شدهاند که نگاه ما به دوربینها دارد کاملاً عوض میشود. بهترین سناریو این است: بارها و بارها گول میخورید، تا جایی که خسته و دلزده میشوید و شروع میکنید به زیر سؤال بردن هر چیزی که میبینید. به آینده خوش آمدید. اما فعلا هنوز چند نشانه هشدار باقی ماندهاند.
یکی از همه برجستهتر است. اگر ویدیویی دیدید با کیفیت تصویر بد، تصویری دانهدانه، تار و مبهم، زنگ خطر باید در ذهنتان به صدا درآید که شاید با یک ویدیوی تولیدشده با هوش مصنوعی طرف باشید.
هانی فرید، استاد علوم کامپیوتر در دانشگاه کالیفرنیا، برکلی و پیشگام در حوزه جرمشناسی دیجیتال و بنیانگذار شرکت شناسایی دیپفیک «گت ریل سکیوریتی» میگوید: «این یکی از اولین چیزهاییست که به آن نگاه میکنیم.» حقیقت تلخ این است که ابزارهای ویدیویی هوش مصنوعی بهزودی بهتر هم خواهند شد و این توصیه دیگر بیفایده خواهد بود. ممکن است این اتفاق در عرض چند ماه بیفتد، یا چند سال طول بکشد. بیایید صریح باشیم.
ویدیوهای هوش مصنوعی لزوما کیفیت پایینتری ندارند. بهترین ابزارهای هوش مصنوعی میتوانند کلیپهایی زیبا و تمیزی تولید کنند و از آن طرف، ویدیوهای بیکیفیت هم لزوما توسط هوش مصنوعی ساخته نشدهاند.
متیو استم، استاد و مدیر آزمایشگاه امنیت اطلاعات و چندرسانهای در دانشگاه درکسل میگوید: «اگر چیزی را ببینید که واقعا کیفیتش پایین است، این به خودی خود بهمعنای تقلبی بودنش نیست. بهمعنای هیچ چیز مشکوکی هم نیست.» مسئله این است که ویدیوهای تار و پیکسل پیکسل هوش مصنوعی آنهایی هستند که فعلا بیشتر احتمال دارد فریبتان بدهند.
این نشانهای است که ممکن است بخواهید بیشتر به آنچه تماشا میکنید دقت کنید. فرید میگوید: «ابزارهای پیشرو در تبدیل متن به ویدئو مثل وئو گوگل یا سورا از اوپن ایآی هنوز ایرادهای کوچکی دارند اما دیگر خبری از شش انگشت یا متنهای بههمریخته نیست؛ ایرادها خیلی ظریفتر شدهاند.» حتی پیشرفتهترین مدلهای امروزی هم اغلب مشکلاتی ایجاد میکنند، مثل بافت بیش از حد صاف پوست، الگوهای عجیب یا متغیر در مو و لباس، یا اشیای کوچک در پسزمینه که به شکلهای غیرممکن یا غیرواقعی حرکت میکنند.
همه اینها بهراحتی ممکن است دیده نشوند، اما هر چه تصویر واضحتر باشد، احتمال بیشتری هست که این نشانههای تولید با هوش مصنوعی را ببینید. همین است که ویدیوهای بیکیفیت را اینقدر فریبنده میکند. مثلا وقتی از هوش مصنوعی میخواهید چیزی بسازد که شبیه فیلمبرداری با یک گوشی قدیمی باشد، میتواند مصنوعات تصویری که ممکن بود به دیگران هشدار دهد را پنهان کند.
در چند ماه اخیر، چند ویدیوی معروف هوش مصنوعی تعداد زیادی از مردم را فریب دادند. همه آنها یک نقطه مشترک داشتند. یک ویدیوی جعلی اما بامزه از خرگوشهای وحشی که روی ترامپولین میپریدند، بیش از ۲۴۰ میلیون بار در تیکتاک دیده شد. میلیونها عاشق دنیای مجازی هم ویدیوی دونفر که در متروی نیویورک عاشق میشوند را لایک کردند.
فرید میگوید: «سه چیزی که باید به آنها توجه کنید وضوح، کیفیت و طول ویدیو است.» طول ویدیو راحتترینشان است. او میگوید: «در بیشتر موارد، ویدیوهای هوش مصنوعی خیلی کوتاه هستند، حتی کوتاهتر از ویدیوهای معمول تیکتاک یا اینستاگرام که حدود ۳۰ تا ۶۰ ثانیهاند. اکثریت ویدیوهایی که برای بررسی به من میفرستند شش، هشت یا ده ثانیهای هستند.» دلیلش این است که تولید ویدیو با هوش مصنوعی هزینهبر است، بنابراین اکثر ابزارها روی کلیپهای کوتاه محدود هستند. و هر چه ویدیو طولانیتر باشد، احتمال اینکه هوش مصنوعی خرابکاری کند بیشتر است.
فرید میگوید: «میشود چند ویدیوی هوش مصنوعی را به هم چسباند، اما هر ۸ ثانیه یا بیشتر، یک بریدگی را متوجه میشوید.» دو عامل دیگر، یعنی وضوح و کیفیت، با اینکه مرتبط هستند، متفاوتاند. وضوح به تعداد یا اندازه پیکسلها در یک تصویر اشاره دارد، در حالی که فشردهسازی فرآیندی است برای کاهش حجم فایل ویدیو با حذف جزئیات، که اغلب بهجای آن الگوهای بلوکی و لبههای تار باقی میگذارد. در واقع، آقای فرید میگوید ویدیوهای جعلی با کیفیت پایین آنقدر قانعکننده هستند که متقلبان عمدا کیفیت را پایین میآورند.
او میگوید: «اگر بخواهم کسی را فریب دهم، چه کار میکنم؟ ویدیوی جعلی تولید میکنم، بعد وضوحش را پایین میآورم، طوری که هنوز دیده شود، اما دیگر نمیشود تمام جزئیات را دید. بعد هم فشردهسازی اضافه میکنم تا هر رد احتمالی بیشتر مخفی شود»، فرید توضیح میدهد. «این یک تکنیک رایج است.»
انتهای پیام
افزودن دیدگاه جدید