از کجا بفهمیم یک ویدیو کار هوش مصنوعی است؟

در شبکه‌های اجتماعی‌ ویدیوهای بی‌کیفیت ساخته‌شده با هوش مصنوعی رو به افزایش است و به گفته یک استاد علوم کامپیوتر در دانشگاه کالیفرنیا، سه چیزی که باید به آن‌ها توجه کنید وضوح، کیفیت و طول ویدیو است.

به گزارش سیتنا، فید شبکه‌های اجتماعی‌تان پر شده از ویدیوهای بی‌کیفیت ساخته‌شده با هوش مصنوعی.

یک نشانه ساده برای تشخیص جعلی‌ها وجود دارد: کیفیتش آن‌قدر افتضاح است که انگار با دوربین عهد بوق گرفته شده است. کار تمام است. قرار است فریب بخورید، شاید تا حالا هم خورده‌اید.

در شش ماه گذشته، تولیدکننده‌های ویدیوی هوش مصنوعی آن‌قدر پیشرفته شده‌اند که نگاه ما به دوربین‌ها دارد کاملاً عوض می‌شود. بهترین سناریو این است: بارها و بارها گول می‌خورید، تا جایی که خسته و دلزده می‌شوید و شروع می‌کنید به زیر سؤال بردن هر چیزی که می‌بینید. به آینده خوش آمدید. اما فعلا هنوز چند نشانه هشدار باقی مانده‌اند.

یکی از همه برجسته‌تر است. اگر ویدیویی دیدید با کیفیت تصویر بد، تصویری دانه‌دانه، تار و مبهم، زنگ خطر باید در ذهنتان به صدا درآید که شاید با یک ویدیوی تولیدشده با هوش مصنوعی طرف باشید.

هانی فرید، استاد علوم کامپیوتر در دانشگاه کالیفرنیا، برکلی و پیشگام در حوزه جرم‌شناسی دیجیتال و بنیان‌گذار شرکت شناسایی دیپ‌فیک «گت ریل سکیوریتی» می‌گوید: «این یکی از اولین چیزهایی‌ست که به آن نگاه می‌کنیم.» حقیقت تلخ این است که ابزارهای ویدیویی هوش مصنوعی به‌زودی بهتر هم خواهند شد و این توصیه دیگر بی‌فایده خواهد بود. ممکن است این اتفاق در عرض چند ماه بیفتد، یا چند سال طول بکشد. بیایید صریح باشیم.

ویدیوهای هوش مصنوعی لزوما کیفیت پایین‌تری ندارند. بهترین ابزارهای هوش مصنوعی می‌توانند کلیپ‌هایی زیبا و تمیزی تولید کنند و از آن طرف، ویدیوهای بی‌کیفیت هم لزوما توسط هوش مصنوعی ساخته نشده‌اند.

متیو استم، استاد و مدیر آزمایشگاه امنیت اطلاعات و چندرسانه‌ای در دانشگاه درکسل می‌گوید: «اگر چیزی را ببینید که واقعا کیفیتش پایین است، این به خودی خود به‌معنای تقلبی بودنش نیست. به‌معنای هیچ چیز مشکوکی هم نیست.» مسئله این است که ویدیوهای تار و پیکسل ‌پیکسل هوش مصنوعی آن‌هایی هستند که فعلا بیشتر احتمال دارد فریب‌تان بدهند.

این نشانه‌ای است که ممکن است بخواهید بیشتر به آنچه تماشا می‌کنید دقت کنید. فرید می‌گوید: «ابزارهای پیشرو در تبدیل متن به ویدئو مثل وئو گوگل یا سورا از اوپن ای‌آی هنوز ایرادهای کوچکی دارند اما دیگر خبری از شش انگشت یا متن‌های به‌هم‌ریخته نیست؛ ایرادها خیلی ظریف‌تر شده‌اند.» حتی پیشرفته‌ترین مدل‌های امروزی هم اغلب مشکلاتی ایجاد می‌کنند، مثل بافت بیش ‌از حد صاف پوست، الگوهای عجیب یا متغیر در مو و لباس، یا اشیای کوچک در پس‌زمینه که به شکل‌های غیرممکن یا غیرواقعی حرکت می‌کنند.

همه این‌ها به‌راحتی ممکن است دیده نشوند، اما هر چه تصویر واضح‌تر باشد، احتمال بیشتری هست که این نشانه‌های تولید با هوش مصنوعی را ببینید. همین است که ویدیوهای بی‌کیفیت را این‌قدر فریبنده می‌کند. مثلا وقتی از هوش مصنوعی می‌خواهید چیزی بسازد که شبیه فیلم‌برداری با یک گوشی قدیمی باشد، می‌تواند مصنوعات تصویری‌ که ممکن بود به دیگران هشدار دهد را پنهان کند.

در چند ماه اخیر، چند ویدیوی معروف هوش مصنوعی تعداد زیادی از مردم را فریب دادند. همه آن‌ها یک نقطه مشترک داشتند. یک ویدیوی جعلی اما بامزه از خرگوش‌های وحشی که روی ترامپولین می‌پریدند، بیش از ۲۴۰ میلیون بار در تیک‌تاک دیده شد. میلیون‌ها عاشق دنیای مجازی هم ویدیوی دونفر که در متروی نیویورک عاشق می‌شوند را لایک کردند.

فرید می‌گوید: «سه چیزی که باید به آن‌ها توجه کنید وضوح، کیفیت و طول ویدیو است.» طول ویدیو راحت‌ترین‌شان است. او می‌گوید: «در بیشتر موارد، ویدیوهای هوش مصنوعی خیلی کوتاه هستند، حتی کوتاه‌تر از ویدیوهای معمول تیک‌تاک یا اینستاگرام که حدود ۳۰ تا ۶۰ ثانیه‌اند. اکثریت ویدیوهایی که برای بررسی به من می‌فرستند شش، هشت یا ده ثانیه‌ای هستند.» دلیلش این است که تولید ویدیو با هوش مصنوعی هزینه‌بر است، بنابراین اکثر ابزارها روی کلیپ‌های کوتاه محدود هستند. و هر چه ویدیو طولانی‌تر باشد، احتمال اینکه هوش مصنوعی خراب‌کاری کند بیشتر است.

فرید می‌گوید: «می‌شود چند ویدیوی هوش مصنوعی را به هم چسباند، اما هر ۸ ثانیه یا بیشتر، یک بریدگی را متوجه می‌شوید.» دو عامل دیگر، یعنی وضوح و کیفیت، با اینکه مرتبط هستند، متفاوت‌اند. وضوح به تعداد یا اندازه پیکسل‌ها در یک تصویر اشاره دارد، در حالی که فشرده‌سازی فرآیندی است برای کاهش حجم فایل ویدیو با حذف جزئیات، که اغلب به‌جای آن الگوهای بلوکی و لبه‌های تار باقی می‌گذارد. در واقع، آقای فرید می‌گوید ویدیوهای جعلی با کیفیت پایین آن‌قدر قانع‌کننده هستند که متقلبان عمدا کیفیت را پایین می‌آورند.

او می‌گوید: «اگر بخواهم کسی را فریب دهم، چه کار می‌کنم؟ ویدیوی جعلی تولید می‌کنم، بعد وضوحش را پایین می‌آورم، طوری که هنوز دیده شود، اما دیگر نمی‌شود تمام جزئیات را دید. بعد هم فشرده‌سازی اضافه می‌کنم تا هر رد احتمالی بیشتر مخفی شود»، فرید توضیح می‌دهد. «این یک تکنیک رایج است.»

انتهای پیام