Genie 3 گوگل معرفی شد؛ دنیای تعاملی در راه دستیابی به AGI


گوگل دیپمایند نسل جدید مدل هوش مصنوعی خود، «Genie 3»، را معرفی کرد؛ مدلی که قادر است دنیاهای سهبعدی تعاملی را آنی ایجاد کرده و به دستورات متنی در لحظه پاسخ دهد. این مدل قرار است به بستری برای آموزش نسل آینده سیستمهای هوشمند از جمله رباتهای انساننما و خودروهای خودران تبدیل شود.
به گزارش دیپمایند، Genie 3 یک «مدل جهانی» (World Model) است که میتواند محیطهای مجازی را برای اهداف مختلفی نظیر سرگرمی، بازیهای ویدئویی، یا بهویژه آموزش و ارزیابی سیستمهای هوشمند شبیهسازی کند. این مدل که جدیدترین دستاورد گوگل دیپمایند است، یک پیشرفت بزرگ نسبت به نسخه قبلی خود، Genie 2، محسوب میشود.
پیشرفتهای فنی Genie 3
Genie 3 قادر است دنیاهای مجازی را با رزولوشن 720p (در مقایسه با 360p در نسخه قبلی) و با ثبات بیشتری شبیهسازی کند. این مدل میتواند تا چندین دقیقه این محیطها را شبیهسازی کند، در حالی که نسخه قبلی تنها قادر به شبیهسازی حداکثر یک دقیقه بود. برخلاف مدلهای قبلی که برای تولید هر فریم به زمان نیاز داشتند، Genie 3 به صورت آنی (Real-time) به دستورات حرکتی کاربران یا سیستمهای هوشمند پاسخ میدهد.
تواناییهای ویژه Genie 3
یکی از مهمترین ویژگیهای Genie 3، قابلیت Promptable World Events است که به محققان این امکان را میدهد که با استفاده از دستورات متنی ساده، محیط شبیهسازیشده را آنی تغییر دهند. بهعنوان مثال، در ویدیوی معرفی این مدل، محققان در حین شبیهسازی اسکی فردی در کوهستان، توانستند تنها با یک دستور متنی گلهای از گوزنها را به صحنه اضافه کنند.
این قابلیت باعث میشود Genie 3 به ابزاری فوقالعاده برای آموزش سیستمهای هوشمند تبدیل شود. محققان میتوانند با استفاده از سناریوهای «چه میشد اگر» (What if) که در دنیای واقعی نادر، پرخطر یا گرانقیمت هستند، عاملهای هوشمند را برای شرایط غیرمنتظره آماده کنند. بهعنوان مثال، این مدل میتواند برای آموزش خودروهای خودران جهت جلوگیری از برخورد با عابری که ناگهان به خیابان میپرد، استفاده شود.
Genie 3 و آینده AGI
تیم دیپمایند معتقد است که Genie 3 نه تنها یک ابزار قدرتمند است، بلکه «گامی به سوی AGI» (هوش مصنوعی عمومی) محسوب میشود. این تیم مدلهای جهانی را بهعنوان کلیدی برای آموزش عاملهای تجسمیافته (Embodied Agents) میداند، سیستمهایی که باید در دنیای واقعی عمل کنند. در آزمایشهای اخیر خود، دیپمایند نشان داد که چگونه SIMA، یک عامل هوشمند ساختهشده توسط Genie 3، میتواند در یک انبار مجازی محیط را درک کرده و وظایف مختلفی را بهطور موفقیتآمیز انجام دهد.
چالشها و محدودیتهای Genie 3
اگرچه Genie 3 پیشرفتهای چشمگیری داشته، هنوز در مراحل ابتدایی توسعه قرار دارد. این مدل در شبیهسازی دقیق فیزیک محیط هنوز مشکلاتی دارد و در رندر کردن متن نیز با چالشهایی مواجه است. همچنین مدت زمان تعامل آن، که معمولاً چند دقیقه است، برای آموزش سناریوهای پیچیده ممکن است کافی نباشد.