مجله خبری سرمایه گذاری اهرم
Loading...

نتایج جستجو

بازگشت
بازگشت

Genie 3 گوگل معرفی شد؛ دنیای تعاملی در راه دستیابی به AGI

Genie 3 گوگل معرفی شد؛ دنیای تعاملی در راه دستیابی به AGI
نوشته شده توسط رهام بخشائي
|
۱۵ مرداد، ۱۴۰۴

گوگل دیپ‌مایند نسل جدید مدل هوش مصنوعی خود، «Genie 3»، را معرفی کرد؛ مدلی که قادر است دنیاهای سه‌بعدی تعاملی را آنی ایجاد کرده و به دستورات متنی در لحظه پاسخ دهد. این مدل قرار است به بستری برای آموزش نسل آینده سیستم‌های هوشمند از جمله ربات‌های انسان‌نما و خودروهای خودران تبدیل شود.
به گزارش دیپ‌مایند، Genie 3 یک «مدل جهانی» (World Model) است که می‌تواند محیط‌های مجازی را برای اهداف مختلفی نظیر سرگرمی، بازی‌های ویدئویی، یا به‌ویژه آموزش و ارزیابی سیستم‌های هوشمند شبیه‌سازی کند. این مدل که جدیدترین دستاورد گوگل دیپ‌مایند است، یک پیشرفت بزرگ نسبت به نسخه قبلی خود، Genie 2، محسوب می‌شود.

 

پیشرفت‌های فنی Genie 3

Genie 3 قادر است دنیاهای مجازی را با رزولوشن 720p (در مقایسه با 360p در نسخه قبلی) و با ثبات بیشتری شبیه‌سازی کند. این مدل می‌تواند تا چندین دقیقه این محیط‌ها را شبیه‌سازی کند، در حالی که نسخه قبلی تنها قادر به شبیه‌سازی حداکثر یک دقیقه بود. برخلاف مدل‌های قبلی که برای تولید هر فریم به زمان نیاز داشتند، Genie 3 به صورت آنی (Real-time) به دستورات حرکتی کاربران یا سیستم‌های هوشمند پاسخ می‌دهد.

 

توانایی‌های ویژه Genie 3

یکی از مهم‌ترین ویژگی‌های Genie 3، قابلیت Promptable World Events است که به محققان این امکان را می‌دهد که با استفاده از دستورات متنی ساده، محیط شبیه‌سازی‌شده را آنی تغییر دهند. به‌عنوان مثال، در ویدیوی معرفی این مدل، محققان در حین شبیه‌سازی اسکی فردی در کوهستان، توانستند تنها با یک دستور متنی گله‌ای از گوزن‌ها را به صحنه اضافه کنند.
این قابلیت باعث می‌شود Genie 3 به ابزاری فوق‌العاده برای آموزش سیستم‌های هوشمند تبدیل شود. محققان می‌توانند با استفاده از سناریوهای «چه می‌شد اگر» (What if) که در دنیای واقعی نادر، پرخطر یا گران‌قیمت هستند، عامل‌های هوشمند را برای شرایط غیرمنتظره آماده کنند. به‌عنوان مثال، این مدل می‌تواند برای آموزش خودروهای خودران جهت جلوگیری از برخورد با عابری که ناگهان به خیابان می‌پرد، استفاده شود.

 

Genie 3 و آینده AGI

تیم دیپ‌مایند معتقد است که Genie 3 نه تنها یک ابزار قدرتمند است، بلکه «گامی به سوی AGI» (هوش مصنوعی عمومی) محسوب می‌شود. این تیم مدل‌های جهانی را به‌عنوان کلیدی برای آموزش عامل‌های تجسم‌یافته (Embodied Agents) می‌داند، سیستم‌هایی که باید در دنیای واقعی عمل کنند. در آزمایش‌های اخیر خود، دیپ‌مایند نشان داد که چگونه SIMA، یک عامل هوشمند ساخته‌شده توسط Genie 3، می‌تواند در یک انبار مجازی محیط را درک کرده و وظایف مختلفی را به‌طور موفقیت‌آمیز انجام دهد.

 

چالش‌ها و محدودیت‌های Genie 3

اگرچه Genie 3 پیشرفت‌های چشمگیری داشته، هنوز در مراحل ابتدایی توسعه قرار دارد. این مدل در شبیه‌سازی دقیق فیزیک محیط هنوز مشکلاتی دارد و در رندر کردن متن نیز با چالش‌هایی مواجه است. همچنین مدت زمان تعامل آن، که معمولاً چند دقیقه است، برای آموزش سناریوهای پیچیده ممکن است کافی نباشد.

اشتراک گذاری:
کپی شد