گوگل مدل ویرایش تصویر Nano Banana را به Gemini اضافه کرد؛ رقیبی برای فتوشاپ


گوگل از ارتقای بزرگ و قدرتمندی برای قابلیت ویرایش تصویر Gemini رونمایی کرد. این بهروزرسانی مبتنی بر مدلی به نام Nano Banana است که به کاربران امکان کنترل دقیقتر روی ویرایش تصاویر را میدهد و مشکل قدیمی حفظ ثبات چهره و جزئیات سوژه در ویرایشهای متوالی را حل میکند.
مدل Gemini 2.5 Flash Image و ویژگیهای Nano Banana
براساس گزارش TechCrunch، مدل جدید که با نام رسمی Gemini 2.5 Flash Image شناخته میشود، پیشتر بهصورت ناشناس تحت عنوان Nano Banana در پلتفرم ارزیابی هوش مصنوعی LMArena ظاهر شده بود و با عملکرد فوقالعاده خود کاربران و کارشناسان را شگفتزده کرد. گوگل تأیید کرده که همین مدل اکنون در حال اضافه شدن به Gemini است.
تمرکز اصلی این ارتقا روی ثبات شخصیتها در تصاویر است؛ کاربران میتوانند تصاویر دوستان، خانواده یا حیوانات خانگی خود را ویرایش کنند و مطمئن باشند که چهره و ظاهر آنها در ویرایشهای مختلف (تغییر مدل مو، لباس یا حتی کل صحنه) ثابت و واقعی باقی میماند.
قابلیتهای پیشرفته ویرایش
امکان بارگذاری چندین تصویر و ترکیب آنها در یک صحنه جدید و منسجم
اعمال سبک بصری یک تصویر (مثل طرح گل) روی شیء دیگر در تصویر
ویرایش مرحلهبهمرحله اجزای مختلف تصویر بدون از بین رفتن تغییرات قبلی
رقابت با OpenAI
این بهروزرسانی در شرایطی عرضه شده که بازار هوش مصنوعی تصویرسازی رقابتی شدید دارد. پس از موفقیت OpenAI با ابزارهای تصویرسازی ChatGPT، گوگل تلاش میکند با ارائه ابزارهای قدرتمندتر فاصله را کاهش دهد. در حال حاضر، ChatGPT بیش از ۷۰۰ میلیون کاربر هفتگی دارد، در حالی که Gemini ۴۵۰ میلیون کاربر ماهانه ثبت کرده است.
تدابیر امنیتی و ایمنی
گوگل با درس گرفتن از مشکلات گذشته، مانند تولید تصاویر نادرست تاریخی، اقدامات ایمنی جدیدی را در نظر گرفته است:
همه تصاویر تولید یا ویرایششده دارای واترمارک قابل مشاهده و نامرئی (SynthID) خواهند بود
قوانین سختگیرانه برای جلوگیری از تولید محتوای مضر، شامل تصاویر خصوصی، اعمال شده است
این قابلیتها به تدریج برای تمام کاربران اپلیکیشن Gemini و همچنین توسعهدهندگان از طریق API گوگل در دسترس قرار خواهد گرفت.