مجله خبری سرمایه گذاری اهرم
Loading...

نتایج جستجو

بازگشت
بازگشت

گوگل مدل ویرایش تصویر Nano Banana را به Gemini اضافه کرد؛ رقیبی برای فتوشاپ

گوگل مدل ویرایش تصویر Nano Banana را به Gemini اضافه کرد؛ رقیبی برای فتوشاپ
نوشته شده توسط رهام بخشائي
|
۰۵ شهریور، ۱۴۰۴

گوگل از ارتقای بزرگ و قدرتمندی برای قابلیت ویرایش تصویر Gemini رونمایی کرد. این به‌روزرسانی مبتنی بر مدلی به نام Nano Banana است که به کاربران امکان کنترل دقیق‌تر روی ویرایش تصاویر را می‌دهد و مشکل قدیمی حفظ ثبات چهره و جزئیات سوژه در ویرایش‌های متوالی را حل می‌کند.

 

مدل Gemini 2.5 Flash Image و ویژگی‌های Nano Banana

براساس گزارش TechCrunch، مدل جدید که با نام رسمی Gemini 2.5 Flash Image شناخته می‌شود، پیش‌تر به‌صورت ناشناس تحت عنوان Nano Banana در پلتفرم ارزیابی هوش مصنوعی LMArena ظاهر شده بود و با عملکرد فوق‌العاده خود کاربران و کارشناسان را شگفت‌زده کرد. گوگل تأیید کرده که همین مدل اکنون در حال اضافه شدن به Gemini است.
تمرکز اصلی این ارتقا روی ثبات شخصیت‌ها در تصاویر است؛ کاربران می‌توانند تصاویر دوستان، خانواده یا حیوانات خانگی خود را ویرایش کنند و مطمئن باشند که چهره و ظاهر آن‌ها در ویرایش‌های مختلف (تغییر مدل مو، لباس یا حتی کل صحنه) ثابت و واقعی باقی می‌ماند.

 

قابلیت‌های پیشرفته ویرایش

امکان بارگذاری چندین تصویر و ترکیب آن‌ها در یک صحنه جدید و منسجم
اعمال سبک بصری یک تصویر (مثل طرح گل) روی شیء دیگر در تصویر
ویرایش مرحله‌به‌مرحله اجزای مختلف تصویر بدون از بین رفتن تغییرات قبلی

 

رقابت با OpenAI

این به‌روزرسانی در شرایطی عرضه شده که بازار هوش مصنوعی تصویرسازی رقابتی شدید دارد. پس از موفقیت OpenAI با ابزارهای تصویرسازی ChatGPT، گوگل تلاش می‌کند با ارائه ابزارهای قدرتمندتر فاصله را کاهش دهد. در حال حاضر، ChatGPT بیش از ۷۰۰ میلیون کاربر هفتگی دارد، در حالی که Gemini ۴۵۰ میلیون کاربر ماهانه ثبت کرده است.

 

تدابیر امنیتی و ایمنی

گوگل با درس گرفتن از مشکلات گذشته، مانند تولید تصاویر نادرست تاریخی، اقدامات ایمنی جدیدی را در نظر گرفته است:
همه تصاویر تولید یا ویرایش‌شده دارای واترمارک قابل مشاهده و نامرئی (SynthID) خواهند بود
قوانین سخت‌گیرانه برای جلوگیری از تولید محتوای مضر، شامل تصاویر خصوصی، اعمال شده است
این قابلیت‌ها به تدریج برای تمام کاربران اپلیکیشن Gemini و همچنین توسعه‌دهندگان از طریق API گوگل در دسترس قرار خواهد گرفت.

اشتراک گذاری:
کپی شد