مشکلات ChatGPT Agent؛ دستیاری که برای سفارش یک کیک یک ساعت زمان میبرد


OpenAI اخیراً از جدیدترین ابزار خود به نام «ChatGPT Agent» پرده برداری کرده است؛ ابزاری که ترکیبی از قابلیتهای تحقیقاتی و اجرایی را ارائه میدهد و وعده انجام کارهای پیچیده را بهجای کاربر میدهد. با این حال، این دستیار جدید با مشکلاتی عجیب روبرو است: برای انجام هر کار مهمی به تایید انسان نیاز دارد و در آزمایشهای اولیه، با اشتباهات فاحش و عملکردی کند، نشان داده که هنوز تا رسیدن به استقلال کامل فاصله زیادی دارد.
OpenAI این ایجنت هوشمند را با ترکیب دو ابزار قبلی خود یعنی Operator (برای انجام کارها در مرورگر) و Deep Research (برای تحقیقات چندمرحلهای) توسعه داده و در محیط ChatGPT بهطور یکپارچه ارائه کرده است. این ابزار با استفاده از یک «کامپیوتر مجازی»، میتواند وظایفی نظیر بررسی تقویم، برنامهریزی سفر، خرید آنلاین یا تهیه گزارشهای تحلیلی را برای شما انجام دهد.
چالشهای عجیب ChatGPT Agent
اگرچه قابلیتهای این ایجنت جذاب به نظر میرسد، اما یک محدودیت اساسی باعث شده تا کاربرد آن زیر سوال برود. طبق اعلام رسمی OpenAI، این ایجنت قبل از انجام هر اقدام مهم، باید از کاربر اجازه بگیرد. بدین معنی که شما نمیتوانید به سادگی یک وظیفه را به آن واگذار کنید و از پشت سیستم بلند شوید. برای هر اقدام کلیدی، از رزرو بلیط گرفته تا خرید آنلاین، نیاز به تایید و حضور شما در هر مرحله ضروری است.
طبق تحلیلهای منتشر شده توسط وایرد، این رویکرد دوگانه یک حقیقت مهم را نشان میدهد:
از دیدگاه ایمنی: این اقدام معقول به نظر میرسد. با توجه به اینکه هوش مصنوعی ممکن است دچار اشتباهات یا حملات سایبری شود، نظارت انسانی میتواند از وقوع اشتباهات مالی یا مشکلات امنیتی جلوگیری کند.
از دیدگاه کاربردی: این نیاز دائم به مداخله انسانی، هدف اصلی ابزار اتوماسیون را زیر سوال میبرد. این ایجنت در وضعیت پیچیدهای قرار دارد؛ هم از نظر قدرت قادر است کارهای زیادی انجام دهد، اما هم از آنجا که بهطور مستقل قادر به انجام آنها نیست، همچنان به مداخله انسانی وابسته است.
عملکرد ایجنت ChatGPT Agent در آزمایشها
عملکرد این دستیار هوشمند در آزمایشهای اولیه بهطور کلی ناامیدکننده بوده است. برای مثال، زمانی که از این ایجنت خواسته شد تا چند کیک فنجانی سفارش دهد، انجام این کار نزدیک به یک ساعت طول کشید. علاوه بر این، در ویدیوی معرفی محصول، زمانی که از ChatGPT Agent خواسته میشود سفری برای بازدید از تمامی استادیومهای لیگ برتر بیسبال آمریکا برنامهریزی کند، نقشهای تولید میکند که یکی از توقفگاهها را در وسط خلیج مکزیک قرار میدهد. این اشتباهات فاحش، حتی در ویدیو نادیده گرفته میشوند و نشاندهنده فاصله زیاد این فناوری با سطح مطلوب کارایی و دقت است.
دسترسی محدود به ویژگی جدید
این قابلیت جدید ابتدا به کاربران اشتراک Pro با محدودیت ۴۰۰ پرامپت در ماه ارائه میشود. کاربران اشتراکهای Plus و Team نیز بهزودی به آن دسترسی خواهند داشت، البته با محدودیت بسیار بیشتر (فقط یک دهم تعداد کاربران Pro). هنوز هیچ زمانی برای عرضه این ویژگی به کاربران رایگان اعلام نشده است.