شنبه, ۲۲ فروردین , ۱۴۰۵ Saturday, 11 April , 2026 ساعت تعداد نوشته های امروز : 4×

تیتر اخبار آکادمی

جدول پخش مدرسه تلویزیونی دانش‌آموزان تا 27 فروردین سرانه دانش‌آموزی تا سال 1405 به بیش از 16 هزار میلیارد تومان می‌رسد اهدای بسته فرهنگی کانون پرورش فکری به کودکان آسیب‌دیده از جنگ بازدید وزیر آموزش‌وپرورش از ساختمان آسیب‌دیده شهید باهنر ابلاغ جداول درسی فنی‌وحرفه‌ای و کاردانش برای سال تحصیلی 1406-1405 دانش فضایی ایران پابرجاست/ ضرورت رعایت پدافند در احداث مکان‌های جدید دانش فضایی ایران پابرجاست/ ضرورت رعایت پدافند در احداث مکان‌های جدید برنامه درسی مدرسه تلویزیونی ایران برای شنبه 23 فروردین 1405 ملت ایران پرچمدار دفاع از حق و حقیقت در جهان است کاهش سرفاصله حرکت قطارهای مترو تهران از 22فروردین اجرای پویش فرهنگی به یاد دانش آموزان شهید میناب در تایلند مدارس تهران تا پایان فروردین غیرحضوری شد/فعالیت 50درصدی کارکنان ادارات چالش شهریه مدارس غیرانتفاعی در سال نیمه تعطیل/آموزش آنلاین،شهریه کامل؟ اعلام نحوه برگزاری ارزشیابی پایان سال تحصیلی 1405-1404 برنامه درسی مدرسه‌ تلویزیونی‌ ایران برای چهارشنبه تبیین فرهنگ ایثار و شهادت برای نسل دانش‌آموز ضروری است افزایش نیاز به خدمات روانی برای دانش‌آموزان مناطق آسیب‌دیده زمان ثبت‌نام آزمون سراسری 1405 اعلام شد اجرای طرح ملی آموزش هوش مصنوعی برای دانش‌آموزان و معلمان ٣١٢ دانش آموز و معلم تا روز سی‌ونهم جنگ شهید شدند گزارش سمپاد از فعالیت‌های دانش‌آموزان در ایام «جنگ رمضان» سرود صبحگاهی مدارس با شعری از رهبر شهید انقلاب اجرا می‌شود مستندسازی جنایت علیه دانش‌آموزان برای پیگیری حقوقی جهانی سوگواره 5 هزار دانش‌آموز در حرم رضوی به یاد شهدای میناب برنامه آموزش‌وپرورش در صورت لغو کنکور و امتحانات نهایی تمرکز آموزش‌وپرورش بر ارتقای تاب‌آوری و نشاط دانش‌آموزان بازنمایی حادثه مدرسه شجره طیبه میناب در کتاب‌های درسی شهادت 245 دانش آموز تا روز 37 جنگ/ تخریب 51 مدرسه الزام مدارس غیردولتی به اجرای کامل تعهدات آموزشی پخش برنامه‌های مدرسه تلویزیونی ایران در 16 فروردین از شبکه آموزش اعلام 14 سیاست راهبردی سازمان نوسازی مدارس برای سال 1405 راهنمای جامع 15 گانه برای برگزاری کلاس‌های غیرحضوری موفق تداوم طرح همیار سمپاد در ایام مقاومت ملی با محور عدالت آموزشی ادامه آموزش غیرحضوری با مدرسه تلویزیونی و درسنامه‌ها مدرسه‌ای که باید به یادمان تبدیل شود؛ چرا میناب نباید فراموش شود؟ اعلام برنامه درسی مدرسه تلویزیونی ایران در 15 فروردین بزرگداشت چهلم شهدای دانش‌آموز میناب در مدارس سراسر کشور مشکلى در شبکه شاد وجود ندارد زمان‌بندی جدید حضور دانش‌آموزان در برنامه شاد اعلام شد چگونه انهدام میدان گازی قطر، قلب صنعت فضایی جهان را از تپش انداخت؟ ستاد حقوق بشر خواستار پیگیری بین‌المللی فاجعه مدرسه میناب شد بیانیه سازمان سنجش در محکومیت حمله به دانشگاه‌ها و مراکز علمی امتحانات هماهنگ کشوری لغو شد/ برنامه ریزی هر استان به صورت مستقل شهادت 138 دانش‌آموز مدارس غیردولتی/ آسیب به 146مدرسه مدارس تا پایان فروردین مجازی شد عتبه مقدسه حسینیه(ع) به پویش فرشته های میناب پیوست اسکان نوروزى فرهنگیان تا زمان بازگشایى مدارس ادامه دارد ارائه سناریوهای جایگزین برای برگزاری امتحانات حضوری مدارس اعلام اولویت‌های آموزش و پرورش در شرایط جنگی عیادت معاون وزیر از دانش آموزان مجروح مدرسه میناب

«نانوبنانا» در ارائه عکس‌های واقع‌گرایانه بهتر از «چت‌جی‌پی‌تی» است
1404-10-07
شناسه : 6485
بازدید 88
14

یک مقاله جدید، قابلیت تولید تصویر دو مدل هوش مصنوعی «چت‌جی‌پی‌تی» و «نانوبنانا» را برای ایجاد عکس‌های آرشیوی با یکدیگر مقایسه کرده و برتری نانوبنانا را در ارائه عکس‌های واقع‌گرایانه، دارای ثبات و قابلیت استفاده برای متخصصان برجسته کرده است.

ارسال توسط :
پ
پ

به گزارش ایسنا، در عرصه‌ هوش مصنوعی که به سرعت تکامل می‌یابد و فناوری‌های مولد تصویر، صنایع خلاق را متحول می‌کنند، رقابت شدیدی بین قابلیت‌های تولید تصویر «چت‌جی‌پی‌تی»(ChatGPT) شرکت «اوپن‌ای‌آی»(OpenAI) و «نانوبنانا پرو»(Nano Banana Pro) شرکت «گوگل» پدید آمده است.

به گزارش وب ‌پرو نیوز، این رقابت تنها درباره تولید تصاویر زیبا نیست، بلکه درباره تولید گزینه‌های کاربردی و با کیفیت بالاست که متخصصان بازاریابی، طراحی و رسانه می‌توانند بدون نیاز به دوباره‌کاری گسترده از آنها استفاده کنند. پیشرفت‌های اخیر، نحوه مدیریت این پلتفرم‌ها را در ایجاد عکس‌های آرشیوی برجسته کرده است. در این جایگاه، واقع‌گرایی، قابلیت استفاده و پایبندی به دستورالعمل‌ها برنده را تعیین می‌کند. این بررسی عمیق با استفاده از مقایسه‌های عملی و تحلیل‌های تخصصی بررسی می‌کند که چرا یک فناوری در ارائه تصاویر آرشیوی مناسب پیشی می‌گیرد؛ در حالی که دیگری با ناسازگاری‌هایی دست‌وپنجه نرم می‌کند که پتانسیل آن را تضعیف می‌کنند.

هسته اصلی این رویارویی، تفاوت‌های اساسی در نحوه پردازش ورودی‌های کاربر و ارائه خروجی‌ها توسط هر سیستم است. چت‌جی‌پی‌تی که توسط جدیدترین مدل‌های اوپن‌ای‌آی پشتیبانی می‌شود، گام‌های بلندی را در ادغام مستقیم تولید تصویر در رابط مکالمه‌ای خود برداشته است و به کاربران امکان می‌دهد تا از طریق زبان طبیعی، تصاویر را تکرار کنند. با وجود این، آزمایش‌ها نشان می‌دهند که اگرچه چت‌جی‌پی‌تی در خلاقیت عالی است، اما اغلب در تولید تصاویر آماده استفاده که آرشیوهای عکس به آن نیاز دارند، دچار مشکل می‌شود. در مقابل، نانوبنانا پرو از الگوریتم‌های پیشرفته برای اولویت‌بندی «واقع‌گرایی عکس‌وار» یا «فوتورئالیسم»(Photorealism) و حفظ جزئیات استفاده می‌کند و این ویژگی، آن را به گزینه‌ای مناسب برای متخصصانی تبدیل می‌کند که به فناوری‌های تقلیدکننده از عکاسی سنتی نیاز دارند.

ناظران صنعت خاطرنشان می‌کنند که تلاش برای ارائه فناوری‌های مولد تصویر بهتر، حاصل تقاضای گسترده‌تر برای هوش مصنوعی است تا خلاقیت انسان را بدون جایگزینی کامل آن تقویت کند.

در قلب چت‌جی‌پی‌تی، یک مدل ارتقاءیافته وجود دارد که زمان تولید سریع‌تر -تا چهار برابر سریع‌تر از مدل‌های پیشین- و بهبود وفاداری به دستورالعمل‌های کاربر را نوید می‌دهد. براساس اطلاعات منتشرشده در پلتفرم‌های اجتماعی مانند ایکس و خبرهای اوپن‌ای‌آی از بهبودهایی با تمرکز بر عناصر سازگار مانند نورپردازی و ظاهر سوژه در ویرایش‌ها، چت‌جی‌پی‌تی با هدف یکپارچه‌سازی گردش‌های کاری طراحی شده است. با وجود این، وقتی وظیفه پردازش تصاویر آماده مانند یک صحنه شلوغ اداری یا یک منظره آرام طبیعت بر عهده چت‌جی‌پی‌تی قرار می‌گیرد، اغلب مصنوعات یا ویژگی‌های سبکی را نشان می‌دهد که به پردازش بعدی نیاز دارند.

از سوی دیگر، نانوبنانا پرو براساس چارچوب هوش مصنوعی «جمینای»(Gemini) گوگل ساخته شده و قابلیت‌های چندوجهی را در خود جای داده است که درک متن را با تولید بصری ترکیب می‌کنند. بررسی‌ها بر مهارت آن در انجام دادن ویرایش‌های پیچیده بدون ایجاد اختلال در یکپارچگی کلی تصویر تأکید دارند. این ویژگی برای ایجاد عکس‌های آرشیوی که در آنها دقت کلید اصلی به شمار می‌رود، بسیار ارزشمند است. کاربران گزارش داده‌اند که نانوبنانا می‌تواند صحنه‌های فوق‌العاده واقع‌گرایانه‌ای مانند یک محصول در پس‌زمینه خنثی را با حداقل خطاهای هشدار ایجاد کند.

مقایسه‌ها درباره سرعت و دسترسی نیز انجام شده‌اند. در حالی که چت‌جی‌پی‌تی فناوری‌های تصویری را در رابط چت خود ادغام می‌کند و آن را برای تازه‌کارها کاربرپسند می‌سازد، نانوبنانا یک ویرایشگر اختصاصی را ارائه می‌دهد که برای حرفه‌ای‌ها مناسب است. یک بررسی شامل تطبیق‌های سریع مستقیم نشان داد نانوبنانا در سناریوهایی که به کیفیت سینمایی نیاز دارند، مانند شخصیتی در یک محیط پویا، عملکرد بهتری دارد و این امر بر قابلیت اطمینان آن برای ارائه خروجی‌های حرفه‌ای تأکید می‌کند.

عکاسی آرشیوی به چیزی بیش از زیبایی‌شناسی نیاز دارد. این کار مستلزم تطبیق‌پذیری، حساسیت فرهنگی و پایبندی به استانداردهای تجاری است. آزمایش‌هایی با درخواست‌های یکسان، نتایج شگفت‌انگیزی را نشان دادند. نانوبنانا به طور مداوم تصاویری را تولید می‌کرد که نه تنها واقع‌گرایانه‌تر بودند، بلکه از نظر بازنمایی نیز متنوع‌تر بودند و از تعصباتی که گاهی اوقات در خروجی‌های چت‌جی‌پی‌تی رخنه می‌کنند، دوری می‌کردند.

برای مثال، وقتی از نانوبنانا خواسته شد تصاویری را از متخصصان گوناگون در یک اتاق هیئت‌مدیره ایجاد کند، در نمایش حالت‌ها و لباس‌های طبیعی عالی عمل کرد و صحنه‌ها را باورپذیر و فراگیر ساخت. براساس آزمایش‌های عملی گزارش‌شده در وبلاگ‌های گوناگون فناوری، اگرچه چت‌جی‌پی‌تی توانمند بود، اما گاهی اوقات ناهنجاری‌هایی را مانند نورپردازی نامناسب یا ژست‌های غیرطبیعی نشان می‌داد. این امر، نانوبنانا را برای آژانس‌هایی که به خروجی سریع و بدون تعصب نیاز دارند، در اولویت قرار می‌دهد.

علاوه بر این، گردش کار ویرایش به طور قابل توجهی متفاوت است. چت‌جی‌پی‌تی امکان تغییرات تکراری را از طریق گفت‌وگو فراهم می‌کند که نوآورانه است، اما اگر مدل دستورالعمل‌ها را اشتباه تفسیر کند، می‌تواند به بروز خطا منجر شود. رابط کاربری نانوبنانا از اصلاحات دقیق پشتیبانی می‌کند و جزئیات را در نسخه‌های گوناگون حفظ می‌کند. این قابلیت برای تکرار عکس‌هایی که در آنها ثبات بسیار مهم است، یک مزیت به شمار می‌رود.

عرصه رقابت در حال داغ شدن است و محصولات اوپن‌ای‌آی مستقیماً تسلط گوگل را به چالش می‌کشند. اگرچه گزارش شده که مدل جدید چت‌جی‌پی‌تی سریع‌تر است، اما سرعت به تنهایی تضمین‌کننده برتری در کیفیت عکس‌ نیست. به‌روزرسانی‌های «جمینای ۳» گوگل نشان‌دهنده پیشرفت‌های گسترده‌تری هستند که می‌توانند برتری نانوبنانا را بیشتر تثبیت کنند.

با گسترش فناوری‌های هوش مصنوعی، ملاحظات اخلاقی اهمیت پیدا می‌کنند. تولید عکس‌های آرشیوی باید مسائل مربوط به حق چاپ و اصالت را در نظر بگیرد؛ یعنی حوزه‌هایی که هر دو پلتفرم در حال پیشبرد حفاظت از آنها هستند. با وجود این، واقع‌گرایی برتر نانوبنانا نیاز به مداخله انسانی را کاهش می‌دهد و ممکن است آژانس‌های سنتی آرشیو عکس را مختل ‌کند.

پست‌های اوپن‌ای‌آی در پلتفرم ایکس، بهبودهایی را در پایبندی به نیت آن نشان می‌دهند، اما بازخورد جامعه نشان می‌دهند که نانوبنانا در چالش‌های بیش از حد واقع‌گرایانه پیروز است.

ادغام این فناوری‌ها در اکوسیستم‌های گسترده‌تر نیز اهمیت دارد. رویکرد مبتنی بر گفت‌وگو چت‌جی‌پی‌تی برای طوفان فکری مناسب است؛ در حالی که ویرایشگر مستقل نانوبنانا برای کاربران تخصصی جذابیت دارد. برای عکس‌های آرشیوی، دقت ویرایشگر دومی برنده است.

اخبار جدید حاکی از آن است که همکاری‌ها و به‌روزرسانی‌ها می‌توانند پویایی را تغییر دهند. با وجود این، تاکنون که به اواخر سال ۲۰۲۵ رسیده‌ایم، نانوبنانا تاج و تخت را در حوزه تولید تصاویر کاربردی در اختیار دارد.

در نهایت، این رقابت به نفع کاربران است و نوآوری‌هایی را پیش می‌برد که نقش هوش مصنوعی را در زمینه‌های خلاقانه اصلاح می‌کنند. متخصصان باید هر دو را آزمایش کنند اما در حال حاضر نانوبنانا در ارائه تصاویر آماده که به طور یکپارچه با تلاش‌های تجاری ترکیب می‌شوند، پیشتاز است.

انتهای پیام

ثبت دیدگاه علمی و آموزشی

  • دیدگاه‌های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام‌هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام‌هایی که به غیر از زبان فارسی یا غیرمرتبط باشد منتشر نخواهد شد.