مدلهای هوش مصنوعی زیادی برای تولید عکس از دستورات متنی توسعه یافتهاند که در این مطلب میخواهیم شما را با بهترینها آشنا کنیم.
به گزارش دیجیاتو، مدلهای هوش مصنوعی مولد با تواناییهای مختلف بهسرعت درحال تبدیلشدن به ابزارهای متداول برای بهرهمندی عموم مردم از تواناییهای AI هستند. این مدلها قابلیتهای شگفتانگیزی مثل نوشتن مقاله و ایمیل، پاسخ به سؤالات کاربران و حتی تولید عکس براساس متن را دارند و تواناییهای خود در این زمینهها را کاملاً ثابت کردهاند. در این مطلب قصد داریم مهمترین مدلهای هوش مصنوعی مولد تولیدکننده عکس را که درحالحاضر در دسترس عموم مردم هستند، معرفی کنیم.
مدلهای هوش مصنوعی مولد عکس در اینترنت بسیار محبوب شدهاند و حتی برخی از عکسهای تولیدشده توسط آنها برترین جوایز در حوزه عکاسی را هم دریافت کردهاند. برای ایجاد تصاویری زیبا با این مدلها لازم نیست هنرمند یا عکاسی بااستعداد باشید. اگر قبلاً از چت باتهای هوش مصنوعی مثل ChatGPT یا بینگ استفاده کرده باشید، از ابزارهایی که در ادامه معرفی خواهیم کرد نیز میتوانید بهراحتی استفاده کنید تا تصاویری خارقالعاده بسازید.
برای استفاده از ابزارهای AI مولد تولیدکننده عکس تنها کافی است عکسی را که میخواهید تحویل بگیرید، با جزئیات و ظرافتهایی که در ذهنتان است، با متن توصیف کنید؛ مثل توصیف یک صحنه.
بهترین مدلهای هوش مصنوعی مولد تولیدکننده عکس
در این بخش بهترین نمونههای این مدلها را معرفی خواهیم کرد؛ از رایگان تا پولی و از ساده تا پیچیده. نحوه کار و ویژگیهای این مدلهای AI متفاوت است؛ بنابراین حتی اگر متن ورودی آنها یکسان باشد، خروجی آنها متفاوت خواهد بود.
بهترین مدلهای هوش مصنوعی مولد تولیدکننده عکس به شرح زیر هستند:
Midjourney
DALL-E
Stable Diffusion Online
DreamStudio
Bing Image Creator
اگرچه Midjourney نخستین ابزار AI مولد ایجادشده برای تولید عکس نیست، اما اکنون بیشتر افراد آن را به چند دلیل برای این کار انتخاب میکنند. نخست آنکه نسخه پنجم (V۵) این مدل از مدلهای مشابه پیشی گرفته است. در برخی از موارد تصاویر خروجی این مدل بسیار واقعی هستند؛ البته اشتباهاتی در خروجیها دیده میشوند که بهدلیل بهرهمندی این ابزار از هوش مصنوعی طبیعی است.
دسترسی به Midjourney برخلاف بسیاری از مدلهای فهرست، ما از طریق اپلیکیشن یا وبسایت امکانپذیر نیست و برای استفاده از آن باید از اپلیکیشن چتبات دیسکورد که معمولاً در انجمنهای گیمینگ بهکار گرفته میشود، استفاده کنید؛ البته این موضوع عیب بدی نیست و حتی میتوان آن را به چشم یک مزیت دید؛ زیرا دیسکورد روی تمام پلتفرمهای مطرح ازجمله مرورگرها اجرا میشود.
برای استفاده از Midjourney تنها باید یک اکانت بسازید و پس از پیوستن به سرور Midjourney Discord و قبول شرایط، کار خود را شروع کنید. استفاده از این مدل در هر دو حالت رایگان و پولی امکانپذیر است. در ابتدا میتوانید برای امتحان، تقریباً ۲۵ عکس را در مدتزمان رایگان تولید کنید؛ البته حالت رایگان در مواقع اوج ترافیک مدل غیرفعال میشود.
ارزانترین روش استفاده از Midjourney پرداخت اشتراک ماهانه ۱۰ دلاری است و اگر اشتراک کامل یک سال را پرداخت کنید، هزینه استفاده از آن کمی کاهش مییابد؛ البته در حالت پولی هم تعداد عکسهای قابل تولید به حدود ۲۰۰ عکس در ماه محدود شده است.
در Midjourney میتوانید عکس موردنظرتان را تنها با چند کلمه یا حتی چند اموجی توصیف کنید. عملکرد این مدل در ایجاد عکس با پارامترهای موردنظر، عالی است؛ مثلاً میتوانید با تایپ عبارت --ar تصویری با نسبت تصویر ۱۶:۹ و با نوشتن --niji تصاویری با سبک انیمه تحویل بگیرید.
این ابزار AI در سال ۲۰۲۱ منتشر و به نخستین مدل هوش مصنوعی مولد مورد استقبال عموم مردم تبدیل شد. نسخه جدید این مدل، یعنی DALL-E ۲ بهدلیل توانایی بهتر در درک زبان طبیعی و ارائه تصاویر باکیفیتتر، از سطح بالاتری برخوردار است. این نسخه جدید توانایی ویرایش تصاویر خروجی را دارد؛ بنابراین میتوانید عناصر موجود در تصاویر را جایگزین یا عناصر جدیدی به آنها اضافه کنید.
DALL-E محصول OpenAI، شرکت سازنده ChatGPT است. این شرکت از مدل زبانی بزرگ GPT-۳ بهعنوان پایه و اساس DALL-E استفاده کرده که توضیح میدهد DALL-E چگونه متون واردشده توسط کاربر را میفهمد.
استفاده از این مدل AI کاملاً ساده و راحت و تنها نیازمند ایجاد یک اکانت OpenAI است. اگر قبلاً از ChatGPT استفاده کرده باشید، این اکانت را دارید. پس از ورود، تنها کافی است متن خود را در کادر متن بنویسید و دکمه Generate را بزنید.
پس از ایجاد هر تصویر یک اعتبار مصرف خواهد شد؛ متأسفانه DALL-E از آوریل ۲۰۲۳ دیگر رایگان نیست و اگر اکنون بخواهید اکانت بسازید، باید اعتبار بخرید. در هر بار خرید اعتبار باید ۱۵ دلار پرداخت کنید که معادل ۱۱۵ اعتبار است؛ یعنی هزینه هر بار تولید عکس با این مدل هوش مصنوعی در حدود ۱۳ سنت است که برای یکی از بهترین مدلهای AI مولد عکس هزینه بدی نیست؛ البته استفاده رایگان از DALL-E از طریق چت بات AI بینگ چت مایکروسافت هنوز هم امکانپذیر است.
این ابزار برخلاف سایر مدلهای فهرست، کاملاً رایگان و متنباز است. اگر کامپیوتر قوی با کارت گرافیک مجزا داشته باشید، میتوانید آن را دانلود و خودتان اجرا کنید. چنانچه کارت گرافیکی ۸ گیگابایتی داشته باشید، میتوانید از این ابزار بهصورت کاملاً آفلاین نیز استفاده کنید؛ البته بسیاری از کامپیوترهای غیر گیمینگ و کامپیوترهایی که برای کارهای گرافیکی ایجاد نشدهاند، چنین کارت گرافیک قدرتمندی ندارند.
استفاده از Stable Diffusion واقعاً راحت است و برای انجام این کار تنها باید به وبسایت Stable Diffusion Online مراجعه و متن خود را وارد کنید؛ دیگر از این راحتتر نمیشود! برای استفاده از این مدل نیازی به ساخت اکانت ندارید و تصاویر تولیدشده ذخیره و برای دیگران قابل مشاهده میشوند. اگر میخواهید حریم خصوصیتان تا بیشترین میزان ممکن حفظ شود، باید این ابزار را روی کامپیوتر خود اجرا کنید. مشاهده سابقه (هیستوری) تصاویر ایجادشده برای شما امکانپذیر نیست؛ اما امکان جستجو در میان متون واردشده در وبسایت و خروجیهای آنها فراهم شده است؛ بنابراین اگر ایدهای ندارید، میتوانید از متون واردشده الهام بگیرید.
اگرچه Stable Diffusion بهعنوان یک سرویس رایگان بهاندازه کافی خوب است، اما ویژگیهای آن کامل نیست؛ مثلاً سفارشیسازی کردن اندازه تصاویر یا ویرایش تصاویر پس از ایجاد آنها در این ابزار امکانپذیر نیست؛ اما خوشبختانه Stability AI، شرکت سازنده Stable Diffusion، با ارائه DreamStudio این مشکل را برطرف کرده است.
DreamStudio مانند یک اپلیکیشن مرتب با تعداد زیادی دکمه و صفحه اعداد است. امکان تولید همزمان چند عکس، تغییر نسبت تصویر، حذف عناصر خاص در شاهکارهای تولیدشده توسط هوش مصنوعی و... در این مدل AI فراهم شده. DreamStudio سبکهای متفاوتی را نیز پیشنهاد میدهد؛ از سبک فتورئالیسم گرفته تا اوریگامی و سبک شبیه به تصاویر کتابهای کمیک.
افزودن عناصر به تصاویر تولیدشده با هوش مصنوعی یا حذف عناصر از این تصاویر با استفاده از تب Edit امکانپذیر است؛ مثلاً میتوانید با ابزار پاککن بخشهای موردنظر خود را پاک کنید و سپس با نوشتن متن موردنظر خود، بخش پاکشده را پر کنید.
البته استفاده از DreamStudio برخلاف Stable Diffusion رایگان نیست؛ اما در هنگام ایجاد اکانت و ورود به آن میتوانید از ۲۵ اعتبار رایگان استفاده و با آنها ۱۲۵ تصویر ایجاد کنید. با حداقل اشتراک ۱۰ دلاری میتوانید ۱۰۰۰ اعتبار دریافت و ۵۰۰۰ تصویر ایجاد کنید.
موتور جستجوی بینگ مایکروسافت مدت کوتاهی پس از انتشار ChatGPT دارای حالت جدید چت شد. مدتی بعد مایکروسافت با افزودن یک ابزار هوش مصنوعی مولد تولیدکننده عکس، تواناییهای موتور جستجوی خود را افزایش داد. درحالحاضر این ابزار با نام Bing Image Creator دارای یک صفحه اختصاصی همراه با ایده برای خلق عکس و دستورالعملهای استفاده از آن است.
مایکروسافت و OpenAI همکاری نزدیکی با یکدیگر دارند و به همین دلیل این شرکت ابزار AI تولیدکننده عکس خود را بر پایه DALL-E ایجاد کرده است. اگر روی یکی از این پلتفرمها اعتبار رایگان داشته باشید، میتوانید بهراحتی به پلتفرم دیگر سوئیچ کنید.
زمانی که وارد اکانت مایکروسافت میشوید، Bing Image Creator بهصورت خودکار ۱۰۰ اعتبار رایگان که بوست (boost) نام دارند، به شما میدهد که با آنها میتوانید تصاویر دلخواه خود را تقریباً بهصورت آنی ایجاد کنید. بوستها هر هفته بهصورت خودکار شارژ میشوند و درحالحاضر خرید اعتبارهای بیشتر با پرداخت هزینه امکانپذیر نیست؛ بنابراین اگر اعتبارهای شما زودتر از یک هفته تمام شد، باید تا زمان مقرر صبر کنید. بههرحال شما اکنون هیچ محدودیتی برای ایجاد عکس بهصورت رایگان با Bing Image Creator وجود ندارد.
دسترسی به این ابزار هوش مصنوعی از طریق Bing Chat حتی روی پلتفرم موبایل نیز امکانپذیر است. برای استفاده از هوش مصنوعی مولد عکس مایکروسافت از این طریق تنها کافی است حالت Creative mode را انتخاب و متن خود را با عبارت «Generate an image of» آغاز کنید. درصورت استفاده از Bing Image Creator با این روش، در روز میتوانید تا ۲۰۰ عکس ایجاد کنید؛ درست مانند محدودیتی که برای استفاده از چتبات هوش مصنوعی بینگ چت وجود دارد.
چنانچه از یکی از مدلهای هوش مصنوعی معرفیشده استفاده کردهاید، نظرات خود در مورد آنها را با مخاطبین دیجیاتو در میان بگذارید و بگویید از نظر شما کدام یک از این ابزارها برای تولید عکس با AI بهتر هستند.