استارتآپ Stability AI که با معرفی مدل مبتنی بر هوش مصنوعی Stable Diffusion به شهرت رسید و توانست در زمینه تبدیل متن به تصویر نزدیک به واقعیت پیشرفتهای چشمگیر ایجاد کند، اکنون از یک مدل سبک و سریعتر به نام Stable Cascade رونمایی کرده است. این مدل جدید هم اکنون در GitHub برای امور تحقیقاتی در دسترس قرار دارد.
Stability AI به تازگی از یک مدل مبتنی بر هوش مصنوعی جدید به نام Stable Cascade رونمایی کرده و مدعی شده که این ابزار میتواند بسیار سریعتر و قدرتمندتر از مدل پیشین این استارتآپ یعنی Stable Diffusion عمل کند.
به یاد داشته باشید که Stable Diffusion به عنوان یکی از اولین ابزارهای مبتنی بر هوش مصنوعی برای تولید تصویر از متن شناخته میشود.
مدل هوش مصنوعی Stable Cascade از راه رسید
Stable Cascade علاوه بر قابلیت تولید تصویر که اصلیترین ویژگی آن محسوب میشود، تواناییهای دیگری همچون ایجاد تغییر بر روی تصویر از جمله افزایش وضوح یا رزولوشن تصویر را هم دارد.
از جمله سایر ویژگیهای این مدل تبدیل متن به تصویر جدید Stability AI میتوان به قابلیت ویرایش قسمت خاصی از یک تصویر یا ساخت تصویر جدید بر اساس لبههای تصویر مورد نظر کاربر (canny edge) اشاره کرد.
به گزارش MSN، این مدل پس از ساخت چندین تصویر گوناگون از متن ارائه شده توسط کاربر و ادغام آنها میتواند بهترین گزینه را تولید کند. در حال حاضر Stable Cascade در پلتفرم GitHub برای محققان در دسترس قرار گرفته، با این حال امکان استفاده تجاری از آن وجود ندارد.
در همین رابطه بخوانید:
– طبیعی ترین تصاویر ساخته شده توسط هوش مصنوعی را ببینید [تماشا کنید]
– هوش مصنوعی Stable Video Diffusion عرضه شد؛ عکس بدهید ویدیو بگیرید (+لینک ثبت نام)
همانطور که Stability AI در بیانیه خود توضیح داده، این مدل جدید برخلاف مدل پرچمدار Stable Diffusion چندان بزرگ نیست؛ به عبارت دیگر، Stable Cascade از ترکیب سه مدل مختلف بر اساس معماری Würstchen ایجاد شده است.
نکته جالب آن است که Stable Cascade برخلاف مدلهای رایج تولید تصویر از روی متن، میتواند این فرایند را در کمتر از 10 ثانیه انجام دهد. مدلهای معمولی چیزی حدود 20 تا 25 ثانیه زمان برای انجام این کار نیاز دارند.