شرکت Stability AI بهتازگی یک خانواده متنباز از مدلهای زبانی هوش مصنوعی را منتشر کرده است که StableLM نام دارد. این شرکت امیدوار است که با این محصول بتواند اثری شبیه به Stable Diffusion در دنیای مدلهای متنباز تصویری را تکرار کند. StableLM بهخاطر ماهیت خود میتواند برای تولید جانشینهای ChatGPT استفاده شود.
به گزارش آرستکنیکا، مدلهای StableLM درحالحاضر درحالت آلفا قرار دارند و با 3 میلیارد و 7 میلیارد پارامتر در دسترس قرار گرفتهاند. Stability AI وعده داده است که در آینده مدلهایی با 15 و 65 میلیارد پارامتر را هم عرضه میکند. این مدلها با مجوز Creative Commons BY-SA-4.0 منتشر شدهاند، بدین معنی که استفاده از آنها با اشاره به سازنده اصلی و نشر مجدد از طریق همین مجوز مجاز است.
StableLM درست مثل GPT-4، محصول شرکت OpenAI، با پیشبینی واژه بعدی در یک جمله دست به تولید متن میزند. این خانواده البته درواقع بیشتر سعی کرده است که با وجود در اختیار داشتن پارامترهای کمتر، عملکردی شبیه به GPT-3 داشته باشد. GPT-3 حدود 175 میلیارد پارامتر دارد.
این پارامترها متغیرهایی هستند که مدلهای زبانی از آنها برای آموزش دادهها استفاده میکنند. استفاده از پارامترهای کمتر میتواند به کوچکتر و بهینهترشدن مدلها کمک کند، اما اگر بخواهیم عملکردی مشابه با مدلهای بزرگتر داشته باشیم، باید آنها را با مهارت و دقت بسیار بالا مهندسی کنیم.
Stability AI میگوید StableLM را روی مجموعه تازهای از دادههای آزمایشی بر پایه مجموعه متنبازی از دادهها موسوم به The Pile آموزش داده است. این شرکت ادعا میکند که غنای این دادهها عامل اصلی عملکرد شگفتانگیز این مدل کوچک بوده است.
وبسایت آرستکنیکا میگوید در آزمایشی که با مدل 7 میلیارد پارامتری StableLM انجام داده، دریافته است که این مدل عملکردی بهتر از مدل 7 میلیارد پارامتری LLaMA شرکت متا دارد، بااینحال مدل GPT-3 احتمالاً توانمندتر و انعطافپذیرتر است.
جزئیات فنی کامل خانواده StableLM قرار است در آینده نزدیک به اشتراک گذاشته شود.
اتاق خبر سیلور شاپ
منبع: https://digiato.com/article/2023/04/25/stability-ai-released-stablelm-as-an-alternative-chatgpt