علمی، پژوهشی و فناوری

گوگل و مایکروسافت مدل‌های زبانی جدید خود را معرفی کردند

گوگل و مایکروسافت با معرفی مدل‌های زبانی جدید Gemma ۲ ۲B و Phi-۳، دسترسی به فناوری هوش مصنوعی را برای توسعه‌دهندگان و کسب‌وکارها آسان‌تر کرده‌اند.

به گزارش پایگاه خبری علم و فناوری : گوگل برای اولین‌بار در ماه ژوئن، Gemma ۲، نسل بعدی مدل‌های زبانی منبع‌بازی را رونمایی کرد که براساس معماری جدیدی برای عملکرد و کارایی بالا طراحی شده است. پیش‌ازاین، Gemma ۲ در دو اندازه‌ی ۹ میلیارد (۹B) و ۲۷ میلیارد (۲۷B) پارامتر دردسترس بود. حالا گوگل با معرفی Gemma ۲ ۲B با ۲ میلیارد پارامتر، خانواده‌ی Gemma ۲ را گسترش داده است.

به‌نقل از نئووین، مدل Gemma ۲ ۲B جدید ادعا می‌کند که بهترین عملکرد را ارائه می‌دهد و حتی در Chatbot Arena با کسب امتیاز ۱,۱۲۶ همه‌ی مدل‌های GPT-۳.۵ را شکست داده است. این مدل با سخت‌افزارهای مختلف ازجمله کامپیوترهای شخصی و دستگاه‌های لبه تا استقرارهای ابری روی Google Cloud Vertex AI نیز به‌خوبی سازگار است.

گوگل مدل Gemma ۲ ۲B را با کتابخانه‌ی TensorRT-LLM انویدیا بهینه کرده است و توسعه‌دهندگان می‌توانند از آن به‌عنوان NIM (Nvidia Inference Microservices) انویدیا استفاده کنند.

ازآنجاکه این مدل برای کتابخانه‌ی TensorRT-LLM انویدیا بهینه شده است، روی پلتفرم‌های مختلف با استفاده از پردازنده‌های گرافیکی جی‌فورس RTX و ماژول‌های Jetson انویدیا می‌تواند اجرا شود. علاوه‌براین، Gemma ۲ ۲B با Keras و JAX و Hugging Face و NVIDIA NeMo و Ollama و Gemma.cpp و به‌زودی با MediaPipe برای توسعه‌ی آسان ادغام می‌شود.

وزن‌های مدل Gemma ۲ برای دانلود از Kaggle و Hugging Face و Vertex AI Model Garden دردسترس هستند. برخلاف مدل‌های گوگل جمنای، Gemma ۲ تحت‌مجوز تجاری دوستانه دردسترس است. گوگل همراه با Gemma ۲، مدل‌های طبقه‌بندی‌کننده‌ی محتوای ایمنی ShieldGemma و ابزار تفسیر مدل Gemma Scope را نیز معرفی کرد.

در ماه آوریل، مایکروسافت خانواده‌ی مدل‌های زبانی Phi-۳ را رونمایی کرد که به‌طور مستقیم با خانواده مدل‌های Gemma گوگل رقابت می‌کند. خانواده‌ی Phi-۳ از سه مدل تشکیل شده است:

Phi-۳-mini مدل زبانی ۳.۸B است که در دو نوع طول متن ۴K و ۱۲۸K توکن دردسترس است.

Phi-۳-Small مدل زبانی ۷B است که در دو نوع طول متن ۸K و ۱۲۸K توکن دردسترس است.

Phi-۳-medium مدل زبانی ۱۴B است که در همان دو نوع طول متن دردسترس است.

ظهور مدل‌های زبان کوچک‌تر، اما قدرتمند مانند Gemma ۲ ۲B گوگل و خانواده‌ی Phi-۳ مایکروسافت نشان‌دهنده‌ی روندی روبه‌رشد در صنعت هوش مصنوعی است. این تغییر به‌سمت مدل‌های کوچک‌تر به دسترسی و کارایی اولویت می‌دهد و امکان استقرار در طیف گسترده‌تری از دستگاه‌ها و کاهش هزینه‌های محاسباتی را فراهم می‌کند.

https://stnews.ir/short/4Aq7B
اخبار مرتبط
تبادل نظر
نام:
ایمیل: ایمیل خود را با فرمت مناسب وارد کنید
نظر: