رونمایی از مدل زبانی PaLM 2 در کنفرانس Google I/O 2023

با دوستان خود را به اشتراک بگذارید:

به گزارش ایرانی متا، اسناد داخلی مراسم I/O نشان می‌دهند گوگل قصد دارد از PaLM 2، جدیدترین و پیشرفته‌ترین مدل زبانی این شرکت،‌ رونمایی کند. PaLM 2 بیش‌ از ۱۰۰ زبان را شامل می‌شود و از مدت‌ها پیش در قالب کدنام Unified Language Model وارد مرحله‌ی آزمایشی شده است. این مدل زبانی توانایی زیادی در حوزه‌ی کدنویسی و حل مسائل ریاضی و آزمون‌های نویسندگی و تحلیل دارد.

کنفرانس Google I/O چیست؟

کنفرانس Google I/O یک کنفرانس رسمی برای توسعه دهندگان گوگل میباشد. در این کنفرانس همه توسعه دهندگان رسمی گوگل شرکت میکنند. گوگل همواره امکانات و ویژگی های جدید برای توسعه دهندگانی که از محصولات گوگل استفاده میکنند را در این کنفرانس معرفی میکند. گوگل آی/او از سال ۲۰۰۸ آغاز به کار کرده است. I و O مخفف عبارت input/output (ورودی/خروجی) و “Innovation in the Open” (نوآوری در فضای باز) می‌باشد.

هر روز از این کنفرانس مختص به معرفی مباحث خاصی میباشد. یک روز گوشی های جدید پیکسل، یک روز هوش مصنوعی و روز دیگر هم مربوط به معرفی تکنولوژی های جدید برای توسعه دهندگان گوگل و مخصوصا برنامه نویسان اندروید خواهد بود.

محصولات گوگل

سیستم عامل های اندروید و کروم، سیستم عامل جدید فیوژا، موتور جستجوی گوگل و حتی جیمیل و Drive و بسیاری دیگر از سیستم های نرم افزاری پرکاربرد، همه و همه محصولات نرم افزاری شرکت گوگل هستند. توسعه دهندگانی که بر روی سیستم عامل اندروید و زبان هایی مانند کاتلین و دارت کار میکنند، همواره به دنبال شنیدن اخبار جدید از طرف گوگل هستند. این اخبار جدید دقیقا همان چیزی است که در مراسم Google I/O بیان میشود.

مدل زبانی PaLM 2 گوگل که برای رقابت با GPT-4 بینگ چت معرفی شد هم‌اکنون در ۲۵ سرویس گوگل استفاده می‌شود و نسخه‌های مختلفی را دربرمی‌گیرد.

سوندار پیچای،‌ مدیرعامل گوگل هنگام معرفی هوش مصنوعی PalM 2 در کنفرانس Google I/O 2023، قدرت استدلال و منطق این مدل زبانی را بسیار قدرتمندتر از قبل نامید و گفت که این مدل براساس داده‌های چندزبانه متشکل از بیش از ۱۰۰ زبان آموزش دیده است.

بیشتر بخوانید  ارزش سهام اپل روز گذشته با افت ۴٫۸ درصدی روبرو شد

اسلاو پتروف، مدیر ارشد تحقیقاتی گوگل هم پیش از برگزاری کنفرانس به خبرنگاران گفت که عملکرد PaLM 2 «به طور قابل توجهی در مقایسه با PaLM 1 که در آوریل ۲۰۲۲ معرفی شد، بهبود یافته است.»

پتروف برای نشان دادن قابلیت چند‌زبانه‌ی PaLM سراغ اصطلاحات زبان آلمانی رفت. مثلا عبارت «Ich verstehe nur Bahnhof» که ترجمه‌ی تحت‌الفظی آن می‌شود «من فقط ایستگاه قطار را متوجه می‌شوم» به‌درستی به‌صورت «من متوجه نمی‌شوم چه می‌گویید» یا معادل انگلیسی آن «it’s all Greek to me» ترجمه شد.

مهندسان گوگل در مقاله‌ای پژوهشی در توصیف قابلیت‌های PaLM 2 ادعا کردند که به‌خاطر حجم چشمگیر متون غیرانگلیسی در داده‌های این مدل، مهارت زبانی‌اش «برای آموزش آن زبان» کافی است. به‌عبارت دیگر، افراد می‌توانند به‌کمک PaLM 2 به یادگیری زبان‌های خارجی بپردازند، چون این مدل قادر است درباره‌ی اصطلاحات خاص هر زبان هم توضیح دهد.

البته PaLM 2 قرار نیست صرفا یک محصول واحد باشد؛‌ بلکه قرار است خانواده‌ای از محصولات با قابلیت‌های مختلف را دربرگیرد. این سیستم در نسخه‌های مختلف برای کاربران و سازمان‌ها عرضه خواهد شد و از نظر حجم داده‌ای که براساس آن آموزش دیده، به‌ترتیب از کوچک‌ترین به بزرگ‌ترین، چهار نسخه‌ به‌نام‌های Gecko، Otter، Bison و Unicorn را شامل می‌شود.

برای مثال، یکی از نسخه‌های PaLM به‌نام «Med-PaLM 2» صرفا براساس داده‌های پزشکی آموزش دیده و به‌گفته‌ی گوگل، می‌تواند به سوالات مشابه آنچه در آزمون دریافت مجوز پزشکی ایالات متحده (USMLE) دیده می‌شود، در حد «متخصص» پاسخ دهد. البته پیش‌تر هم ChatGPT موفق شده بود با کسب میانگین نمره‌ی ۶۰ درصدی، در این آزمون قبول شود.

نسخه‌ی دیگر PaLM موسوم‌به «Sec-PaLM 2» نیز براساس داده‌های امنیت سایبری آموزش دیده و به‌گفته‌ی پتروف، می‌تواند «رفتار اسکریپت‌های مخرب را توضیح دهد و به کاربران در شناسایی کدهای حاوی بدافزار کمک کند.» هر دو مدل PaLM 2 از طریق گوگل کلاد و درمرحله‌ی اول، برای تعداد محدودی از کاربران در دسترس قرار خواهند گرفت.

بیشتر بخوانید  انجام این 12 کار را در گوشی اندرویدی خود متوقف کنید

نکته‌ی قابل‌توجه PaLM 2 این است که سبک‌ترین نسخه‌ی آن، یعنی Gecko (به‌معنی مارمولک) آنقدر کوچک است که می‌تواند روی گوشی‌های هوشمند اجرا شود و در هر ثانیه ۲۰ توکن، معادل حدودا ۱۶، ۱۷ کلمه را پردازش کند. البته گوگل نگفت این مدل را روی چه سخت‌افزاری تست کرده و صرفا به گفتن «جدیدترین گوشی‌ها» بسنده کرد.

نسخه Gecko آنقدر سبک است که روی گوشی‌های هوشمند اجرا می‌شود

درهرحال، اقدام گوگل به سبًک‌ کردن مدل‌های زبانی که کلمه‌ی «بزرگ» را با خود یدک می‌کشند، کار بسیار قابل‌توجهی است. این سیستم‌ها که درحال حاضر در فضای ابری اجرا می‌شوند، هزینه‌ی بسیار سنگینی را بردوش سازندگان می‌گذارند. درضمن، استفاده از مدل‌های زبانی به‌صورت محلی مزایای دیگری ازجمله حفظ حریم شخصی را برای کاربران به همراه دارد. فقط مشکل این مدل‌های کوچک این است که توانایی آن‌ها از مدل‌های بزرگ‌تر، محدودتر است.

اگرچه مدل زبانی PaLM 2 دستاورد بزرگی در برنامه‌های هوش مصنوعی گوگل به‌شمار می‌رود، کماکان از مشکلات متعدد مربوط به این تکنولوژی رنج می‌برد. ازجمله بحث کپی‌رایت و استفاده‌ی غیرقانونی از داده‌هایی که در اینترنت منتشر شده‌اند، بدون ذکر منبع و همچنین مشکل «هذیان‌گویی» یا همان چرندبافی مدل‌ها که همان‌طور که در مقایسه‌ی بارد با چت‌جی‌پی‌تی و بینگ چت دیدیم، چت‌بات گوگل بیشتر از رقبا به این معضل دچار می‌شود.

زوبین قهرمانی، معاون پژوهشی گوگل، در گفت‌وگویی به Verge گفت که PalM 2 به پیشرفت قابل‌توجهی نسبت به مدل‌های قبلی دست پیدا کرده، اما هنوز حوزه‌ی هوش مصنوعی برای حل معضل تولید اطلاعات نادرست «راه درازی در پیش دارد.»

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *