مدل هوش مصنوعی گوگل به نام Gemini، ظاهراً قادر به ترکیب قابلیتهای متنی مدلهای زبان بزرگ (LLM) و تولید تصویر هوش مصنوعی با یکدیگر خواهد بود.
زمانی که ChatGPT در سال 2022 راهاندازی شد، گوگل با اعلام یک «وضعیت فوقالعاده» و تمرکز روی توسعه محصولات هوش مصنوعی، به جنگ این چتبات رفت. از آن زمان تاکنون، غول فناوری از چندین پیشرفت در زمینه هوش مصنوعی رونمایی کرده است و چتبات خود که Bard نام دارد را برای رقابت با ChatGPT عرضه کرد. اکنون در گزارش جدیدی گفته شده که بزرگترین محصول هوش مصنوعی این شرکت پاییز امسال با همکاری دیپمایند عرضه خواهد شد.
براساس اطلاعاتی که توسط The Information به اشتراک گذاشته شده است، گوگل در این مدل که Gemini نام دارد، ظاهراً قابلیتهای متنی مدلهای زبان بزرگ (LLM) و تولید تصویر هوش مصنوعی را با یکدیگر ترکیب میکند تا یک محصول چند منظوره به مشتریان خود ارائه کند. بنابراین، Gemini علاوه بر اینکه مانند ChatGPT قابلیت تولید متن داشته باشد، میتواند تصاویر وابسته به متن نیز تولید کند.
با این وجود، گوگل قصد دارد ویژگیهای دیگری را نیز به مدل خود اضافه کند. بهعنوان مثال، ممکن است در نهایت با Gemini بتوانید نمودارهای را تجزیه و تحلیل کنید یا با کمک صدای خود کنترل یک نرمافزار را به دست بگیرید.
با توجه به قابلیتهای گستردهای که گوگل در نظر دارد، احتمالاً Gemini به محصولات آن از جمله برنامههای سازمانی مانند Google Docs اضافه خواهد شد. البته این منبع ادعا کرده که توسعهدهندگان برای دسترسی به Gemini با هزینهای را از طریق واحد اجاره سرور Google Cloud پرداخت کنند.
همکاری گوگل و DeepMind در توسعه هوش مصنوعی Gemini
نکته قابل توجه دیگر اینکه چندین عضو سابق از تیمهای Google Brain و DeepMind روی این مدل کار میکنند که از جمله آنها میتوان به «پل برهام»، محقق ارشد گوگل و «تام هنیگان» از DeepMind اشاره کرد. ماه گذشته هم گفته شده بود که «سرگئی برین»، یکی از بنیانگذاران گوگل نیز روی این پروژه مشغول به کار است.
گوگل تا پایان سال Gemini را معرفی خواهد کرد و در آن زمان جزئیات بیشتری درباره این مدل هوش مصنوعی ارائه خواهد شد. با این وجود، گفته شده که غول فناوری احتمالاً تا قبل از آن شروع به استفاده از محصولات مبتنی بر Gemini خواهد کرد.
منبع: دیجیاتو