بر اساس گزارش تککرانچ، دیپمایند مشغول استفاده از تکنیکهای آلفاگو است. آلفاگو سیستم هوش مصنوعی دیپمایند است که توانست برای اولینبار یک بازیکن حرفهای را در بازی تختهای Go شکست دهد. از آلفاگو برای ساخت چتباتی به نام Gemini استفاده شده است.
دمیس هاسابیس، مدیرعامل دیپمایند، میگوید اگر همهچیز طبق برنامه پیش برود Gemini خواهد توانست مسائل را برنامهریزی یا حل کند و سراغ تجزیهوتحلیل متن برود. به گفتهی هاسابیس Gemini برخی از تواناییهای سیستمهای نوع آلفاگو را با قابلیتهای مدلهای زبانی بزرگ ترکیب میکند: «ما همچنین برخی نوآوریهای جدید داریم که قرار است بسیار جالب باشند.»
بر اساس گفتهی مدیرعامل دیپمایند، Gemini از فناوری یادگیری تقویتی (Reinforcement Learning) بهره میگیرد تا کارهایی را که مدلهای زبانی امروزی به سختی انجام میدهند به سادگی پردازش کند.
یادگیری تقویتی به پیشرفتهایی در حوزهی مدلهای زبانی منتهی شده است و در نحوهی پاسخدهی سیستمهایی مثل ChatGPT نقش کلیدی دارد. دیپمایند که تجربهی بلندمدتی در زمینهی یادگیری تقویتی دارد میخواهد آموختههایش را به حوزهی هوش مصنوعی مولد تزریق کند.
منبع: زومیت