تصور کنید به صدای جیرجیر سوسکها یا جیکجیک پرندگان گوش میدهید و بعد به سادگی تلفن خود را بیرون می آورید و آنچه را که آنها به یکدیگر میگویند به زبان انسان گوش میدهید. سپس خود را در حال رفتن به یک سافاری در آفریقا و دنبال کردن مکالمه بین یک جفت فیل تصور کنید. فکر میکنید این چیزها دور از ذهن، برای قصهها و معجزهها است؟ پس کمی صبر کنید، این در واقع بخشی از آینده فناوری است که پروژه گونههای زمین (Earth Species Project (ESP)) میخواهد خلق کند.
ESP یک سازمان غیرانتفاعی است که توسط مؤسس آزمایشگاه موزیلا، آزا راسکین و بریت سلویتل، یکی از اعضای تیم مؤسس توییتر، تأسیس شده است و تلاشهای خود را به سمت رمزگشایی ارتباطات غیرانسانی با استفاده از هوش مصنوعی (AI) هدایت میکند.
درک درونیترین افکار گربهتان جذاب به نظر میرسد. اما مزایای درک حیوانات بسیار فراتر از گوشدادن به مکالمه بین سگ شما و دوستان در هنگام پیادهروی است. در واقع، توانایی رمزگشایی ارتباطات حیوانات پیامدهای مستقیمی برای حفاظت از سیاره زمین دارد.
رمزگشایی ارتباطات حیوانات میتواند به توسعه ابزارهایی منجر شود که به تحقیقات حفاظتی با روشهای غیرتهاجمی کمک میکنند. دانشمندان میتوانند از نحوه ارتباط حیوانات درون یک گونه و همچنین نحوه شکار، غذا خوردن، ایجاد روابط با یکدیگر و نحوه دیدن و پردازش دنیای اطراف آنها اطلاعات به دست آورند و از این اطلاعات در راستای بهبود محیطزیست استفاده کنند.
آیا یک گربه وحشی میفهمد که انسان واقعاً چیست؟ آیا حافظه یک فیل میتواند آن را قادر سازد تا داستان و تجربه خود را از نسلی به نسل دیگر منتقل کند؟
از طریق تکنیکهای یادگیری ماشینی میتوانیم قدرت رمزگشایی دادههای بیو آکوستیک جمعآوریشده و ترجمه آنها را به زبانهای طبیعی انسانی به دست آوریم. این اطلاعات را میتوان برای امور حفاظت محیط زیستی و تحقیقات علمی در مورد گونههای مختلف جانوری برای ارزیابی جمعیت حیاتوحش به کار گرفت.
اما هر چقدر این کار عجیب، خاص و نوآورانه است، آسان هم نیست! بسیاری از این تحقیقات مبتنی بر مدلهای زبان بزرگ است، دقیقاً شبیه مدلهایی که برای تقویت Google Bard و ChatGPT استفاده میشوند. این ابزارهای مولد هوش مصنوعی تسلط زیادی بر زبان انسان دارند، زیرا به لطف یادگیری ماشینی میتوانند پاسخهایی را به زبانهای مختلف، با سبکها و زمینههای مختلف، درک کرده و ایجاد کنند.
خب این مدلها چطور آموزش دیدهاند؟ با حجم از عظیم از دادههای بشری که فهم مشخصی در رابطه با آنها وجود دارد. این مدلها ورودیهای مختلفی را برای درک روابط و ارتباطات بین کلمات و معانی آنها یاد میگیرند. اساساً مقدار زیادی متن و داده از منابع مختلف، از جمله وبسایتها، کتابها، مطالعات و غیره به آنها داده میشود.
در مرحله بعد این مدلهای زبانی در معرض مربیان انسانی قرار میگیرند که با آنها گفتگو میکنند تا مفاهیم مختلف را یاد بگیرند و حتی زمینههای مختلف را درک کنند. در این تمرینها مدلهای زبانی یاد میگیرند احساسات انسانی چیست، چگونه کار میکنند و چگونه از طریق زبان بیان میشوند.
به این ترتیب شما میتوانید از ChatGPT بخواهید که در یک مکالمه همدلی بیشتری داشته باشد و آن را ادامه دهید. این ربات هوش مصنوعی ذاتاً قادر به احساس همدلی نیست، اما میتواند آن را بر اساس دادههای پیشین خود تقلید کند.
زبان برای انسان سیستمی از کلمات و اصوات است که اگرچه در هر منطقه متفاوت است، اما ارتباط بین مردم را امکانپذیر میکند. از آنجایی که هوش مصنوعی از هوش انسان زاده شده است، ایجاد یک مدل مصنوعی که بتواند زبان طبیعی را پردازش کند بسیار آسانتر از انجام همین کار برای ارتباطات حیوانات است.
بزرگترین چالشی که ESP در تلاش برای رمزگشایی ارتباطات حیوانات با آن مواجه است، فقدان چنین دادههای اساسی و مهمی است. هیچ زبان نوشتاری حیوانی برای آموزش مدل وجود ندارد. علاوه بر این، فرمتهای ارتباطی متفاوت بین گونهها چالش دیگری را ایجاد میکند.
ESP در حال جمعآوری اطلاعات از حیوانات وحشی و اسیر در سراسر جهان است. محققان در حال ضبط ویدئو و صداها و اضافهکردن حاشیهنویسی از زیستشناسان برای درک زمینه اصوات توسط هوش مصنوعی هستند. این دادهها اولین گامها برای ایجاد مدلهای پایه برای طیف وسیعی از گونههای جانوری هستند.
از سوی دیگر اینترنت اشیا افزایش مجموعه دادههای سبکهای مختلف ارتباطی بین حیوانات را آسانتر میکند. تنوع زیاد دوربینهای ارزان قیمت، دستگاههای ضبط و بیولوژیگرها به این معنی است که دانشمندان میتوانند دادهها را از دور جمعآوری، آماده و تجزیهوتحلیل کنند. سپس این دادهها را میتوان با هم جمع کرد و با ابزارهای هوش مصنوعی تجزیهوتحلیل کرد تا معنای رفتارهای مختلف و اشکال ارتباطی رمزگشایی شوند.
راسکین یکی از بنیانگذاران ESP معتقد است که خلق فناوری مورد نیاز برای ایجاد صداهای مولد و جدید حیوانات نزدیک است و میگوید: ما فکر میکنیم که در 12 تا 36 ماه آینده، احتمالاً قادر خواهیم بود این کار را برای ارتباطات با حیوانات انجام دهیم.
راسکین به گوگل میگوید: میتوانید تصور کنید که میتوانیم یک نهنگ یا کلاغ مصنوعی بسازیم که با نهنگ یا کلاغ به گونهای صحبت کند که نتوانند تشخیص دهند که این موجود حیوان مصنوعی نیست؟ پیچیدگی داستان این جا است که ممکن است بتوانیم قبل از اینکه بفهمیم چه میگوییم، وارد گفتگو با حیوانات شویم.