مدلهای پرقدرتتر Gemini Pro و Gemini Ultra به گفته گوگل قدرتمندترین مدلهای زبانی بزرگ هستند که تاکنون طراحی شدهاند. گوگل برای معرفی این مدل جدید هوش مصنوعی خود از یک ویدئو استفاده کرد که شگفتی بسیاری را برانگیخت، این ویدئو نشان میداد که هوش مصنوعی «جمینای» تا چه اندازه قادر به درک عمیق و سریع اتفاقات پیش روی آن است. هرچند دو روز بعد مشخص شد که این ویدئو خیلی هم واقعی نبوده و باعث انتقادات بسیاری از گوگل شد. گوگل مدل هوش مصنوعی Gemini Pro را روی چتبات گوگل بارد فعال کرده است، اما از نظر تکنیکی آمارهای مقایسه بین مدل هوش مصنوعی گوگل در انجام کارهای مختلف نشانگر برتری محسوس گوگل در این زمینه است. مثلا در زمینه حل مسائل ریاضی مدل جمینای اولترا قادر به حل ۲/۵۳ درصد مسائل مختلف ریاضی بود. این میزان برای «۴-GPT» که قدرتمندترین نسخه چت جیپیتی به شمار میرود ۹/۵۲ درصد است. در زمینه کدنویسی هوش مصنوعی گوگل ۹/۷۴ درصد عملکرد دارد، در حالی که این میزان برای «۴-GPT» برابر با ۶۷ درصد است. در زمینه ترجمه ماشینی نیز عملکرد جمینای گوگل ۴/۷۴ درصد و چت جیپیتی ۸/۷۳ درصد است. گوگل نشان داده که مدل هوش مصنوعی جمینای اولترا این شرکت نسبتا برتری محسوس ولی نهچندان زیادی نسبت به «۴-GPT» دارد. با این حال این برتری اندک بعد از یک سال فرصت گوگل برای رقابت با چت جیپیتی به وجود آمده و مشخص نیست که گوگل چقدر میتواند این برتری اندک را حفظ کند.
گوگل «جمینای» چیست؟
جمینای یک مدل هوش مصنوعی جدید و قدرتمند از گوگل است که میتواند نه تنها متن، بلکه تصاویر، ویدئوها و صداها را نیز درک کند. به عنوان یک مدل چندوجهی، جمینای قادر به انجام وظایف پیچیدهای در حوزه ریاضیات، فیزیک و سایر زمینهها و همچنین درک و تولید کد با کیفیت بالا در زبانهای برنامهنویسی مختلف است.
در حال حاضر این هوش مصنوعی در هوش مصنوعی گوگل «بارد» و تلفن همراه هوشمند گوگل پیکسل ادغام شده است، اما به تدریج در سایر سرویسهای گوگل نیز قرار خواهد گرفت. به گفته «دنیس حسابیس» مدیرعامل و یکی از بنیانگذاران گوگل دیپمایند، جمینای نتیجه تلاشهای مشترک در مقیاس بزرگ توسط تیمهای سراسر گوگل، از جمله همکاران ما در بخش پژوهش گوگل است. این هوش مصنوعی از ابتدا با هدف چندوجهی بودن ساخته شده و این به آن معناست که میتواند موارد مختلفی را به هم تعمیم دهد و بهطور یکپارچه درک کند، کار کند و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را با هم ترکیب کند.
چه کسی «جمینای» را ساخته است؟
جمینای توسط گوگل و آلفابت که شرکت مادر گوگل است، ایجاد و به عنوان پیشرفتهترین مدل هوش مصنوعی این شرکت تا به امروز منتشر شد. گوگل دیپ مایند نیز سهم قابلتوجهی در توسعه جمینای داشته است. گوگل، «جمینای» را به عنوان یک مدل انعطافپذیر توصیف میکند که میتواند روی همه چیز از مراکز داده گوگل گرفته تا دستگاههای تلفن همراه اجرا شود. برای دستیابی به این انعطافپذیری، جمینای در سه نسخه عرضه میشود: نانوجمینای، پروجمینای و اولترا جمینای
اندازه مدل «نانو جمینای» برای اجرا روی تلفنهای همراه هوشمند، بهویژه «گوگل پیکسل ۸» طراحی شده است. این مدل برای انجام کارها روی دستگاهی که نیاز به پردازش هوش مصنوعی کارآمد بدون اتصال به سرورهای خارجی دارد، مانند ارائه پیشنهاد برای پاسخ در برنامههای چت یا خلاصه کردن متن ساخته شده است.
پرو جمینای که در مراکز داده گوگل اجرا میشود، برای تامین آخرین نسخه چتبات هوش مصنوعی این شرکت یعنی «بارد»، طراحی شده است. این هوش مصنوعی قادر به ارائه پاسخ سریع و درک سوالات پیچیده است.
اگرچه «اولترا جمینای» هنوز برای استفاده گسترده در دسترس نیست، اما گوگل آن را به عنوان تواناترین مدل خود توصیف میکند که از نتایج پیشرفته فعلی در ۳۰ معیار از ۳۲ معیار آکادمیک پرکاربرد مورد استفاده در تحقیقات و توسعه مدلهای زبانی بزرگ(LLM) فراتر رفته است. این هوش مصنوعی برای کارهای بسیار پیچیده طراحی شده و قرار است پس از اتمام مرحله آزمایشی فعلی عرضه شود.
چگونه میتوان به «جمینای» دسترسی پیدا کرد؟
جمینای اکنون در محصولات گوگل در اندازههای نانو و پرو، مانند تلفن پیکسل ۸ و چتبات بارد، در دسترس است.
گوگل قصد دارد جمینای را به مرور در موتور جستجوگر، تبلیغات، کروم و سایر سرویسهای خود ادغام کند.
توسعهدهندگان و مشتریان سازمانی از ۱۳ دسامبر میتوانند از طریق Gemini API در استودیوی هوش مصنوعی گوگل و هوش مصنوعی Google Cloud Vertex به پرو جمینای دسترسی داشته باشند.
توسعهدهندگان اندروید نیز از طریق AICore به نانوجمینای دسترسی خواهند داشت که به صورت پیشنمایش اولیه در دسترس خواهد بود.
به نظر میرسد مدل جدید جمینای گوگل یکی از بزرگترین و پیشرفتهترین مدلهای هوش مصنوعی تا به امروز باشد، اگرچه عرضه مدل اولترا حقیقت را مشخص خواهد کرد. در مقایسه با سایر مدلهای محبوبی که در حال حاضر چتباتهای هوش مصنوعی را تقویت میکنند، جمینای به دلیل ویژگی چندوجهی بومی خود متمایز است، در حالی که مدلهای دیگر، مانند «جیپیتی-۴»، برای چندوجهی بودن واقعا به اتصالات و ادغامها متکی هستند.
در مقایسه با «جیپیتی-۴» که یک مدل عمدتا مبتنی بر متن است، جمینای به راحتی وظایف چندوجهی را به صورت بومی انجام میدهد.
در حالی که «جیپیتی-۴» در کارهای مرتبط با زبان مانند ایجاد محتوا و تجزیه و تحلیل متن پیچیده به صورت بومی برتر است، برای انجام تجزیه و تحلیل تصویر و دسترسی به وب به اتصالات «اُپنایآی» متوسل میشود و برای تولید تصاویر و پردازش صدا به «۳ DALL-E» و «ویسپر» متکی است. همچنین به نظر میرسد جمینای گوگل بیشتر از سایر مدلهای موجود در حال حاضر روی محصول متمرکز باشد. این هوش مصنوعی یا در اکوسیستم شرکت ادغام شده یا برنامه این کار را دارد، زیرا به هر دو دستگاه بارد و پیکسل ۸ قدرت میبخشد. مدلهای دیگر، مانند «جیپیتی-۴» و «Meta’s Llama»، بیشتر سرویسگرا هستند و برای برنامهها، ابزارها و خدمات توسعهدهندگان مختلف شخص ثالث در دسترس قرار دارند.
با این حال هرچند «چتجیپیتی» نخستین مدل هوش مصنوعی مولد در جهان است که توانست به انقلابی در این زمینه منجر شود، اما تاریخ کسب و کارها نشان داده که نخستینها لزوما برنده نخواهند بود. نمونهای چون «نوکیا» و «بلکبری» در جهان موبایلها یکی از آنهاست که پیشگامان تلفنهای هوشمند دیگر وجود ندارند یا از آنها تنها نامی باقی مانده است.
منبع: جهان صنعت