Google’ın yapay zeka araştırma laboratuvarı DeepMind, sağlık uygulamaları için tasarlanan Med-Gemini gelişmiş büyük dil modelinin ayrıntılarını duyurdu.
Yapay zeka modelleri hâlâ araştırma aşamasında, ancak geliştiriciler, Google Gemini modelini temel alan Med-Gemini’nin OpenAI’nin GPT-4 gibi rakip modellerden daha iyi performans gösterdiğini, klinik teşhis alanında muazzam bir potansiyele sahip olduğunu ve endüstri standartlarını 14 popüler profil karşılaştırmasıyla aştığını iddia ediyor . Özellikle MedQA (USMLE) kıyaslamasında Med-Gemini modeli, belirsizliğe dayalı bir arama stratejisi kullanarak %91,1’lik bir doğruluk elde ederek Google’ın tıbbi LLM Med-PaLM 2’sini %4,5 oranında geride bıraktı. Modeller aynı zamanda tıbbi metinleri özetleme ve önerilerde bulunma konusunda da insanlardan daha iyi performans gösterdi; doktorlar Med-Gemini-M 1.0’ın yanıtlarını yarı yarıya iyi veya uzmanların yanıtlarından daha iyi olarak değerlendirdi.
Med-Gemini, her birinin kendi amacı olan büyük multimodal modellerden (LMM’ler) oluşan bir ailedir. Med-Gemini , “belirsizlik altında optimum klinik akıl yürütme sergileyen” ve önyargılardan muzdarip olan büyük dil modellerinin aksine , GPT-4 de dahil olmak üzere rakiplerinden “karmaşık klinik akıl yürütme görevleri için daha doğru, güvenilir ve ayrıntılı sonuçlar” üretir. diyor Google
New England Journal of Medicine (NEJM) görüntüleme de dahil olmak üzere yedi multimodal kıyaslamada Med-Gemini modeli GPT-4’ten önemli ölçüde daha iyi performans gösterdi.
Med-Gemini’nin uzun biçimli bağlamsal tıbbi bilgileri anlama ve mantık yürütme yeteneğini test etmek için araştırmacılar , halka açık büyük Yoğun Bakım Tıbbi Bilgi Pazarı’nı (MIMIC-III) kullanarak “samanlıkta iğne” adı verilen bir görevi başarıyla gerçekleştirdiler. Yoğun bakım ünitesine kabul edilen hastaların sağlık durumuna ilişkin anonimleştirilmiş verileri içeren veri tabanı kullanıldı.
Google, Med-Gemini’nin Elektronik Sağlık Kaydı (EHR) veritabanında etkili arama desteğinin “büyük miktarda hasta verisinden kritik bilgileri verimli bir şekilde çıkarıp analiz ederek bilişsel yükü önemli ölçüde azaltacağını ve doktorları güçlendireceğini” söylüyor.
Araştırmacılara göre Med-Gemini ayrıca tıbbi testler, tıbbi bilgi, klinik akıl yürütme, genomik, tıbbi görüntüleme, tıbbi kayıtlar ve video konularında da iyi performans gösteriyor.
Ancak Google, modellerinin sağlık hizmetlerinde kullanılmadan önce daha fazla ayrıntıya ve uzmanlığa ihtiyacı olduğunu söyledi.