ChatGPT’nin sohbete dayalı yapay zeka botu anı yakalar ve yazma, web’de arama yapma ve kendi başımıza öğrenme şeklimizi değiştirmeyi vaat eder.
ChatGPT’nin son başarısı? ABD Tıbbi Ruhsatlandırma Sınavını (USMLE) neredeyse geçti. Zor olduğu bilinen bir sınavdan bahsediyoruz, tamamlanması tipik olarak 300 ila 400 saat süren ve temel bilimden biyoetiğe kadar her şeyi kapsayan bir sınav.
USMLE gerçekten bir sınavda üç sınavdır ve ChatGPT’nin sorularını yanıtlayabilme becerisi, bu AI botlarının bir gün tıp eğitimi ve hatta bazı teşhis türleri için yararlı olabileceğini göstermektedir. Araştırmacılar, yayınlanan makalede “ChatGPT, üç sınavı da eşikte veya yakınında özel bir eğitim veya takviye olmadan geçti” diye yazdı. “Ayrıca, ChatGPT açıklamaları konusunda yüksek düzeyde anlaşma ve anlayış gösterdi.”
ChatGPT, büyük dil modeli veya LLM olarak bilinen bir tür yapay zekadır. Bu LLM’ler özellikle yazılı yanıtlar için tasarlanmıştır ve büyük miktarda metin örneği ve bazı akıllı algoritmalarla, büyük ağabeyinizin telefonunuzdaki OCR’si gibi, bir cümlede hangi kelimelerin bir araya gelmesi gerektiğine dair tahminler yapabilirler. Biraz fazla basitleştirildi, ancak fikri anladınız: ChatGPT gerçekten hiçbir şey “bilmiyor”, ancak çok sayıda çevrimiçi materyali analiz ederek, hemen hemen her konuda akla yatkın görünen cümleler kurabilir.
Ancak, “kulağa inandırıcı geliyor” anahtardır. Farklı formülasyonların olasılığına bağlı olarak, AI inanılmaz derecede akıllı olabilir veya en saçma sonuçlara varabilir. Ansible Health adlı başlangıçtaki araştırmacılar, yanıtların Google’da bulunmadığından emin olduktan sonra bunu USMLE’den örnek sorularla test ettiler, böylece ChatGPT’nin eğitildiği verilere dayalı olarak yeni yanıtlar üreteceğini biliyorlardı.
Testte, ChatGPT üç testte yüzde 52,4 ile 75 arasında puan aldı (geçme puanı tipik olarak yüzde 60 civarındadır). Yanıtların yüzde 88,9’unda, araştırmacıların “yeni, bariz olmayan ve klinik olarak önemli” olarak tanımladığı en az bir önemli keşif sağladı. Çalışmanın yazarları bir basın açıklamasında, “Zorluğuyla ünlü bu insan dışı akran değerlendirmesinde geçer not almak, klinik yapay zekanın gelişiminde dikkate değer bir kilometre taşını işaret ediyor” dedi.
ChatGPT, yanıtlarında da etkileyici bir şekilde tutarlıydı, hatta her yanıtı gerekçelendirebiliyordu. Ayrıca, tıbbi literatürle çalışmak için özel olarak eğitilmiş bir bot olan PubMedGPT’nin yüzde 50,3’lük doğruluğunu geride bıraktı.
ChatGPT’nin üzerinde eğitim aldığı bilgilerin yanlışlıklar içereceğini hatırlamakta fayda var: botun kendisine sorarsanız, LLM’nin güvenilirliğini artırmak için ek çalışma gerektiğini kabul edecektir. Öngörülebilir gelecekte, sağlık çalışanlarının yerini almayacaktır.
Ancak, özellikle bu yapay zeka botları önümüzdeki yıllarda gelişmeye devam ettikçe, çevrimiçi bilgi analizi potansiyeli açıkça çok büyük. Tıp mesleğindeki insanları değiştirmek yerine onların hayat kurtaran yardımcıları olabilirler. Araştırmacılar, “Bu sonuçlar, büyük dil modellerinin tıp eğitimini ve muhtemelen klinik karar vermeyi destekleyebileceğini gösteriyor” diye yazdı.
Bu yazı PLOS Digital Health adresinden derlenmiştir.