ChatGPT’deki “GPT” Aslında Ne Anlamına Geliyor?

Bir haber sitesinde gezinmek ve bir yerde “ChatGPT” görmemek zor. 20 Kasım 2022’de kullanıma sunulduğundan bu yana erken gelişmiş sohbet robotu aylık 100 milyon aktif kullanıcıya ulaştı ve Google’ın en popüler sorgularından bazılarında hızla yükseldi. Popülaritesine rağmen, çok az kişi ChatGPT’de “GPT”nin ne anlama geldiğini bir bakışta anlayabilir: “Önceden Eğitilmiş Üretken Transformatör”. OpenAI tarafından geliştirilen ChatGPT, insan kullanıcılarla metin sohbetleri için yapay zekayı (AI) kullanan bir bilgisayar programıdır.

ChatGPT

Ona (mantık dahilinde) herhangi bir soru sorun veya bir istekte bulunun; ChatGPT, şaşırtıcı derecede doğal ve insani görünebilecek bir metin bloğuyla yanıt verecektir. Teknik olarak, büyük dil modellerine dayalı bir sohbet robotudur, yani cümleler kurmayı öğrendiği kitaplar, haber makaleleri ve web siteleri gibi inanılmaz miktarda metinsel veri alır.

B. bilgisayar kodu yazmak, sanal sohbet robotu asistanı olarak, içerik oluşturmak ve hatta haber makaleleri yazmak (değişen başarı dereceleriyle) gibi her türlü amaç için kullanılabilir. Sağlıklı bir ironi dozuyla, ChatGPT OpenAI’den “Üretken Önceden Eğitilmiş Transformatör” terimini ayrıştırmasını istedik. Cevap verildi: “Üretken önceden eğitilmiş trafo”, dil modelinin mimarisinin temel özelliklerini ve özelliklerini açıklayan bir terimdir. Her bir bileşenin anlamını inceleyelim:

1) Üretici: Doğal dil işleme bağlamında, üretici, modelin insan konuşmasına benzeyen yeni metin üretebildiği anlamına gelir. Eğitim sırasında öğrenilen kalıplara dayanarak tutarlı ve bağlamsal cümleler, paragraflar veya daha uzun metinler oluşturabilir.

2) Önceden eğitilmiş: Önceden eğitilmiş, internetten veya diğer kaynaklardan büyük miktarda metin içeren büyük bir veri kümesi üzerinde bir modelin eğitiminin ilk aşamasını ifade eder. Ön eğitim sırasında model, önceki kelimelere dayalı olarak bir cümledeki bir sonraki kelimeyi tahmin etmeyi öğrenir. Bu süreç, modelin verilerde bulunan istatistiksel kalıpları ve ilişkileri yakalamasını sağlar.

3) Transformer: “Transformer”, Vaswani ve diğerleri tarafından sunulan “Attention is all you need” makalesinde tartışılan özel bir derin öğrenme mimarisi türüdür. 2017’de Girdi dizilerini paralel olarak işlemek için öz-farkındalık mekanizmalarını kullanır ve modelin çıktıyı oluştururken girdideki farklı kelimelerin anlamlarını hesaba katmasına olanak tanır.

Dönüştürücüler, uzun vadeli bağımlılıkları ve paralelleştirme yeteneklerini yönetme yetenekleri nedeniyle doğal dil işlemede popülerlik kazanıyor.” OpenAI’nin ChatGPT’sine ek olarak, birkaç başka GPT vardır. ChatGPT OpenAI’ye benzer yapay zeka teknolojisi kullanan, ancak finans ve finans sektörü ile ilgili veriler konusunda özel olarak eğitilmiş BloombergGPT var. GPT-3 OpenAI’den ilham alan temel bir açık kaynak dil modeli olan GPT-Neo da vardır. Şu anda, OpenAI ve ChatGPT, üretken önceden eğitilmiş transformatörler alanında en önde gelen isimlerdir, ancak en üst sıralarda yer almak için yarışan başka birçok şirket var.

Bu yazı BloombergGPT adresinden derlenmiştir.

Yorum yapın