Ekonomi

Google'ın Amiral Gemisi Gemini Yapay Zeka Modeli Büyük Bir Yükseltme Aldı

Alphabet'in Gemini AI modeli yalnızca iki aydır halka açık durumda ancak şirket halihazırda bir yükseltme yayınlıyor. Bugün sınırlı kullanılabilirlikle piyasaya sürülen Gemini Pro 1.5, önceki modelden daha güçlüdür ve aynı anda çok büyük miktarlarda metin, video veya ses girişini işleyebilir.

Yeni modeli geliştiren Google DeepMind'ın CEO'su Demis Hassabis, bu modelin geniş girdi kapasitesini, yıllar önce bir sinir bilimci olarak keşfettiği bir kişinin çalışma belleğiyle karşılaştırıyor. "Bu temel yeteneklerin en güzel tarafı, modelin yapabileceği bazı yardımcı şeylerin kilidini açmalarıdır" diyor.

Bir demoda Google DeepMind, Gemini Pro 1.5'in Apollo 11 iletişim transkriptinin 402 sayfalık PDF'sini analiz ettiğini gösterdi. Modelden esprili kısımlar bulması istendi ve astronotların iletişim gecikmesinin sandviç molasından kaynaklandığını söylemesi gibi birkaç anı vurguladı. Başka bir demo, modelin Buster Keaton filmindeki belirli eylemlerle ilgili soruları yanıtladığını gösterdi. Gemini'nin önceki sürümü bu soruları yalnızca çok daha kısa miktarda metin veya videoyla yanıtlayabilirdi. Google, yeni özelliklerin geliştiricilerin modelin üzerine yeni türde uygulamalar oluşturmasına olanak sağlayacağını umuyor.

Google DeepMind'da araştırma bilimcisi olan Oriol Vinyals, "Modelin bu tür bir akıl yürütmeyi her bir sayfada, her bir kelimede gerçekleştirmesi gerçekten oldukça büyülü hissettiriyor" diyor.

Google, Gemini Pro 1.5'in bir saatlik videoyu, 11 saatlik sesi, 700.000 kelimeyi veya 30.000 satırlık kodu aynı anda alıp anlamlandırabildiğini söylüyor ; bu, OpenAI'nin ChatGPT'yi destekleyen GPT-4'ü de dahil olmak üzere diğer AI modellerinden birkaç kat daha fazla. Şirket bu başarının arkasındaki teknik ayrıntıları açıklamadı. Hassabis, Google DeepMind'deki araştırmacılar tarafından test edilen, büyük miktarda metni işleyebilen modellerin bir kullanımının, binlerce mesajla Discord tartışmalarındaki önemli çıkarımları belirlemek olduğunu söylüyor.

Gemini Pro 1.5 ayrıca, modelin çeşitli popüler kıyaslamalardaki puanına göre, en azından boyutu açısından daha yeteneklidir. Yeni model, daha fazla bilgi işlem gücü gerektirmeden daha fazla performans elde etmek için Google araştırmacıları tarafından daha önce icat edilen bir teknikten yararlanıyor. Uzmanların karışımı olarak adlandırılan teknik, bir modelin mimarisinin belirli bir görevi çözmeye en uygun kısımlarını seçici olarak etkinleştirerek eğitim ve çalıştırmayı daha verimli hale getiriyor.

Google, Gemini Pro 1.5'in, önemli ölçüde daha küçük bir model olmasına rağmen, birçok görevde en güçlü teklifi olan Gemini Ultra kadar yetenekli olduğunu söylüyor. Hassabis, Gemini Pro'yu geliştirmek için kullanılan tekniğin Gemini Ultra'yı geliştirmek için uygulanamaması için hiçbir neden olmadığını söylüyor.

Gemini Pro'nun yükseltilmiş sürümü, model yeteneklerini test etmek için bir sanal alan olan AI Studio aracılığıyla geliştiricilere ve Google'ın Vertex AI bulut platformu API'si aracılığıyla sınırlı sayıda geliştiriciye sunulacak. Genel sürüm için henüz bir tarih yok.

Google ayrıca geliştiricilerin Gemini'yi uygulamalarında kullanmalarına yardımcı olacak yeni araçları da piyasaya sürüyor; bunlara modellerin video ve ses ayrıştırma yeteneğinden yararlanmanın yeni yolları da dahil. Şirket ayrıca, web tabanlı kodlama aracı Project IDX'e, AI'nın kodda hata ayıklama ve test etme yolları da dahil olmak üzere Gemini destekli yeni özellikler eklediğini söyledi.

Gemini'nin yükseltme hızı, ChatGPT'nin başarısıyla başlatılan şiddetli bir yapay zeka yarışının işaretidir. Bu haftanın başlarında OpenAI, ChatGPT'ye konuşmalardan faydalı bilgileri uzun süre boyunca hatırlama yeteneği verdiğini duyurdu. Geçen hafta Google, sohbet robotu Bard'ı yeniden markaladı ve Gemini Ultra'nın ücretli abonelikle kullanılabileceğini duyurdu.

Üretken yapay zekadaki çılgın ilerleme hızı, teknolojinin yaratabileceği risklere ilişkin endişelerle çelişiyor. Google, Gemini Pro 1.5'i kapsamlı testlerden geçirdiğini ve sınırlı erişim sağlamanın potansiyel riskler hakkında geri bildirim toplamanın bir yolu olduğunu söylüyor. Şirket aynı zamanda Birleşik Krallık Yapay Zeka Güvenliği Enstitüsü'ndeki araştırmacılara en güçlü modellere erişim olanağı sağladığını ve böylece bunları test edebilmelerini sağladığını söylüyor.

Hassabis önümüzdeki aylarda daha fazla ilerleme beklediğini söylüyor. "Bu yeni bir ritim" diyor, "bir tür startup zihniyetini getirmeye çalışıyorum."

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Göz Atın
Kapalı
Başa dön tuşu