Google I/O'ya katıldığınız için teşekkürler! İçerikleri isteğe bağlı olarak izleyin.

Doğru ölçekte yapay zeka: İşletmeler, kullanıcılar ve gezegen için iyi

Rachel Lee Nabors

Yayınlanma tarihi: 10 Kasım 2025

Yapay zeka ile web siteleri ve web uygulamaları oluştururken ChatGPT, Gemini veya Claude gibi bir büyük dil modeli (LLM) ile prototip oluşturmuş ve ardından bu uygulamayı üretime dağıtmış olabilirsiniz. LLM, temel model türünde bir modeldir. Bu modeller çok büyük, önceden eğitilmiş, kaynak yoğun, pahalı ve genellikle iş için en iyi araç değildir. Daha küçük, yerel ve göreve özel modeller daha az kaynak tüketir ve genellikle "herkese uyan" temel modellere kıyasla daha düşük maliyetle daha iyi ve daha hızlı yanıtlar verir.

Daha iyi bir model seçtiğinizde daha sürdürülebilir bir yaklaşım seçmiş olursunuz. Bu yaklaşıma doğru boyutlandırılmış yapay zeka adını veriyoruz. Doğru boyutlandırılmış yapay zeka şunları sağlar:

Modeller uzak sunuculara gidiş-dönüş yapmak yerine yerel olarak çalıştırıldığında kullanıcılar için daha düşük gecikme süresi.
Kullanılmayan özellikler için ödeme yapmadığınızda API maliyetleri düşer.
Daha güvenilir deneyimler sunmak için istemci tarafındaki cihaz üzerinde modellere çevrimdışı uygulama erişimi.

Temel modeller genel akıl yürütme ve sohbet konusunda mükemmel olsa da bunları belirli görevler (ör. metin sınıflandırma veya veri ayıklama) için kullanmak, McDonald's'a gitmek için Formula 1 arabası kullanmaya benzer. Bu teknik olarak mümkün olsa da çok verimsizdir (ve yolcularınız için rahatsız edicidir). Bunun yerine, uygulamanızı gerçek ihtiyaçlarınıza göre eşleştirin.

Sürdürülebilir yapay zeka uygulamaları ve optimum kullanıcı deneyimleri birbirleriyle rekabet eden öncelikler değildir. Bunlar, farklı şekilde ifade edilen aynı önceliktir.

Yapay zekanın çevresel etkisini değerlendirmenin bir yolu şudur:

Eğitim: İlk model eğitimi önemli kaynaklar gerektirir. Bu optimizasyon ve "öğrenme" süreci, model sağlayıcı tarafından yönetilir.
Çıkarım: Bir çıkış (yanıt metni) oluşturmak için eğitilmiş bir modele yeni giriş (istem) sağladığınızda çıkarım gerçekleştirirsiniz. Çıkarım, eğitime kıyasla çok daha az kaynak kullanır.

Eğitim sabit bir maliyettir ancak çıkarım maliyeti kullanıma göre ölçeklenir. Bu nedenle model seçimi, kontrol edebileceğiniz önemli bir faktördür. Kullanım alanınız ve gezegen için bilinçli seçimler yapabilir, sorumlu yapay zeka gelişimini destekleyebilirsiniz.

Kullanıcı odaklı yapay zekayı uygulama

Model odaklı yapay zeka yerine kullanıcı odaklı yapay zeka geliştirin. Uygulamanızın kullanımını kolaylaştıracak veya kullanıcılarınızın iş yükünü ya da bağlam değiştirme miktarını azaltacak hangi görevleri yapay zekanın gerçekleştirebileceğini düşünün.

Örneğin, belirli restoranlarda yemek yiyen kullanıcılara puan veren Rewarding Eats adlı bir işletmeniz olduğunu varsayalım. Müşterilerinizin restoranın adını ve toplam harcamayı manuel olarak girmesini istemek yerine, yapay zekayı kullanarak restoranın adını ve toplam harcamayı belirlemek için makbuz resmini tarayabilirsiniz. Bu özellik, uygulamanızın kullanıcı deneyimini iyileştirebilir.

Kullanıcı odaklı yapay zeka geliştirirken:

Görev gereksinimlerinizi tanımlayın. Yapay zeka hangi görevleri yerine getirmeli? Tamamen metin tabanlı mı yoksa ses veya görsel bileşenler içeriyor mu?
Uygun modeli seçin. Farklı modeller, farklı görevlerde daha verimlidir ve genellikle daha az yer kaplar.
Dağıtım kısıtlamalarınızı anlayın. Modelin nerede bulunması mantıklı olur? Veriler nerede yer alır? Kullanıcının bağlantısı güvenilir olacak mı?
En hızlı ve en güvenli kullanıcı deneyimi için aşamalı geliştirme ile uygulayın.

Görev gereksinimlerinizi tanımlama

"Yapay zekanın kullanılabileceği yerler" veya "Eklenecek yapay zeka özellikleri" aramak yerine "Sorunsuz bir deneyim nasıl olurdu?" diye sormalısınız. Şirketinizin büyüklüğüne bağlı olarak bu konu, ürün yöneticileriyle konuşulmalıdır.

Örnek uygulamamız Rewarding Eats'i ele alalım. Sormanız gereken ilk soru şudur: "Bunun için yapay zekaya ihtiyacımız var mı?"

Bir temel model, istem girerek makbuzdan gider taslağı oluşturabilir. Ancak bu durumu daha verimli bir şekilde ele almak için büyük bir modele hiç gerek yok. Resimdeki metni ayrıştırmak için optik karakter tanıma (OCR) özelliğini kullanın ve ayrıştırılan metindeki öğeleri ve maliyetleri belirlemek için metin sınıflandırma modeli gibi göreve özgü bir modele iletin. Bu işlem, kullanıcının cihazında sunuculara herhangi bir veri gönderilmeden yapılabilir.

Çoğu durumda, temel modele ihtiyacınız olduğunu düşünüyorsanız sorunu ayrı görevlere bölmeniz gerekir.

Uygun modeli seçin

Hangi görevleri tamamlamaya çalıştığınızı öğrendikten sonra iş için doğru model türünü ve modeli seçebilirsiniz. Temel modelleri kullanmak daha kolay olsa da küçük modeller işi daha hızlı ve daha ucuza halleder. Görevlerinizi anladığınızda işi halletmek için doğru küçük ve göreve özel modeli seçebilirsiniz.

Birçok farklı model türü ve model mevcuttur. Bu nedenle, projeniz için doğru seçimi belirlemek üzere model seçimiyle ilgili ayrıntılı bilgileri okuyun.

Modeliniz için doğru konumu seçme

Temel modeller en güçlü masaüstü bilgisayarlarda bile çalışamayacak kadar büyük olsa da daha küçük LLM'ler, küçük dil modelleri (SLM'ler) ve göreve özel modeller birçok cihazda çalıştırılabilir.

Model türü	Zaten cihazda (istemci tarafında)	Cihaza indirin	Sunucuda barındırılan model
Göreve özgü model	Önerilmeyen	Önerilmeyen	Önerilen
Küçük dil modeli (SLM)	Önerilen	Önerilen	Önerilen
Temel modeller	Önerilmeyen	Önerilmeyen	Önerilen

SLM'ler kullanışlıdır ancak yaygın değildir. Milyarlarca cep telefonu var ve yalnızca en yeni ve daha pahalı modeller yerel SLM'leri çalıştırabiliyor. Bu, pazarın küçük bir yüzdesidir.

Modeliniz için en iyi konumu belirlemek üzere aşağıdaki matrisi kullanın:

Metrik	İstemci tarafı / Yerel	Sunucu tarafı / uzak
Bağlantı	Çevrimdışı mod gerekli, düzensiz ağlar, güvenli tesisler	Her zaman çevrimiçi ortamlar
Veri konumu	Kullanıcı fotoğraflarını, metin girişini ve kişisel dosyaları işleme	Sunucu tarafı belgeler ve veritabanlarıyla çalışma
Kullanım şekli	Yüksek sıklıkta yapılan aramalar (sohbet çevirisi, anlık analiz)	Ara sıra karmaşık görevler
Bant genişliği	Mobil kullanıcılar, kırsal alanlar, büyük dosya çıktıları	Sınırsız geniş bant, küçük yanıtlar
Gizlilik ve güvenlik	Yasal düzenlemelere tabi veriler (sağlık hizmetleri, finans), katı uygunluk	Standart işletme verileri, yerleşik güvenlik altyapısı
Pil üzerindeki etkisi	Masaüstü uygulamaları, güce toleranslı kullanım alanları	Pili sınırlı olan mobil uygulamalar

İstemci tarafı çıkarım, aşamalı geliştirme ve karma

TensorFlow.js, Transformers.js ve ONNX.js gibi kitaplıklarla uygulamalarınız, kullanıcı verileriyle istemci tarafı çıkarımı gerçekleştirebilir. Modelinizi uygun biçime dönüştürür, ardından uzaktan barındırır veya doğrudan uygulamanıza yerleştirirsiniz. En iyi kullanıcı deneyimi, önceden yüklenmiş, indirilebilir ve uzaktan modellerin sorunsuz bir karışımını kullanır. Böylece kullanıcılar işlerini ödün vermeden tamamlayabilir.

Güvenlik (veya boyut ihtiyaçları) için uzaktan, bulutta barındırılan bir model kullanmak tercih edilse de bağlantı kesildiğinde yeterli sayıda yerel modelin kullanılabilir olması esnek bir deneyim sağlayabilir.

Sonuç olarak, model dağıtımı için üç yaklaşım vardır. İhtiyaçlarınıza en uygun olanı seçin.

Önce yerel: Uygulamanın çevrimdışı gereksinimleri var, yüksek sıklıkta kullanılıyor ve hassas veriler içeriyor.
Öncelikle uzaktan: Karmaşık muhakeme, büyük modeller, seyrek kullanım.
Karma yaklaşım: API'leri kullanırken küçük modelleri indirin, hazır olduğunuzda geçiş yapın.

Atmanız gereken adımlar

Teknoloji genellikle uygulamayı takip eder. Geliştiricilerin, sektörün yönünü kullanıcılar için daha iyi bir deneyim ve dünyamız için daha iyi bir sonuç elde edecek şekilde etkilemesinin en iyi yolu şudur:

İş için doğru aracı seçin. Daha küçük modeller daha az kaynak tüketir ve istem mühendisliği yardımıyla genellikle büyük modeller kadar iyi performans gösterir. Gecikmeyi azaltır.
Çıkarım ve eğitim maliyeti şeffaflığı zorunlu olmalıdır. Şirketinizin bu sayıları açıklayan modellere öncelik vermesini sağlayın.
Sunucuya gidiş dönüş maliyetini azaltmak için modeli verilerin yakınına yerleştirin.
Mevcut içerikleri kullanın. Cihazda zaten modeller varsa öncelikle bu modelleri kullanın.

Kaynaklar

Bu konuları daha ayrıntılı olarak incelemek isterseniz bu makaleyi yazarken aşağıdaki kaynaklardan yararlandım. Bu tür kitaplar, okumak için mükemmeldir.

Model performansı ve araştırma

Küçük Dil Modelleri, Ajan Yapay Zekanın Geleceğidir (NVIDIA Araştırma Makalesi): SLM özellikleriyle ilgili araştırmaları destekler.
Mistral'in Çevresel Etki Denetimi: Eğitim ve çıkarım maliyeti şeffaflığı
Google'ın çıkarım maliyeti çalışması: Çevresel etki ölçümü
Nature Study: AI versus Human Environmental Impact: Comparative analysis of AI and human task completion
Yapay Zekanın Çevresel Etkisiyle İlgili Tartışma: Çevresel söylemle ilgili bağlam

Uygulama ve geliştirme araçları

TensorFlow.js Model Yükleme: İstemci tarafında model dağıtımı
Transformers.js örnekleri: Tarayıcı tabanlı model çıkarımı
ONNX.js Çalışma Zamanı: Platformlar arası model dağıtımı
Firebase Hibrit Yapay Zeka Kılavuzu: Yerel ve uzak model entegrasyonu