Site aramanızı bir üst seviyeye taşıyın: Üretken yapay zeka ile içeriğe dayalı yanıtlar

Üretken yapay zeka, üretken yapay zekanın gibi yeni içerikler oluşturmak için yapay zekayı kullanır. videolar. Üretken yapay zeka, makine öğrenimi (ML) modelinden yararlanarak örüntüleri ve ilişkileri ortaya koydu.

Bu teknoloji, Microsoft Word gibi uygulamalar aracılığıyla Gemini. İş ilanlarında para kazanmayı nasıl üretken yapay zeka araçlarını web ürünlerime nasıl entegre edebilirim?

Yaygın kullanım alanlarından biri, kullanıcılara soru sorabilecekleri daha iyi bir arayüz sunmaktır. hakkında bilgi edindiniz. Kullanıcılarınızın arama sonuçlarını çok daha iyi hale getirebilir, büyük bir kısmını oluşturuyor.

Kullanıcıların sorularını yazdıkları bir arayüz oluşturabilirsiniz. Kullanıcı büyük dil modeline (LLM) gönderilen, Gemini ardından yanıtları kullanıcılarınıza gösterebilirsiniz.

Bu sitede böyle bir özelliğin olduğunu varsayalım. Kullanıcı, hangi API'lerin ve aşağıdaki sorguyu girdiler:

What are the features included in Interop 24?

Maalesef çıkış, birkaç nedenden dolayı yanlış olabilir:

  • Kullanıcı LLM'ye soru için çok az bağlam sunmuştur, bu nedenle LLM yanlış cevaplar veya halüsinasyonlar döndürmeye daha yatkındır.
  • LLM, muhtemelen Interop 2024 oluşturulmadan veya özellikleri oluşturulmadan önce eğitilmiştir. farkında değildir.

LLM'ler daha güncel bilgilere ulaşabilir ancak LLM eğitimi, veri kümelerinin doğası gereği eskidir. Yeni sonuçları korumak, zaman alıcı ve pahalıdır.

İstem mühendisliğini kullanma

İstem mühendisliği LLM'den en iyi çıktıyı elde etmeye yönelik bir dizi tekniktir.

Tekniklerden biri, istemde ek bağlam sağlayarak LLM'yi sunmaktır. alakalı içerik üretme ihtimali artar.

Birlikte çalışabilirlik örneğimizden devam edersek ilk adımımız, bağlam olarak kullanabilirsiniz. Sonra soruyu LLM'yi (büyük dil modeli) yanıtlayın. Örneğin:

Context:
Following on from the success of Interop 2022 and Interop 2023, we
are excited about the opportunity to collaborate once again with
all key browser vendors and other relevant stakeholders...
(trimmed to fit in this article)

Input:
What are the features included in Interop 2024?

Gemini'ın aşağıdakine benzer bir çıktı üretmesini bekleyebilirsiniz:

The features included in Interop 24 are Accessibility, CSS Nesting, Custom
Properties, Declarative Shadow DOM, font-size-adjust, HTTPS URLs for
WebSocket, IndexedDB, Layout, Pointer and Mouse Events, Popover, Relative
Color Syntax, requestVideoFrameCallback, Scrollbar Styling, @starting-style
and, transition-behavior, Text Directionality, text-wrap: balance,URL

Bu yanıt büyük olasılıkla bağlam olmadan bilgi isteyen bir istemden çok daha iyidir çünkü verilen bağlama göre değişir.

RAG ile ölçeği artırın

Örneğin, tek bir makaleyle ilgili soruyu yanıtlamak yerine, web.dev hakkında daha fazla soruya yanıt vermek için LLM'ye ek bağlam bilgisi sunar. Bu durum daha küçük sitelerde mümkün olsa da Gemini 1.5'in 1 milyon jetonluk bağlam penceresi Büyük istemlerin çalıştırılması daha yavaş ve daha pahalıdır.

LLM'nin giriş ve çıkış uzunlukları, jetonlarla ölçülüp ücretlendirilir. LLM'ler, bir metin girişinde bulunan ortak bir karakter dizisini temsil eden bir yöntemdir. İlgili içeriği oluşturmak için kullanılan simge sayısı genellikle kelime sayısından büyük olur. Kullanıcı örnekteki giriş 775 kelime içeriyordu ve 1097 ile temsil ediliyordu. jeton. Farklı LLM'ler jetonları farklı şekilde hesaplayabilir ve çoğu metin girişi için jeton sayısını hesaplamak üzere bir API veya uç nokta.

Çözümlerden biri, LLM istemiyle alakalı makaleler sunmaktır. Bu görev, şu iki bölümü vardır:

  1. LLM'den bahsederken en çok okunan makalelerin içeriğini bağlam olarak ekleyin.
  2. "İçerikte sunulan özellikler nelerdir? Birlikte Çalışabilirlik 2024?".

Gemini sonuçlarının aşağıdaki makalelere göre içerik döndürmesini isteriz:

Giriş aşağıdaki gibi görünmelidir:

Context:
Article 1:
Over the past two years... (trimmed)

Article 2:
At the end of last year Interop 2023 wrapped up. This effort... (trimmed)

Article 3:
Following on from the success of Interop 2022... (trimmed)

Input:
What are the features included in Interop 2024?

Bu bağlam, beklenen çıktımızı verir.

* Accessibility * CSS Nesting * Custom Properties
* Declarative Shadow DOM * font-size-adjust
* HTTPS URLs for WebSocket * IndexedDB * Layout
* Pointer and Mouse Events * Popover * Relative Color Syntax
* requestVideoFrameCallback * Scrollbar Styling
* @starting-style and transition-behavior * Text Directionality
* text-wrap: balance * URL

Yapay zeka tekniklerine aşina olanlar için bu yaklaşımda yaygın olarak kullanılan Üretken yapay zeka araçlarından gerçek yanıtlar alınma olasılığını artırmak için kullanılır.

RAG tekniği normal tam metin aramasıyla birlikte çalışabilse de bu yaklaşımda eksiklikler var.

  • Tam metin araması, yapay zekanın tam anahtar kelime eşleşmeleri bulmasına yardımcı olur. Ancak LLM'ler kullanıcı sorgusunun amaçlanan anlamını belirler. Bu da çıkışlar eksik veya yanlış.
  • Kelimelerin birden fazla anlamı olduğunda veya sorgularda anlamına gelir. Örneğin, "banka" (finans kuruluşları ve nehir bankası) alakasız sonuçlar doğurabilir.
  • Tam metin araması, anahtar kelimeleri içeren ancak kullanıcının amacına uygun olmadığından emin olun.

Anlamsal arama aşağıdaki temel unsurlara odaklanarak arama doğruluğunu artıran bir tekniktir:

  • Arama yapan kişinin amacı: Kullanıcının arama yapma nedenini anlamaya çalışır neden olur. Neyi bulmaya veya başarmaya çalışıyorlar?
  • Bağlamsal anlam: Kelimeleri ve kelime öbeklerini etrafındaki metnin yanı sıra kullanıcının konumu veya araması gibi diğer faktörler geçmişi'ne dokunun.
  • Kavramlar arasındaki ilişki: Anlamsal aramada, bilgi grafikleri (büyük ağları) ve doğal dil işlemeyi, ve fikirlerin birbiriyle nasıl bağlantılı olduğudur.

Sonuç olarak, anlamsal arama içeren araçlar derlediğinizde, anahtar kelimeler yerine sorgunun genel amacına yönelik olmalıdır. Bu, bir aracın Anahtar kelime tam olarak görünmese bile alakalı dokümanları belirler. O da kelimenin farklı bir anlamı olan sonuçlardan da kaçınmasını sağlar.

Şu anda, semantik aramayı kullanan iki arama aracı uygulayabilirsiniz: Vertex AI Search ve Algolia AI Arama.

Yayınlanmış içeriklerden yanıt alın

Bir LLM'nin yanıt sağlaması için istem mühendisliğini nasıl kullanacağınızı öğrendiniz daha önce hiç görülmemiş içeriklerle alakalı içerikler oluşturmak için isteğe bağlam bilgisi ekleyin. Üstelik şimdi bu yaklaşımın tek tek makalelerden tüm bir koleksiyona nasıl ölçekleneceğini öğrendi Almayla Artırılmış Oluşturma (RAG) tekniği inceleyelim. Anlamsal aramanın kullanıcılar için sonuçları nasıl daha da iyi RAG sistemini ürününüze daha iyi uygulayabilirsiniz.

Üretken yapay zeka araçlarının "halüsinasyon" etkisi nedeniyle Bu da, en iyi, bazen güvenilir olmayan veya en kötüsü de bir şirket için aktif olarak yardımcı olur. Hem kullanıcılar hem de geliştiriciler bu tekniklerle ve belki de bu uygulamalardan elde edilecek sonuçlar konusunda güven oluşturabilir.