Pengantar agen

Dipublikasikan: 25 Februari 2025

Developer web telah membangun dan mengoptimalkan situs untuk audiens manusia dan non-manusia, termasuk crawler dan bot lainnya. Agen AI adalah pengguna web terbaru yang mendapatkan manfaat dari pengoptimalan Anda.

Pada intinya, agen adalah sistem yang menerima input, menafsirkannya, lalu merencanakan dan mengeksekusi tindakan atas nama pengguna (baik manusia atau agen lainnya). Agen memiliki beberapa komponen, yang dapat mencakup model, API, atau alat lainnya.

Ada beberapa karakteristik yang menentukan agen. Dalam konteks pengembangan web, Anda harus memikirkan hal berikut:

  • Otonom: Agen dapat beroperasi tanpa intervensi langsung dari manusia.
  • Interaktif: Agen dapat bercakap-cakap dengan agen lain dan manusia.
  • Reaktif: Agen memahami lingkungannya dan merespons perubahan.
  • Proaktif: Agen dapat mengambil inisiatif untuk mencapai sasaran tertentu.

Misalnya, Example Bookshop adalah toko buku online. Pengguna dapat mengumpulkan rekomendasi untuk buku baru, berdasarkan buku yang mereka sukai dan minat lainnya, dengan berinteraksi dengan model bahasa besar (LLM). Agen dapat mengarahkan pengguna ke halaman buku yang direkomendasikan dan memulai proses checkout. Jika buku tersebut kehabisan stok, agen dapat mengarahkan pengguna untuk membeli rekomendasi tersebut di toko buku online lain.

Karena agen adalah pengguna yang cukup baru di web, Anda memiliki waktu sebelum perlu menerapkan praktik terbaik. Namun, banyak praktik terbaik untuk membantu agen sebenarnya membantu semua pengguna, terutama membangun situs yang mudah diakses.

Dalam dokumen ini, kita akan meninjau cara kerja agen sebagai pengguna web dan alasan Anda harus mempertimbangkan untuk membangun situs dengan mempertimbangkan agen.

Cara agen beroperasi sebagai pengguna

Sebagian besar diskusi seputar AI dan situs berfokus pada crawler yang digunakan untuk meng-scraping data pelatihan untuk LLM. Data yang di-scrap untuk pelatihan sering kali disimpan dalam set data terbuka seperti Common Crawl, yang membantu mencegah situs kewalahan oleh crawler. Namun, pelatihan hanyalah salah satu alasan Anda akan menemukan sistem AI.

Sistem AI dapat menargetkan halaman tertentu untuk di-scraping, berdasarkan permintaan pengguna tertentu (baik manusia maupun agen). Misalnya, pengguna dapat memberikan sumber ke NotebookLM dan sistem akan meng-scraping konten untuk membantu pengguna dengan lebih baik dalam tugas terkait, seperti meringkas atau mengagregasi data.

Agen mengikuti pola serupa dan meng-crawl halaman atas nama pengguna, untuk menjawab permintaan pengguna, tetapi alurnya mungkin kurang linear.

Meskipun agen telah lama digunakan untuk tugas otomatisasi dan mengumpulkan informasi, kini agen dapat mengklik link dan tombol, mengisi kolom, serta men-scroll halaman, sehingga menyelesaikan alur kerja atas nama pengguna. Tugas ini bisa berupa tugas kecil, seperti mengisi formulir kontak, atau tugas yang lebih kompleks, seperti memesan penerbangan untuk keluarga Anda.

Memahami izin adalah keterampilan terpenting bagi jenis agen baru ini, karena mereka bertindak sebagai pendamping bagi manusia. Agen harus meminta konfirmasi pada titik-titik penting, seperti langkah pembelian atau mengirimkan formulir dengan informasi sensitif.

Agen sebagai pendamping

Agen dapat menjadi pendamping atau bahkan pengganti pengguna manusia, membantu menyelesaikan tugas yang kompleks di situs atau aplikasi web Anda. Pada tingkat tinggi, proses agen selalu sama:

  1. Menerima kueri.
  2. Proses dan rencanakan cara menjawab kueri.
  3. Laksanakan rencana.
  4. Simpan semua pelajaran yang didapat ke dalam memori.

Agen paling cocok untuk mendukung tugas di beberapa origin. Dalam kasus berbelanja buku, agen dapat menyelesaikan tugas di origin Anda, sekaligus menjelajahi origin serupa lainnya. Makin baik situs Anda dalam mendukung agen menyelesaikan tugas, makin besar kemungkinan agen akan menyelesaikannya dengan asal Anda.

Tugas Anda sebagai developer web adalah mendukung dan membangun alat untuk membantu manusia dan agen menyelesaikan tugas penting secara efisien. Namun, alat hanyalah salah satu bagian dari infrastruktur agen.

Infrastruktur agen

Manusia bekerja sama dengan agen. Setiap bagian mengirim dan menampilkan informasi ke model.
Manusia berinteraksi dengan agen, yang berisi model, aturan, memori, dan alat.

Agen adalah unit yang terkandung dengan beberapa bagian yang terhubung:

  • Model: Model bahasa besar (LLM) adalah dasar bagi agen AI. LLM menyediakan penalaran, basis pengetahuan, dan kemampuan untuk memproses dan menghasilkan bahasa.
  • Aturan: Berbagai batasan, termasuk persona, petunjuk, dan tujuan, membantu agen melakukan tugas secara konsisten.
  • Memori: Memori jangka pendek dan memori jangka panjang mendukung agen dalam mengelola konteks, meningkatkan efisiensi, dan secara umum berperforma lebih baik bagi pengguna.
  • Alat: Ada banyak alat berbeda yang dapat digunakan agen, termasuk API, fungsi, database, dan bahkan agen lain. Misalnya, WebMCP adalah proposal dalam program pratinjau awal Chrome untuk mendukung interaksi terstruktur di situs Anda.

Saat memperlakukan situs sebagai sumber data atau berinteraksi langsung dengan halaman, agen dapat melakukannya secara visual atau semantik:

  • Interaksi visual: Agen mengambil snapshot halaman web yang dirender. Fitur ini menggunakan model visi untuk membaca konten dan mengidentifikasi elemen interaktif.
  • Interaksi semantik: Agen menganalisis DOM dan membaca teks secara langsung. Hal ini sangat umum terjadi pada agen yang melakukan tugas otomatis.

Untuk interaksi visual dan semantik, agen akan diuntungkan dari situs yang didesain dengan baik, mudah dinavigasi, dan memiliki hierarki konten yang jelas.

Agen memerlukan akses ke data

Salah satu cara untuk mendefinisikan agen adalah berdasarkan hubungannya dengan data. Apakah pemilik agen dan data sama atau berbeda? Pilihan ini menentukan lapisan autentikasi yang diperlukan dan seberapa sulit tugas tersebut diselesaikan.

Agen pihak nol

Agen pihak nol adalah agen berbasis browser atau berbasis sistem operasi yang bertindak dalam konteks lokal menggunakan data lokal. Karena browser dan sistem operasi menyimpan preferensi pengguna kustom yang dapat dianggap sebagai informasi identitas pribadi (PII), agen pihak nol dapat mencegah operasi yang membagikan data ini kepada pihak lain.

Agen pihak pertama

Agen pihak pertama adalah saat alat dan informasi dimiliki oleh pihak yang sama, sehingga developer dapat memiliki dan mendukung alat, mengelola akses ke informasi dan konfigurasi.

Misalnya, Anda adalah pengguna yang merencanakan liburan ke Toronto, dan Anda ingin membuat daftar tempat yang akan dikunjungi. Agen yang disediakan oleh Google Maps dapat menggunakan serangkaian kriteria dan data untuk membuat daftar tempat menarik atas nama Anda, dengan menandai setiap item di peta. Hal ini dapat dianggap sebagai agen pihak pertama karena agen disediakan oleh Google, yang juga memiliki data peta dan preferensi pribadi lainnya yang disimpan oleh pengguna yang login.

Agen pihak ketiga

Agen pihak ketiga dibuat oleh developer atau organisasi eksternal, dan menawarkan fungsi dan data dari layanan eksternal. Misalnya, Anda mungkin ingin penyedia kalender pihak ketiga mendukung fitur berbasis acara di situs Anda. Anda dapat menawarkan alat kepada agen ini, seperti WebMCP, atau mengintegrasikan agen ke dalam alur kerja Anda (dengan asumsi mereka lulus peninjauan privasi Anda).

Agen pihak ketiga dapat menyelesaikan tugas pemetaan yang sama, jika dibuat sebagai ekstensi.

Developer dapat membuat agen yang mengandalkan sumber tertentu untuk membuat daftar, seperti mengambil restoran terbaik dari koran lokal. Agen ini memerlukan akses baca ke situs koran lokal selain akses baca dan tulis pada alat pembuatan daftar, baik itu Google Maps atau layanan alternatif. Hal ini memerlukan beberapa lapisan izin dan persetujuan, serta alat khusus untuk berinteraksi dengan situs (seperti alat Playwright).

Kemungkinan situs atau aplikasi web Anda adalah penyedia informasi pihak ketiga untuk agen. Dalam hal ini, Anda dapat menawarkan struktur izin yang memungkinkan agen dan manusia menyelesaikan tugas bersama Anda.

Poin-poin penting

Setelah memahami cara kerja agen, Anda dapat memutuskan cara terbaik agar situs Anda mendukung agen.

Kami akan terus memperbarui seri ini dengan praktik terbaik yang dapat ditindaklanjuti untuk mendukung interaksi situs dan aplikasi web Anda dengan agen.