Giới thiệu về nhân viên hỗ trợ

Ngày xuất bản: 25 tháng 2 năm 2025

Alexandra Klepper
Alexandra Klepper
Kasper Kulikowski
Kasper Kulikowski

Các nhà phát triển web đã và đang xây dựng cũng như tối ưu hoá trang web cho đối tượng là con người và không phải con người, bao gồm cả trình thu thập thông tin và các bot khác. Các tác nhân AI là người dùng web mới nhất được hưởng lợi từ hoạt động tối ưu hoá của bạn.

Về cơ bản, tác nhân là một hệ thống nhận dữ liệu đầu vào, diễn giải dữ liệu đó, sau đó lập kế hoạch và thực hiện các hành động thay mặt cho người dùng (có thể là con người hoặc một tác nhân khác). Một tác nhân có nhiều thành phần, có thể bao gồm các mô hình, API hoặc công cụ khác.

Có một số đặc điểm xác định các tác nhân. Trong bối cảnh phát triển web, bạn nên cân nhắc những điều sau:

  • Tự chủ: Các tác nhân có thể hoạt động mà không cần sự can thiệp trực tiếp của con người.
  • Tương tác: Các đặc vụ có thể trò chuyện với các đặc vụ khác và con người.
  • Phản ứng: Một tác nhân nhận biết môi trường của nó và phản ứng với những thay đổi.
  • Chủ động: Nhân viên có thể chủ động thực hiện để đạt được các mục tiêu cụ thể.

Ví dụ: Example Bookshop là một hiệu sách trực tuyến. Người dùng có thể thu thập đề xuất về một cuốn sách mới dựa trên những cuốn sách họ thích và các mối quan tâm khác bằng cách tương tác với một mô hình ngôn ngữ lớn (LLM). Một trợ lý có thể đưa người dùng đến trang của cuốn sách được đề xuất và bắt đầu quy trình thanh toán. Nếu cuốn sách đó hết hàng, thì trợ lý có thể đưa người dùng đến một hiệu sách trực tuyến khác để mua cuốn sách được đề xuất đó.

Vì các tác nhân là một người dùng khá mới trên web, nên bạn có một khoảng thời gian trước khi cần áp dụng các phương pháp hay nhất. Tuy nhiên, nhiều phương pháp hay giúp các trợ lý ảo thực sự giúp tất cả người dùng, đặc biệt là xây dựng một trang web hỗ trợ tiếp cận.

Trong tài liệu này, chúng tôi xem xét cách các tác nhân hoạt động với tư cách là người dùng web và lý do bạn nên cân nhắc việc xây dựng trang web của mình theo hướng dành cho các tác nhân.

Cách các đặc vụ hoạt động với tư cách là người dùng

Phần lớn nội dung thảo luận về AI và trang web đều xoay quanh trình thu thập dữ liệu được dùng để trích xuất dữ liệu huấn luyện cho các LLM. Dữ liệu được trích xuất để huấn luyện thường được lưu giữ trong các tập dữ liệu mở như Common Crawl. Điều này giúp ngăn chặn các trang web bị trình thu thập dữ liệu làm quá tải. Tuy nhiên, việc đào tạo chỉ là một trong những lý do khiến bạn gặp phải các hệ thống AI.

Các hệ thống AI có thể nhắm đến những trang cụ thể để trích xuất dữ liệu, dựa trên yêu cầu của một người dùng cụ thể (dù đó là người dùng hay một tác nhân). Ví dụ: người dùng có thể cung cấp nguồn cho NotebookLM và hệ thống sẽ trích xuất nội dung để giúp người dùng thực hiện các tác vụ liên quan một cách hiệu quả hơn, chẳng hạn như tóm tắt hoặc tổng hợp dữ liệu.

Các tác nhân tuân theo các mẫu tương tự và thu thập dữ liệu các trang thay cho người dùng để trả lời yêu cầu của người dùng, nhưng luồng có thể ít tuyến tính hơn.

Mặc dù các tác nhân đã được sử dụng từ lâu cho các tác vụ tự động hoá và thu thập thông tin, nhưng giờ đây, chúng có thể nhấp vào các đường liên kết và nút, điền vào các trường và cuộn trên các trang, hoàn thành quy trình làm việc thay cho người dùng. Đó có thể là những việc nhỏ, chẳng hạn như điền thông tin vào biểu mẫu liên hệ, hoặc những việc phức tạp hơn, chẳng hạn như đặt vé máy bay cho gia đình.

Hiểu được sự đồng ý là kỹ năng quan trọng nhất đối với những loại đặc vụ mới này, vì chúng đóng vai trò là người đồng hành với con người. Nhân viên hỗ trợ nên yêu cầu xác nhận tại các thời điểm quan trọng, chẳng hạn như bước mua hàng hoặc gửi biểu mẫu có thông tin nhạy cảm.

Các tác nhân là bạn đồng hành

Các tác nhân có thể là người đồng hành hoặc thậm chí là người thay thế cho người dùng, hỗ trợ hoàn thành các tác vụ phức tạp trên trang web hoặc ứng dụng web của bạn. Nhìn chung, quy trình của một tác nhân luôn giống nhau:

  1. Nhận truy vấn.
  2. Xử lý và lên kế hoạch giải quyết truy vấn.
  3. Thực hiện kế hoạch.
  4. Lưu giữ mọi bài học rút ra vào bộ nhớ.

Các tác nhân phù hợp nhất để hỗ trợ các tác vụ trên nhiều nguồn gốc. Trong trường hợp mua sắm sách, tác nhân có thể hoàn tất một tác vụ trên nguồn gốc của bạn, đồng thời điều hướng các nguồn gốc tương tự khác. Trang web của bạn hỗ trợ nhân viên hoàn thành nhiệm vụ càng tốt thì nhân viên đó càng có nhiều khả năng hoàn thành nhiệm vụ bằng nguồn gốc của bạn.

Công việc của bạn với tư cách là nhà phát triển web là hỗ trợ và xây dựng các công cụ giúp con người và các tác nhân hoàn thành hiệu quả những nhiệm vụ quan trọng. Nhưng các công cụ chỉ là một phần của cơ sở hạ tầng tác nhân.

Cơ sở hạ tầng của tác nhân

Con người hợp tác với các tác nhân. Mỗi phần sẽ gửi và trả về thông tin cho mô hình.
Con người làm việc với một tác nhân, trong đó có mô hình, quy tắc, bộ nhớ và công cụ.

Tác nhân là một đơn vị khép kín có nhiều phần được kết nối:

  • Mô hình: Mô hình ngôn ngữ lớn (LLM) là nền tảng cho một tác nhân AI. Những mô hình này cung cấp khả năng suy luận, một cơ sở kiến thức và khả năng xử lý cũng như tạo ngôn ngữ.
  • Quy tắc: Nhiều ràng buộc, bao gồm cả tính cách, hướng dẫn và mục tiêu, giúp tác nhân thực hiện các nhiệm vụ một cách nhất quán.
  • Bộ nhớ: Bộ nhớ ngắn hạn và bộ nhớ dài hạn hỗ trợ một tác nhân quản lý ngữ cảnh, tăng hiệu quả và thường hoạt động tốt hơn cho người dùng.
  • Công cụ: Có nhiều công cụ mà một tác nhân có thể sử dụng, bao gồm cả API, hàm, cơ sở dữ liệu và thậm chí cả các tác nhân khác. Ví dụ: WebMCP là một đề xuất trong chương trình xem trước sớm của Chrome nhằm hỗ trợ các hoạt động tương tác có cấu trúc trên trang web của bạn.

Khi coi trang web là nguồn dữ liệu hoặc tương tác trực tiếp với các trang, các tác nhân có thể thực hiện việc này một cách trực quan hoặc theo ngữ nghĩa:

  • Tương tác trực quan: Nhân viên hỗ trợ chụp nhanh trang web được kết xuất. Công cụ này sử dụng một mô hình thị giác để đọc nội dung và xác định các phần tử tương tác.
  • Tương tác ngữ nghĩa: Trợ lý phân tích DOM và đọc trực tiếp văn bản. Điều này đặc biệt phổ biến đối với những tác nhân thực hiện các tác vụ tự động.

Đối với cả hoạt động tương tác trực quan và ngữ nghĩa, các tác nhân đều được hưởng lợi từ những trang web được thiết kế chu đáo, dễ dàng điều hướng và có hệ thống phân cấp nội dung rõ ràng.

Các tác nhân cần có quyền truy cập vào dữ liệu

Một cách để xác định các tác nhân là dựa vào mối quan hệ của tác nhân với dữ liệu. Chủ sở hữu của tác nhân và dữ liệu có giống nhau hay khác nhau? Lựa chọn này xác định những lớp xác thực cần thiết và mức độ khó khăn khi hoàn tất nhiệm vụ.

Nhân viên hỗ trợ bên thứ nhất

Tác nhân bên thứ nhất là một tác nhân dựa trên trình duyệt hoặc hệ điều hành, hoạt động trong một bối cảnh cục bộ bằng cách sử dụng dữ liệu cục bộ. Vì trình duyệt và hệ điều hành lưu trữ các lựa chọn ưu tiên tuỳ chỉnh của người dùng (có thể được coi là thông tin nhận dạng cá nhân (PII)), nên một tác nhân bên thứ nhất có thể ngăn các hoạt động chia sẻ dữ liệu này với các bên khác.

Tác nhân của bên thứ nhất

Tác nhân của bên thứ nhất là khi công cụ và thông tin thuộc sở hữu của cùng một bên, nhờ đó, nhà phát triển có thể sở hữu và hỗ trợ các công cụ, quản lý quyền truy cập vào thông tin và cấu hình.

Ví dụ: giả sử bạn là một người dùng đang lên kế hoạch đi nghỉ ở Toronto và bạn muốn tạo danh sách những địa điểm cần tham quan. Một tác nhân do Google Maps cung cấp có thể lấy một bộ tiêu chí và dữ liệu để thay mặt bạn tạo danh sách các địa điểm yêu thích, đánh dấu từng mục trên bản đồ. Đây có thể được coi là một tác nhân của bên thứ nhất vì tác nhân này do Google cung cấp. Google cũng sở hữu dữ liệu bản đồ và mọi lựa chọn ưu tiên cá nhân khác do người dùng đã đăng nhập lưu trữ.

Chương trình phần mềm bên thứ ba

Tác nhân bên thứ ba do một nhà phát triển hoặc tổ chức bên ngoài tạo và cung cấp các chức năng cũng như dữ liệu từ các dịch vụ bên ngoài. Ví dụ: bạn có thể muốn một nhà cung cấp lịch bên thứ ba hỗ trợ một tính năng dựa trên sự kiện trên trang web của mình. Bạn có thể cung cấp các công cụ cho những tác nhân này, chẳng hạn như WebMCP, hoặc tích hợp các tác nhân vào quy trình làm việc của bạn (giả sử họ vượt qua quy trình đánh giá quyền riêng tư của bạn).

Có thể hình dung rằng một tác nhân bên thứ ba có thể hoàn thành cùng một nhiệm vụ lập bản đồ khi được tạo dưới dạng một tiện ích.

Nhà phát triển có thể tạo một tác nhân dựa trên các nguồn cụ thể để tạo danh sách, chẳng hạn như thu thập những nhà hàng ngon nhất từ các tờ báo địa phương. Ngoài quyền đọc và ghi trên một công cụ tạo danh sách (có thể là Google Maps hoặc một dịch vụ thay thế), tác nhân này cũng cần có quyền đọc đối với các trang web của tờ báo địa phương. Việc này đòi hỏi phải có nhiều lớp đồng ý và quyền, cũng như các công cụ cụ thể để tương tác với các trang web (chẳng hạn như công cụ Playwright).

Có thể trang web hoặc ứng dụng web của bạn là một nhà cung cấp thông tin bên thứ ba cho một tác nhân. Trong trường hợp này, bạn có thể muốn cung cấp một cấu trúc quyền cho phép các tác nhân và con người hoàn thành các nhiệm vụ cùng với bạn.

Cướp lại bóng

Giờ đây, bạn đã hiểu cách các tác nhân hoạt động, bạn có thể quyết định cách trang web của mình có thể hỗ trợ các tác nhân này một cách hiệu quả nhất.

Chúng tôi sẽ tiếp tục cập nhật loạt bài này bằng các phương pháp hay nhất có thể hành động để hỗ trợ các hoạt động tương tác giữa trang web và ứng dụng web của bạn với các tác nhân.