Cảm ơn bạn đã theo dõi Google I/O! Xem nội dung theo yêu cầu.

Policybazaar đã mở rộng dịch vụ hỗ trợ khách hàng ngoài giờ làm việc bằng AI trên web và 73% người dùng đã có các lượt tương tác chất lượng

Rishabh Mehrotra

Aman Soni

Swetha Gopalakrishnan

Ngày xuất bản: 21 tháng 5 năm 2025

Policybazaar là một trong những nền tảng bảo hiểm hàng đầu của Ấn Độ, với hơn 97 triệu khách hàng đã đăng ký. Mỗi tháng, khoảng 80% khách hàng truy cập vào Policybazaar trên mạng. Vì vậy, điều quan trọng là các nền tảng của họ phải mang lại trải nghiệm mượt mà cho người dùng.

Nhóm Policybazaar nhận thấy rằng có một số lượng đáng kể người dùng truy cập vào trang web của họ vào buổi tối, sau giờ làm việc của nhóm hỗ trợ khách hàng. Thay vì người dùng phải đợi đến ngày làm việc tiếp theo để nhận câu trả lời hoặc thuê nhân viên làm việc qua đêm, Policybazaar muốn triển khai một giải pháp để cung cấp dịch vụ ngay lập tức cho những người dùng đó.

Khách hàng có nhiều câu hỏi về các gói bảo hiểm, cách hoạt động của các gói bảo hiểm và gói bảo hiểm nào sẽ đáp ứng nhu cầu của họ. Rất khó để giải quyết các câu hỏi dành riêng cho cá nhân bằng trang Câu hỏi thường gặp hoặc chatbot dựa trên quy tắc. Để giải quyết những nhu cầu này, nhóm đã triển khai tính năng hỗ trợ cá nhân hoá bằng AI tạo sinh.

73_%

Người dùng đã bắt đầu và tham gia vào các cuộc trò chuyện chất lượng

2 _lần

Tỷ lệ nhấp cao hơn so với lời kêu gọi hành động trước đó

10_x

Suy luận nhanh hơn với WebGPU

Hỗ trợ cá nhân hoá bằng AI Finova

Để cung cấp câu trả lời phù hợp với từng người dùng và hỗ trợ khách hàng tốt hơn bằng tiếng Anh và một số ngôn ngữ Ấn Độ bản địa của người dùng, Policybazaar đã xây dựng một chatbot trợ lý bảo hiểm bằng văn bản và giọng nói có tên Finova AI.

Để làm được điều này, chúng tôi đã thực hiện nhiều bước. Xem hướng dẫn chi tiết trong bài nói chuyện Trường hợp sử dụng và chiến lược AI trên web trong thực tế tại Google I/O 2025.

Sơ đồ này minh hoạ các bước cấp cao cơ bản trong quá trình triển khai Finova AI.

1. Hoạt động đầu vào của người dùng

Trước tiên, khách hàng gửi tin nhắn đến chatbot, bằng văn bản hoặc bằng giọng nói. Nếu người dùng nói chuyện với chatbot, Web Speech API sẽ được dùng để chuyển đổi giọng nói thành văn bản.

2. Dịch sang tiếng Anh

Tin nhắn của khách hàng được gửi đến API Trình phát hiện ngôn ngữ. Nếu API phát hiện một ngôn ngữ Ấn Độ, thì dữ liệu đầu vào sẽ được gửi đến Translator API để dịch sang tiếng Anh.

Cả hai API này đều chạy quy trình suy luận phía máy khách, nghĩa là dữ liệu đầu vào của người dùng không rời khỏi thiết bị trong quá trình dịch.

3. Thông báo được đánh giá bằng tính năng phát hiện nội dung độc hại

Mô hình phát hiện nội dung độc hại phía máy khách được dùng để đánh giá xem nội dung mà khách hàng nhập có chứa từ ngữ không phù hợp hoặc gây hấn hay không. Nếu có, khách hàng sẽ được nhắc diễn đạt lại thông báo. Tin nhắn sẽ không chuyển sang bước tiếp theo nếu chứa ngôn từ độc hại.

Điều này giúp duy trì các cuộc trò chuyện tôn trọng để nhân viên hỗ trợ khách hàng xem xét và theo dõi (nếu cần).

4. Yêu cầu được gửi đến máy chủ

Sau đó, truy vấn đã dịch được chuyển đến một mô hình phía máy chủ được huấn luyện bằng dữ liệu của Policybazaar và trả về câu trả lời bằng tiếng Anh cho câu hỏi.

Khách hàng có thể nhận được câu trả lời và đề xuất được cá nhân hoá, cũng như câu trả lời cho các câu hỏi phức tạp hơn về sản phẩm.

5. Dịch sang ngôn ngữ của khách hàng

Translator API (dùng để dịch truy vấn ban đầu) sẽ dịch truy vấn đó trở lại ngôn ngữ của khách hàng, như được phát hiện bởi Language Detector API. Xin nhắc lại rằng các API này chạy phía máy khách, vì vậy, tất cả công việc đó đều diễn ra trên thiết bị của họ. Điều này có nghĩa là khách hàng có thể được hỗ trợ bằng ngôn ngữ chính của họ, giúp những người không nói tiếng Anh có thể sử dụng chatbot.

Cấu trúc kết hợp

Finova AI chạy trên cả nền tảng máy tính và thiết bị di động, dựa vào nhiều mô hình để tạo ra kết quả cuối cùng. Policybazaar đã xây dựng một cấu trúc kết hợp, trong đó một phần của giải pháp chạy phía máy khách và một phần chạy phía máy chủ.

Có một số lý do khiến bạn nên triển khai cấu trúc kết hợp, cho dù bạn chỉ sử dụng một hay nhiều mô hình.

Đánh giá khả năng của mô hình phía máy khách. Quay lại phía máy chủ khi cần.
- Hạn chế về dữ liệu mô hình: Mô hình ngôn ngữ có thể rất khác nhau về kích thước, điều này cũng xác định các chức năng cụ thể. Ví dụ: hãy xem xét trường hợp người dùng đặt câu hỏi cá nhân liên quan đến dịch vụ mà bạn đang cung cấp. Mô hình phía máy khách có thể trả lời câu hỏi nếu được huấn luyện trong lĩnh vực cụ thể đó. Tuy nhiên, nếu không thể, bạn có thể quay lại phương thức triển khai phía máy chủ. Phương thức này được huấn luyện trên một tập dữ liệu phức tạp và lớn hơn.
- Độ tin cậy của mô hình: Trong các mô hình phân loại, chẳng hạn như kiểm duyệt nội dung hoặc phát hiện gian lận, mô hình phía máy khách có thể đưa ra điểm tin cậy thấp hơn. Trong trường hợp này, bạn nên quay lại sử dụng mô hình phía máy chủ mạnh mẽ hơn.
Hỗ trợ nhiều chức năng của thiết bị.
- Hạn chế về phần cứng: Lý tưởng nhất là tất cả người dùng đều có thể sử dụng các tính năng AI. Trong thực tế, người dùng sử dụng nhiều loại thiết bị và không phải thiết bị nào cũng có thể hỗ trợ suy luận AI. Nếu một thiết bị không thể hỗ trợ suy luận phía máy khách, bạn có thể quay lại máy chủ. Với phương pháp này, bạn có thể giúp tính năng của mình dễ tiếp cận hơn, đồng thời giảm thiểu chi phí và độ trễ khi có thể.
- Hạn chế về mạng: Nếu người dùng đang ở chế độ ngoại tuyến hoặc trên mạng không ổn định nhưng có mô hình được lưu vào bộ nhớ đệm trên trình duyệt, thì bạn có thể chạy mô hình ở phía máy khách.
Yêu cầu về quyền riêng tư.
- Bạn có thể có các yêu cầu nghiêm ngặt về quyền riêng tư đối với ứng dụng của mình. Ví dụ: nếu một phần của luồng người dùng yêu cầu xác minh danh tính bằng thông tin cá nhân hoặc tính năng phát hiện khuôn mặt, hãy chọn mô hình phía máy khách để xử lý dữ liệu trên thiết bị và gửi kết quả xác minh (chẳng hạn như đạt hoặc không đạt) đến mô hình phía máy chủ cho các bước tiếp theo.

Đối với Policybazaar, nơi cần độ trễ thấp, hiệu quả chi phí và quyền riêng tư, giải pháp phía máy khách đã được sử dụng. Khi cần các mô hình phức tạp hơn được huấn luyện trên dữ liệu tuỳ chỉnh, chúng tôi đã sử dụng giải pháp phía máy chủ.

Ở đây, chúng ta sẽ xem xét kỹ hơn cách triển khai mô hình phía máy khách.

Phát hiện nội dung độc hại phía máy khách

Sau khi thông báo được dịch, thông báo của khách hàng sẽ được chuyển đến mô hình phát hiện nội dung độc hại TensorFlow.js chạy phía máy khách trên máy tính và thiết bị di động. Vì bản chép lời sẽ được chuyển tiếp đến nhân viên hỗ trợ để tiếp tục xử lý, nên bạn cần tránh sử dụng ngôn từ độc hại. Tin nhắn được phân tích trên thiết bị của người dùng trước khi được gửi đến máy chủ, sau đó là nhân viên hỗ trợ cuối cùng.

Ngoài ra, tính năng phân tích phía máy khách cho phép xoá thông tin nhạy cảm. Quyền riêng tư của người dùng là ưu tiên hàng đầu và suy luận phía máy khách giúp thực hiện được điều đó.

Mỗi thông báo đều cần thực hiện một số bước. Với tính năng phát hiện nội dung độc hại, ngoài việc phát hiện và dịch ngôn ngữ, mỗi tin nhắn sẽ yêu cầu nhiều lượt đi và về đến máy chủ. Bằng cách thực hiện các tác vụ này ở phía máy khách, Policybazaar có thể hạn chế đáng kể chi phí dự kiến cho tính năng.

Policybazaar đã chuyển từ WebGL sang phần phụ trợ WebGPU (dành cho các trình duyệt được hỗ trợ) và thời gian suy luận đã cải thiện gấp 10 lần. Người dùng nhận được phản hồi nhanh hơn để sửa đổi thông báo, nhờ đó tăng mức độ tương tác và sự hài lòng của khách hàng.

// Create an instance of the toxicity model.
const createToxicityModelInstance = async () => {
  try {
    //use WebGPU backend if available
    if (navigator.gpu) {
        await window.tf.setBackend('webgpu');
        await window.tf.ready();
    }

    return await window.toxicity.load(0.9).then(model => {
      return model;
    }).catch(error => {
      console.log(error);
      return null;
    });
  } catch (er) {
      console.error(er);
  }
}

Mức độ tương tác và tỷ lệ nhấp cao

Bằng cách kết hợp nhiều mô hình với API web, Policybazaar đã mở rộng thành công dịch vụ hỗ trợ khách hàng sau giờ làm việc. Kết quả ban đầu từ bản phát hành giới hạn của tính năng này cho thấy mức độ tương tác cao của người dùng.

73% người dùng đã mở chatbot đã tham gia vào các cuộc trò chuyện gồm nhiều câu hỏi, kéo dài vài phút, dẫn đến tỷ lệ thoát thấp. Hơn nữa, chương trình thí điểm đã cho thấy tỷ lệ nhấp vào lời kêu gọi hành động hỗ trợ khách hàng mới này cao hơn gấp 2 lần, cho thấy khách hàng đã tương tác thành công với Finova để giải đáp thắc mắc. Hơn nữa, việc chuyển sang phần phụ trợ WebGPU để phát hiện nội dung độc hại phía máy khách đã tăng tốc độ suy luận lên gấp 10 lần, nhờ đó người dùng có thể phản hồi nhanh hơn.