Đối tượng Phân đoạn quốc tế hiện đã có trong Baseline
Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Rachel Andrew
Bạn hiện có thể dùng
Intl.Segmenter
để phân đoạn văn bản theo ngôn ngữ để tách một chuỗi thành các từ, câu
hoặc biểu đồ.
Nhiều ngôn ngữ không phải tiếng Latinh, chẳng hạn như tiếng Trung và tiếng Nhật,
không sử dụng dấu cách để phân tách từ. Do đó, việc sử dụng JavaScript split()
trên khoảng trắng để tách văn bản thành các từ, sẽ trả về kết quả không chính xác.
Khi tạo một đối tượng Intl.Segmenter mới bằng thuộc tính
Hàm khởi tạo Intl.segmenter(),
truyền vào locale và các tuỳ chọn bao gồm granularity.
có giá trị "grapheme", "word" hoặc "sentence". Nội dung sau đây
Ví dụ: sẽ tạo một đối tượng Intl.Segmenter mới cho tiếng Nhật, phân tách theo các từ.
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],["Cập nhật lần gần đây nhất: 2024-04-18 UTC."],[],[]]