您現在可以使用
Intl.Segmenter
敬上
適用於依語言代碼區分的文字區隔,將字串拆成字詞、語句
圖形或圖形
許多非拉丁語系語言,例如中文和日文
請勿使用空格來分隔字詞。因此,使用 JavaScript split()
將文字分割成字詞的方法,傳回錯誤結果。
使用Intl.Segmenter
Intl.segmenter()
建構函式;
傳入 locale
和 granularity
等選項,這可
值為 "grapheme"
、"word"
或 "sentence"
。下列
範例會為日文建立新的 Intl.Segmenter
物件,以分割字詞。
const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' });
呼叫
segment()
敬上
方法為包含文字字串的 Intl.Segmenter
物件方法
會傳回可疊代:
const segments = segmenter.segment(str);
console.table(Array.from(segments));
在 JavaScript 中使用 Intl.Segmenter 的國際文字區隔
還有其他範例,包括如何將 Intl.Segmenter
與表情符號搭配使用。