Intl.Segmenter 对象现已纳入 Baseline
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
您现在可以使用
Intl.Segmenter
用于将字符串拆分为字词、句子、
或字形。
许多非拉丁语系的语言,如中文和日语,
不要使用空格分隔字词。因此,使用 JavaScript split()
方法将文本拆分为单词,会返回错误的结果。
使用Intl.Segmenter
Intl.segmenter()
构造函数,
传入 locale
和选项,包括 granularity
,
具有的值为 "grapheme"
、"word"
或 "sentence"
。以下
示例会为日语创建一个新的 Intl.Segmenter
对象,并按单词进行拆分。
const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' });
调用
segment()
针对带有文本字符串的 Intl.Segmenter
对象调用该方法
返回一个可迭代对象:
const segments = segmenter.segment(str);
console.table(Array.from(segments));
阅读使用 Intl.Segmenter API
,了解有关如何使用该功能的优秀教程。
在 JavaScript 中使用 Intl.Segmenter 进行国际文本分割
提供更多示例,包括如何将 Intl.Segmenter
与表情符号搭配使用。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2024-04-18。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"没有我需要的信息"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"太复杂/步骤太多"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"内容需要更新"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻译问题"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"示例/代码问题"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"其他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"易于理解"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"解决了我的问题"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"其他"
}]
{"lastModified": "\u6700\u540e\u66f4\u65b0\u65f6\u95f4 (UTC)\uff1a2024-04-18\u3002"}
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["没有我需要的信息","missingTheInformationINeed","thumb-down"],["太复杂/步骤太多","tooComplicatedTooManySteps","thumb-down"],["内容需要更新","outOfDate","thumb-down"],["翻译问题","translationIssue","thumb-down"],["示例/代码问题","samplesCodeIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2024-04-18。"],[],[]]