Sie können jetzt
Intl.Segmenter
zur Aufteilung eines Strings in Wörter, Sätze,
oder Graphems bezeichnet.
Unterstützte Browser
- <ph type="x-smartling-placeholder">
- <ph type="x-smartling-placeholder">
- <ph type="x-smartling-placeholder">
- <ph type="x-smartling-placeholder">
Viele nicht-lateinische Sprachen wie Chinesisch und Japanisch
verwenden Sie keine Leerzeichen, um Wörter zu trennen. Wenn Sie also den JavaScript-split()
auf Leerzeichen zum Aufteilen von Text in Wörter verwendet, werden falsche Ergebnisse zurückgegeben.
Wenn Sie ein neues Intl.Segmenter
-Objekt mit der Methode
Intl.segmenter()
-Konstruktor,
übergeben Sie eine locale
und Optionen, darunter granularity
,
haben die Werte "grapheme"
, "word"
oder "sentence"
. Die folgenden
wird ein neues Intl.Segmenter
-Objekt für Japanisch erstellt, das nach Wörtern aufteilt.
const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' });
Durch Aufrufen der
segment()
-Methode auf einem Intl.Segmenter
-Objekt mit einem Textstring
gibt einen iterierbaren Wert zurück:
const segments = segmenter.segment(str);
console.table(Array.from(segments));
Intl.Segmenter API verwenden im Polypane-Blog finden Sie ein hervorragendes Tutorial zur Verwendung dieser Funktion.
Internationale Textsegmentierung mit Intl.Segmenter in JavaScript
finden Sie weitere Beispiele, darunter die Verwendung von Intl.Segmenter
mit Emojis.