עכשיו אפשר להשתמש
Intl.Segmenter
לפילוח טקסט תלוי-מיקום כדי לפצל מחרוזת למילים, למשפטים
או גרפים.
הרבה שפות שאינן לטיניות, כמו סינית ויפנית,
לא משתמשים ברווחים כדי להפריד בין המילים. לכן, שימוש ב-JavaScript split()
על מקש הרווח הלבן כדי לפצל את הטקסט למילים, תחזיר תוצאות שגויות.
כשיוצרים אובייקט Intl.Segmenter
חדש עם
Intl.segmenter()
constructor,
להעביר ב-locale
ואפשרויות כולל granularity
, שניתן
הם "grapheme"
, "word"
או "sentence"
. הבאים
הדוגמה יוצרת אובייקט Intl.Segmenter
חדש ליפנית, לפי פיצול למילים.
const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' });
קריאה ל
segment()
method באובייקט Intl.Segmenter
עם מחרוזת טקסט
מחזירה ערך איטרציה:
const segments = segmenter.segment(str);
console.table(Array.from(segments));
איך משתמשים ב-Intl.Segmenter API בבלוג Polypane כדי לקבל מדריך מצוין על השימוש בתכונה הזו.
פילוח טקסט בינלאומי באמצעות Intl.Segmenter ב-JavaScript
יש דוגמאות נוספות, כולל איך להשתמש ב-Intl.Segmenter
עם אמוג'י.