diff --git a/common/annotations/en.xml b/common/annotations/en.xml index 3049562b43a..9e3bf170ee9 100644 --- a/common/annotations/en.xml +++ b/common/annotations/en.xml @@ -3907,21 +3907,21 @@ annotations. superscript three measure | micro sign micro sign - - harp - music | instrument | love | cupid | orchestra - shovel - dig | spade | hole | scoop - leafless tree - winter | barren | drought - fingerprint - forensics | identity | safety - root vegetable - root | vegetable | garden | beet | turnip - splatter - paint | holi | spill | stain - face with bags under eyes - tired | sleepy | exhausted - + + music | instrument | love | cupid | orchestra + harp + dig | spade | hole | scoop + shovel + winter | barren | drought + leafless tree + forensics | identity | safety + fingerprint + root | vegetable | garden | beet | turnip + root vegetable + paint | holi | spill | stain + splatter + tired | sleepy | exhausted + face with bags under eyes + diff --git a/common/annotations/he.xml b/common/annotations/he.xml index b5e7d976868..8d75f08ee09 100644 --- a/common/annotations/he.xml +++ b/common/annotations/he.xml @@ -2868,7 +2868,7 @@ Warnings: All cp values have U+FE0F characters removed. See /annotationsDerived/ ג׳וקר | משחק | קלף ג׳וקר אדום | דרקון | דרקון אדום במה-ג׳ונג | מה-ג׳ונג | משחק - דרקון אדום ‎מה-ג׳ונג + דרקון אדום מה-ג׳ונג יפני | משחק | קלף | קלפי פרחים קלפי פרחים אמנויות הבמה | במה | דרמה | מסיכות | משחק | תיאטרון | פורים diff --git a/common/annotations/ur.xml b/common/annotations/ur.xml index 88002d8e4fd..fc16ba1914b 100644 --- a/common/annotations/ur.xml +++ b/common/annotations/ur.xml @@ -2129,7 +2129,7 @@ Warnings: All cp values have U+FE0F characters removed. See /annotationsDerived/ ٹمالے بھری ہوئی | بھری ہوئی چپاتی | چپاتی | خوراک | کباب | فلافل | روٹی | نان | روٹ | جائرو بھری ہوئی چپاتی - چنا | فلافل | کوفتہ | سفید چنا | کھانا | ‏‏‏غذا + چنا | فلافل | کوفتہ | سفید چنا | کھانا | غذا فلافل انڈا | خوراک | بیضہ | مرغ | آملیٹ | کیک | نانختائی انڈا @@ -2205,7 +2205,7 @@ Warnings: All cp values have U+FE0F characters removed. See /annotationsDerived/ آئس کریم ڈونٹ | میٹھا | شیریں | خوراک | شیرینی | کھانا ڈونٹ - کوکی | میٹھا | شیرینی | ‫نان ختایی‬‎ | میٹھاس | چاکلیٹ والی نان ختایی + کوکی | میٹھا | شیرینی | نان ختایی | میٹھاس | چاکلیٹ والی نان ختایی کوکی پیسٹری | جشن | سالگرہ کا کیک | کیک | میٹھا | سالگرہ مبارک | سالگرہ | ہیپی برتھ ڈے | برتھ ڈے | پیدائش | شیرینی | برتھ ڈے کیک سالگرہ کا کیک diff --git a/common/transforms/Arabic-Latin.xml b/common/transforms/Arabic-Latin.xml index 205c46baad8..7ea77f9a5c3 100644 --- a/common/transforms/Arabic-Latin.xml +++ b/common/transforms/Arabic-Latin.xml @@ -22,7 +22,7 @@ For terms of use, see http://www.unicode.org/copyright.html # Does *not* do assimilation of "al", nor hyphenation. # While it could be done, we need to determine whether a prefix "al" could # occur other than as the definite article (since no space is used). -:: [[:Arabic:][:block=ARABIC:][‎ⁿ،؛؟ـً-ٕ٠-٬۰-۹﷼ښ]] ; +:: [[:Arabic:][:block=ARABIC:][‎ⁿ،؛؟ـً-ٕ٠-٬۰-۹﷼ښ][\u0611\u0670]] ; :: NFKD (NFC); $disambig = ̱ ; $disambig2 = ̰ ; @@ -190,6 +190,9 @@ $notAbove = [[:^ccc=0:] & [:^ccc=230:]]; ‎ہ‎ → ḥ ; ‎ە‎ → ĥ ; +# Delete marks without correspondants +[\u0611\u0670] → ; + # fallbacks | s ← c } [eiy]; | k ← c ;