From eb6a4f2680f9cae517cac79c49db7d4534945fd9 Mon Sep 17 00:00:00 2001 From: Stefan Vukovic Date: Fri, 22 Nov 2024 23:51:27 +0100 Subject: [PATCH] handle unenumerated etymologies --- 3-tidy-up.js | 10 +- data/test/dict/de/de/term_bank_1.json | 132 +++++++++---------- data/test/dict/de/de/term_bank_2.json | 153 ++++++++++++++++++++++ data/test/ipa/de/de/term_meta_bank_1.json | 19 +++ data/test/kaikki/de-de.json | 2 + data/test/tidy/de-de-forms-0.json | 64 +++++++++ data/test/tidy/de-de-lemmas.json | 77 ++++++++++- 7 files changed, 383 insertions(+), 74 deletions(-) create mode 100644 data/test/dict/de/de/term_bank_2.json create mode 100644 data/test/ipa/de/de/term_meta_bank_1.json diff --git a/3-tidy-up.js b/3-tidy-up.js index 8f87a61..b78576b 100644 --- a/3-tidy-up.js +++ b/3-tidy-up.js @@ -186,7 +186,15 @@ function handleLine(parsedLine) { const glossTree = getGlossTree(sensesWithoutInflectionGlosses); for (const reading of readings) { - lemmaDict[word][reading][pos][String(etymology_number)].glossTree = glossTree; + let result = lemmaDict[word][reading][pos][String(etymology_number)]; + let etym_num = etymology_number; + while (result && result.glossTree && result.glossTree.size > 0) { + etym_num += 1; + result = lemmaDict[word][reading][pos][String(etym_num)]; + } + result = /** @type {LemmaInfo}*/ (ensureNestedObject(lemmaDict, [word, reading, pos, String(etym_num)])); + result.ipa ??= ipa; + result.glossTree = glossTree; } } diff --git a/data/test/dict/de/de/term_bank_1.json b/data/test/dict/de/de/term_bank_1.json index 7d4e966..8dc9b81 100644 --- a/data/test/dict/de/de/term_bank_1.json +++ b/data/test/dict/de/de/term_bank_1.json @@ -1,83 +1,71 @@ [ [ - "befruchteten", + "Rock", "", - "non-lemma", "", + "n", 0, [ - [ - "befruchtet", - [ - "Genitiv Singular Maskulinum der starken Deklination des Positivs" + { + "type": "structured-content", + "content": [ + { + "tag": "div", + "content": [ + "populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", + { + "tag": "div", + "data": { + "content": "extra-info" + }, + "content": { + "tag": "div", + "data": { + "content": "example-sentence" + }, + "content": [ + { + "tag": "div", + "data": { + "content": "example-sentence-a" + }, + "content": "Der Rock ist nicht totzukriegen." + }, + { + "tag": "div", + "data": { + "content": "example-sentence-b" + } + } + ] + } + } + ] + } ] - ], - [ - "befruchtet", - [ - "Akkusativ Singular Maskulinum der starken Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Genitiv Singular Neutrum der starken Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Dativ Plural alle Genera der starken Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Genitiv Singular alle Genera der schwachen Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Dativ Singular alle Genera der schwachen Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Akkusativ Singular Maskulinum der schwachen Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Alle Kasus Plural alle Genera der schwachen Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Genitiv Singular alle Genera der gemischten Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Dativ Singular alle Genera der gemischten Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Akkusativ Singular Maskulinum der gemischten Deklination des Positivs" - ] - ], - [ - "befruchtet", - [ - "Alle Kasus Plural alle Genera der gemischten Deklination des Positivs" + } + ], + 0, + "" + ], + [ + "Rock", + "", + "", + "n", + 0, + [ + { + "type": "structured-content", + "content": [ + { + "tag": "div", + "content": [ + "in arabischen Märchen: flugfähiger Vogel in der Größe eines Elefanten" + ] + } ] - ] + } ], 0, "" diff --git a/data/test/dict/de/de/term_bank_2.json b/data/test/dict/de/de/term_bank_2.json new file mode 100644 index 0000000..eb91874 --- /dev/null +++ b/data/test/dict/de/de/term_bank_2.json @@ -0,0 +1,153 @@ +[ + [ + "befruchteten", + "", + "non-lemma", + "", + 0, + [ + [ + "befruchtet", + [ + "Genitiv Singular Maskulinum der starken Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Akkusativ Singular Maskulinum der starken Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Genitiv Singular Neutrum der starken Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Dativ Plural alle Genera der starken Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Genitiv Singular alle Genera der schwachen Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Dativ Singular alle Genera der schwachen Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Akkusativ Singular Maskulinum der schwachen Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Alle Kasus Plural alle Genera der schwachen Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Genitiv Singular alle Genera der gemischten Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Dativ Singular alle Genera der gemischten Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Akkusativ Singular Maskulinum der gemischten Deklination des Positivs" + ] + ], + [ + "befruchtet", + [ + "Alle Kasus Plural alle Genera der gemischten Deklination des Positivs" + ] + ] + ], + 0, + "" + ], + [ + "des Rock", + "", + "non-lemma", + "", + 0, + [ + [ + "Rock", + [ + "genitive singular" + ] + ] + ], + 0, + "" + ], + [ + "des Rocks", + "", + "non-lemma", + "", + 0, + [ + [ + "Rock", + [ + "genitive singular" + ] + ] + ], + 0, + "" + ], + [ + "dem Rock", + "", + "non-lemma", + "", + 0, + [ + [ + "Rock", + [ + "dative singular" + ] + ] + ], + 0, + "" + ], + [ + "den Rock", + "", + "non-lemma", + "", + 0, + [ + [ + "Rock", + [ + "accusative singular" + ] + ] + ], + 0, + "" + ] +] \ No newline at end of file diff --git a/data/test/ipa/de/de/term_meta_bank_1.json b/data/test/ipa/de/de/term_meta_bank_1.json new file mode 100644 index 0000000..e3af06d --- /dev/null +++ b/data/test/ipa/de/de/term_meta_bank_1.json @@ -0,0 +1,19 @@ +[ + [ + "Rock", + "ipa", + { + "reading": "Rock", + "transcriptions": [ + { + "ipa": "ʁɔk", + "tags": [] + }, + { + "ipa": "ɹɔk", + "tags": [] + } + ] + } + ] +] \ No newline at end of file diff --git a/data/test/kaikki/de-de.json b/data/test/kaikki/de-de.json index a2642ed..cc6c3dc 100644 --- a/data/test/kaikki/de-de.json +++ b/data/test/kaikki/de-de.json @@ -1 +1,3 @@ {"word": "befruchteten", "pos": "adj", "lang_code": "de", "lang": "Deutsch", "senses": [{"glosses": ["Genitiv Singular Maskulinum der starken Deklination des Positivs des Adjektivs befruchtet"], "tags": ["genitive", "masculine", "singular"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Akkusativ Singular Maskulinum der starken Deklination des Positivs des Adjektivs befruchtet"], "tags": ["accusative", "masculine", "singular"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Genitiv Singular Neutrum der starken Deklination des Positivs des Adjektivs befruchtet"], "tags": ["genitive", "neuter", "singular"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Dativ Plural alle Genera der starken Deklination des Positivs des Adjektivs befruchtet"], "tags": ["dative", "plural"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Genitiv Singular alle Genera der schwachen Deklination des Positivs des Adjektivs befruchtet"], "tags": ["genitive", "singular"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Dativ Singular alle Genera der schwachen Deklination des Positivs des Adjektivs befruchtet"], "tags": ["dative", "singular"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Akkusativ Singular Maskulinum der schwachen Deklination des Positivs des Adjektivs befruchtet"], "tags": ["accusative", "masculine", "singular"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Alle Kasus Plural alle Genera der schwachen Deklination des Positivs des Adjektivs befruchtet"], "tags": ["plural"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Genitiv Singular alle Genera der gemischten Deklination des Positivs des Adjektivs befruchtet"], "tags": ["genitive", "singular"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Dativ Singular alle Genera der gemischten Deklination des Positivs des Adjektivs befruchtet"], "tags": ["dative", "singular"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Akkusativ Singular Maskulinum der gemischten Deklination des Positivs des Adjektivs befruchtet"], "tags": ["accusative", "masculine", "singular"], "form_of": [{"word": "befruchtet"}]}, {"glosses": ["Alle Kasus Plural alle Genera der gemischten Deklination des Positivs des Adjektivs befruchtet"], "tags": ["plural"], "form_of": [{"word": "befruchtet"}]}], "sounds": [{"ipa": "bəˈfʁʊxtətn̩"}, {"audio": "De-befruchteten.ogg", "ogg_url": "https://commons.wikimedia.org/wiki/Special:FilePath/De-befruchteten.ogg", "mp3_url": "https://upload.wikimedia.org/wikipedia/commons/transcoded/c/c4/De-befruchteten.ogg/De-befruchteten.ogg.mp3"}, {"rhymes": "-ʊxtətn̩"}], "tags": ["form-of"], "categories": ["Anagramm sortiert (Deutsch)", "Deklinierte Form (Deutsch)", "Deutsch", "Einträge mit Endreim (Deutsch)", "Rückläufige Wörterliste (Deutsch)", "siehe auch"]} +{"word": "Rock", "pos": "noun", "lang_code": "de", "lang": "Deutsch", "senses": [{"glosses": ["populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand"], "raw_tags": ["Musik"], "examples": [{"text": "Der Rock ist nicht totzukriegen."}, {"text": "„Filme und TV-Serien, Rock, Rap und Dancepop, die kreative Zitierkultur des Internets (Mashups, Meme und Co.) werden nicht für eine edle Elite, sondern für eine demokratische Massengesellschaft geschaffen.“", "ref": "Eric T. Hansen mit Astrid Ule: Die ängstliche Supermacht. Warum Deutschland endlich erwachsen werden muss. Lübbe, Köln 2013, ISBN 978-3-431-03874-3, Seite 210.", "author": "Eric T. Hansen mit Astrid Ule", "title": "Die ängstliche Supermacht", "title_complement": "Warum Deutschland endlich erwachsen werden muss", "pages": "210.", "year": "2013", "publisher": "Lübbe", "place": "Köln", "isbn": "978-3-431-03874-3"}, {"text": "Sindbad band sich, um seinem Schicksal auf einer abgelegenen Insel zu entkommen, an ein Bein des Vogels Rock."}, {"text": "„Er erinnerte fich. daß ihm die Schiffer fchon längft vom Riefenvogel Rock erzählt hatten. der fo groß und ftark wäre. daß er einen Elefanten mit fich zu tragen imftande wäre.“ ()", "ref": "Fehlender Parameter (Hilfe) Abgerufen am 20. Oktober 2017."}], "sense_index": "1"}], "translations": [{"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "рок", "lang_code": "bg", "lang": "Bulgarisch", "roman": "rok", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "搖滾樂", "lang_code": "zh-tw", "lang": "Chinesisch (traditionell)", "roman": "yáogǔn yuè", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "摇滚乐", "lang_code": "zh-cn", "lang": "Chinesisch (vereinfacht)", "roman": "yáogǔn yuè", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "da", "lang": "Dänisch", "sense_index": "1", "raw_tags": ["u"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "en", "lang": "Englisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rockur", "lang_code": "fo", "lang": "Färöisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rokkur", "lang_code": "fo", "lang": "Färöisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rokki", "lang_code": "fi", "lang": "Finnisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "fi", "lang": "Finnisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "fr", "lang": "Französisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "ροκ", "lang_code": "el", "lang": "Griechisch (Neu-)", "roman": "rok", "sense_index": "1", "tags": ["neuter"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "રૉક", "lang_code": "gu", "lang": "Gujarati", "roman": "rôk", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "रॉक", "lang_code": "hi", "lang": "Hindi", "roman": "rôk", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rokk", "lang_code": "is", "lang": "Isländisch", "sense_index": "1", "tags": ["neuter"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "it", "lang": "Italienisch", "sense_index": "1", "tags": ["masculine"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "ロック", "lang_code": "ja", "lang": "Japanisch", "roman": "rokku", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "ロックンロール", "lang_code": "ja", "lang": "Japanisch", "roman": "rokkunrōru", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "roks", "lang_code": "lv", "lang": "Lettisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rokas", "lang_code": "lt", "lang": "Litauisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "nl", "lang": "Niederländisch", "sense_index": "1", "tags": ["masculine"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rohkka", "lang_code": "se", "lang": "Nordsamisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "nb", "lang": "Bokmål", "sense_index": "1", "tags": ["masculine"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "nn", "lang": "Nynorsk", "sense_index": "1", "tags": ["masculine"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "roque", "lang_code": "pt", "lang": "Portugiesisch", "sense_index": "1", "tags": ["masculine"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "pt", "lang": "Portugiesisch", "sense_index": "1", "tags": ["masculine"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "рок", "lang_code": "ru", "lang": "Russisch", "roman": "rok", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "sv", "lang": "Schwedisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "рок", "lang_code": "sr", "lang": "Serbisch", "roman": "rok", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "es", "lang": "Spanisch", "sense_index": "1"}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "rock", "lang_code": "cs", "lang": "Tschechisch", "sense_index": "1", "tags": ["masculine"]}, {"sense": "Musik: populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", "word": "рок", "lang_code": "uk", "lang": "Ukrainisch", "roman": "rok", "sense_index": "1"}], "sounds": [{"ipa": "ʁɔk"}, {"ipa": "ɹɔk", "raw_tags": ["auch:"]}, {"audio": "De-Rock.ogg", "ogg_url": "https://commons.wikimedia.org/wiki/Special:FilePath/De-Rock.ogg", "mp3_url": "https://upload.wikimedia.org/wikipedia/commons/transcoded/d/df/De-Rock.ogg/De-Rock.ogg.mp3"}, {"audio": "De-Rock2.ogg", "ogg_url": "https://commons.wikimedia.org/wiki/Special:FilePath/De-Rock2.ogg", "mp3_url": "https://upload.wikimedia.org/wikipedia/commons/transcoded/b/b1/De-Rock2.ogg/De-Rock2.ogg.mp3"}, {"audio": "De-Rock3.ogg", "ogg_url": "https://commons.wikimedia.org/wiki/Special:FilePath/De-Rock3.ogg", "mp3_url": "https://upload.wikimedia.org/wikipedia/commons/transcoded/2/2c/De-Rock3.ogg/De-Rock3.ogg.mp3", "raw_tags": ["auch:"]}, {"rhymes": "-ɔk"}], "antonyms": [{"word": "Blues", "sense_index": "1"}, {"word": "Country", "sense_index": "1"}, {"word": "Folk", "sense_index": "1"}, {"word": "Jazz", "sense_index": "1"}, {"word": "Pop", "sense_index": "1"}, {"word": "Klassik", "sense_index": "1"}, {"word": "Reggae", "sense_index": "1"}, {"word": "Techno", "sense_index": "1"}, {"word": "Volksmusik", "sense_index": "1"}], "derived": [{"word": "rocken"}, {"word": "Rocker"}, {"word": "Rockkonzert"}, {"word": "Rockmusik"}, {"word": "Rockoper"}, {"word": "Rocksänger"}], "hyponyms": [{"word": "Beat", "sense_index": "1"}, {"word": "Hardrock", "sense_index": "1"}, {"word": "Metal", "sense_index": "1"}, {"word": "Punk", "sense_index": "1"}, {"word": "Punkrock", "sense_index": "1"}], "hypernyms": [{"word": "Musik", "sense_index": "1"}, {"word": "Kultur", "sense_index": "1"}], "synonyms": [{"word": "Rock 'n' Roll", "sense_index": "1"}], "tags": ["masculine"], "categories": ["Anagramm sortiert (Deutsch)", "Deutsch", "Einträge mit Endreim (Deutsch)", "Grundformeintrag (Deutsch)", "Rückläufige Wörterliste (Deutsch)", "Rückläufige Wörterliste Grundformeintrag (Deutsch)", "Singularetantum (Deutsch)", "Substantiv (Deutsch)", "Substantiv m (Deutsch)", "Wiktionary:Illustration", "siehe auch", "Übersetzungen (Englisch)"], "etymology_text": "in den 50er Jahren des 20. Jahrhunderts von englisch rock ^(→ en) Rock 'n' Roll entlehnt, einem amerikanischen Slang-Ausdruck, nach den Schaukelbewegungen der Schiffe (to rock = stampfen und to roll = rollen)", "forms": [{"form": "der Rock", "tags": ["nominative", "singular"]}, {"form": "des Rock", "tags": ["genitive", "singular"]}, {"form": "des Rocks", "tags": ["genitive", "singular"]}, {"form": "dem Rock", "tags": ["dative", "singular"]}, {"form": "den Rock", "tags": ["accusative", "singular"]}], "hyphenation": "Rock"} +{"word": "Rock", "pos": "noun", "lang_code": "de", "lang": "Deutsch", "senses": [{"glosses": ["in arabischen Märchen: flugfähiger Vogel in der Größe eines Elefanten"], "examples": [{"text": "Sindbad band sich, um seinem Schicksal auf einer abgelegenen Insel zu entkommen, an ein Bein des Vogels Rock."}, {"text": "„Er erinnerte fich. daß ihm die Schiffer fchon längft vom Riefenvogel Rock erzählt hatten. der fo groß und ftark wäre. daß er einen Elefanten mit fich zu tragen imftande wäre.“ ()", "ref": "Fehlender Parameter (Hilfe) Abgerufen am 20. Oktober 2017."}], "sense_index": "1"}], "sounds": [{"ipa": "ʁɔk"}, {"audio": "De-Rock.ogg", "ogg_url": "https://commons.wikimedia.org/wiki/Special:FilePath/De-Rock.ogg", "mp3_url": "https://upload.wikimedia.org/wikipedia/commons/transcoded/d/df/De-Rock.ogg/De-Rock.ogg.mp3"}, {"audio": "De-Rock2.ogg", "ogg_url": "https://commons.wikimedia.org/wiki/Special:FilePath/De-Rock2.ogg", "mp3_url": "https://upload.wikimedia.org/wikipedia/commons/transcoded/b/b1/De-Rock2.ogg/De-Rock2.ogg.mp3"}, {"rhymes": "-ɔk"}], "hypernyms": [{"word": "Fabelwesen", "sense_index": "1"}], "synonyms": [{"word": "Simurgh", "sense_index": "1"}], "tags": ["masculine"], "categories": ["Anagramm sortiert (Deutsch)", "Deutsch", "Einträge mit Endreim (Deutsch)", "Grundformeintrag (Deutsch)", "Rückläufige Wörterliste (Deutsch)", "Rückläufige Wörterliste Grundformeintrag (Deutsch)", "Singularetantum (Deutsch)", "Substantiv (Deutsch)", "Substantiv m (Deutsch)", "siehe auch"], "etymology_text": "von arabisch/persisch ruh, roh entlehnt, = arabisch: الرُخّ (ar-ruchch, aus dem Persischen)", "forms": [{"form": "der Rock", "tags": ["nominative", "singular"]}, {"form": "des Rock", "tags": ["genitive", "singular"]}, {"form": "des Rocks", "tags": ["genitive", "singular"]}, {"form": "dem Rock", "tags": ["dative", "singular"]}, {"form": "den Rock", "tags": ["accusative", "singular"]}], "hyphenation": "Rock"} diff --git a/data/test/tidy/de-de-forms-0.json b/data/test/tidy/de-de-forms-0.json index 4dbdd1c..27ecd2e 100644 --- a/data/test/tidy/de-de-forms-0.json +++ b/data/test/tidy/de-de-forms-0.json @@ -33,6 +33,70 @@ ] ] } + ], + [ + "Rock", + { + "_type": "map", + "map": [ + [ + "des Rock", + { + "_type": "map", + "map": [ + [ + "noun", + [ + "genitive singular" + ] + ] + ] + } + ], + [ + "des Rocks", + { + "_type": "map", + "map": [ + [ + "noun", + [ + "genitive singular" + ] + ] + ] + } + ], + [ + "dem Rock", + { + "_type": "map", + "map": [ + [ + "noun", + [ + "dative singular" + ] + ] + ] + } + ], + [ + "den Rock", + { + "_type": "map", + "map": [ + [ + "noun", + [ + "accusative singular" + ] + ] + ] + } + ] + ] + } ] ] } \ No newline at end of file diff --git a/data/test/tidy/de-de-lemmas.json b/data/test/tidy/de-de-lemmas.json index 9e26dfe..9613eef 100644 --- a/data/test/tidy/de-de-lemmas.json +++ b/data/test/tidy/de-de-lemmas.json @@ -1 +1,76 @@ -{} \ No newline at end of file +{ + "Rock": { + "Rock": { + "noun": { + "0": { + "ipa": [ + { + "ipa": "ʁɔk", + "tags": [] + }, + { + "ipa": "ɹɔk", + "tags": [] + } + ], + "glossTree": { + "_type": "map", + "map": [ + [ + "populäre Musikrichtung, die Anfang der 1950er Jahre in den USA entstand", + { + "_type": "map", + "map": [ + [ + "_tags", + [ + "Musik" + ] + ], + [ + "_examples", + [ + { + "text": "Der Rock ist nicht totzukriegen." + } + ] + ] + ] + } + ] + ] + } + }, + "1": { + "ipa": [ + { + "ipa": "ʁɔk", + "tags": [] + } + ], + "glossTree": { + "_type": "map", + "map": [ + [ + "in arabischen Märchen: flugfähiger Vogel in der Größe eines Elefanten", + { + "_type": "map", + "map": [ + [ + "_tags", + [] + ], + [ + "_examples", + [] + ] + ] + } + ] + ] + } + } + } + } + } +} \ No newline at end of file