Skip to content

Commit

Permalink
i18n: Bangla text generation
Browse files Browse the repository at this point in the history
see #45
  • Loading branch information
bragefuglseth committed Jul 4, 2024
1 parent 4de5d96 commit 3ee4179
Show file tree
Hide file tree
Showing 2 changed files with 202 additions and 1 deletion.
198 changes: 198 additions & 0 deletions data/word_lists/bn_BD.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,198 @@
আমি
না
তুমি
আমার
কি
এটা
আর
তোমার
আছে
সে
এই
আমরা
করে
হবে
জন্য
আমাদের
করতে
একটা
আমাকে
ঠিক
আপনি
তো
যে
তার
থেকে
কিছু
সাথে
কিন্তু
এখানে
তোমাকে
এখন
কোন
কথা
মনে
কী
যদি
এবং
হয়
আপনার
নিয়ে
ছিল
তাকে
তারা
নেই
হয়ে
তাহলে
অনেক
কেন
করা
হ্যাঁ
করো
তাই
সব
এক
এর
হচ্ছে
যাও
কাজ
হয়েছে
কে
কাছে
শুধু
একটি
স্যার
দাও
তাদের
ভালো
যা
একজন
ভাল
জানি
যেতে
দিয়ে
খুব
কোথায়
করবে
যাবে
চাই
পারে
শেষ
করার
ধন্যবাদ
যখন
বলতে
কেউ
করি
সময়
তুই
গেছে
বাবা
ওকে
মত
সেটা
হতে
চলে
ওহ
নয়
হ্যা
একটু
পারি
দেখতে
সবাই
আগে
দেখা
করছি
তিনি
বের
বলে
কর
আবার
দিতে
নাম
যায়
ওর
পারবে
নাকি
কিভাবে
মধ্যে
তোমরা
ফিরে
আচ্ছা
সাহায্য
আপনাকে
মানুষ
তা
মা
করেছে
দিকে
দরকার
সেই
আসলে
শুরু
ওটা
দুঃখিত
দিন
চলো
মানে
কিন্ত
তোর
তোমাদের
করছে
বলছি
বিশ্বাস
বন্ধ
করেছি
এমন
অবশ্যই
নিজের
কারণ
বড়
করবো
বেশি
বছর
উপর
যাচ্ছে
আসো
চেষ্টা
তারপর
হল
হেই
এসব
দেখো
কিছুই
কোনো
এটাই
আছি
টাকা
যাচ্ছি
জানো
বুঝতে
আজ
ছিলো
বলো
মতো
ধরে
কখনো
খারাপ
কেমন
প্লিজ
মারা
পছন্দ
সেখানে
চাও
নাও
সমস্যা
দেখে
নি
পর
থাকে
এখনো
সুন্দর
তখন
ভুল
ভাই
ওখানে
পর্যন্ত
5 changes: 4 additions & 1 deletion src/text_generation.rs
Original file line number Diff line number Diff line change
Expand Up @@ -12,6 +12,8 @@ pub const CHUNK_GRAPHEME_COUNT: usize = 400;
pub enum Language {
#[strum(message = "العربية", to_string = "ar_SA")]
Arabic,
#[strum(message = "বাংলা", to_string = "bn_BD")]
Bangla,
#[strum(message = "Български", to_string = "bg_BG")]
Bulgarian,
#[strum(message = "Dansk", to_string = "da_DK")]
Expand Down Expand Up @@ -97,6 +99,7 @@ impl<'a> Punctuation<'a> {
pub fn simple(language: Language) -> String {
match language {
Language::Arabic
| Language::Bangla
| Language::Bulgarian
| Language::English
| Language::Danish
Expand Down Expand Up @@ -182,7 +185,7 @@ pub fn advanced(language: Language) -> String {
],
),
// Hindi & Nepali use Devanagari punctuation
Language::Hindi | Language::Nepali => advanced_generic(
Language::Bangla | Language::Hindi | Language::Nepali => advanced_generic(
&language.to_string(),
" ",
&[
Expand Down

0 comments on commit 3ee4179

Please sign in to comment.