diff --git a/data/word_lists/pt.txt b/data/word_lists/pt.txt index cde2f92..2a4ff5b 100644 --- a/data/word_lists/pt.txt +++ b/data/word_lists/pt.txt @@ -199,3 +199,5 @@ texto abrir quase realizar +é +são \ No newline at end of file diff --git a/data/word_lists/pt_advanced.txt b/data/word_lists/pt_advanced.txt new file mode 100644 index 0000000..4233dd7 --- /dev/null +++ b/data/word_lists/pt_advanced.txt @@ -0,0 +1,230 @@ +o +de +e +em +um +que +a +ser +para +não +com +por +ter +se +seu +eu +ele +fazer +mais +este +ou +poder +estar +esse +mas +ir +todo +outro +meu +muito +dizer +ano +isso +ela +também +grande +bom +nós +pessoa +saber +como +sobre +algum +ver +eles +nosso +ficar +dia +quando +querer +dever +vida +sem +mesmo +ainda +coisa +porque +bem +tempo +entre +sempre +passar +dois +novo +aquele +quem +falar +tudo +onde +vir +deixar +apenas +primeiro +vigilante +fervente +circuito +imprudente +uma +aqui +mundo +qualquer +organizar +trabalho +detalhe +país +conseguir +tu +depois +usar +achar +parte +homem +qual +chegar +haver +começar +conhecer +agora +assim +gostar +problema +cada +caso +mulher +elas +tão +encontrar +hoje +nada +levar +livro +pequeno +empresa +precisar +acontecer +momento +viver +nunca +pouco +pois +do +nem +tipo +história +parecer +sentir +contra +vez +casa +antes +filho +verdade +ler +social +importante +criar +escrever +continuar +cidade +receber +acabar +então +informação +nome +colocar +processo +diferente +gente +sair +tentar +isto +direito +pai +lugar +trabalhar +durante +criança +valor +governo +mostrar +ponto +palavra +hora +certo +perder +possível +apresentar +voltar +situação +mês +jogo +existir +sistema +ajudar +serviço +público +tanto +blog +entrar +nenhum +três +tomar +questão +amor +tal +grupo +através +amigo +comentário +seguir +contar +acreditar +alto +filme +esperar +tornar +semana +texto +abrir +quase +realizar +é +são +hà +às +dê +vô +pós +você +além +tédio +sábio +ótimo +série +atrás +tóxico +alguém +hilário +tráfico +diversão +saudável +orgânico +impossível +benção +seções +ligação +poluição +condições +imediações +concepções \ No newline at end of file diff --git a/src/text_generation.rs b/src/text_generation.rs index 4739820..b456c56 100644 --- a/src/text_generation.rs +++ b/src/text_generation.rs @@ -164,7 +164,6 @@ pub fn advanced(language: Language) -> String { | Language::NorwegianNynorsk | Language::Occitan | Language::Polish - | Language::Portuguese | Language::Russian | Language::Swahili | Language::Swedish @@ -280,6 +279,24 @@ pub fn advanced(language: Language) -> String { ], WESTERN_ARABIC_NUMERALS, ), + // Portuguese has many words with accents and "ç", + // so there is a different word_list for advanced mode with more words. + // extra words taken from: + Language::Portuguese => advanced_generic( + "pt_advanced", + " ", + &[ + Punctuation::suffix(".", true, 0.6), + Punctuation::suffix(",", false, 1.0), + Punctuation::suffix(";", false, 0.08), + Punctuation::suffix(":", false, 0.2), + Punctuation::suffix("!", true, 0.3), + Punctuation::suffix("?", true, 0.3), + Punctuation::wrapping("\"", "\"", false, 0.2), + Punctuation::wrapping("(", ")", false, 0.1), + ], + WESTERN_ARABIC_NUMERALS, + ), } }