Skip to content

Commit

Permalink
text generation: Tweaks to Portuguese
Browse files Browse the repository at this point in the history
  • Loading branch information
Seikm committed Aug 22, 2024
1 parent 3226efb commit 4c20c0a
Show file tree
Hide file tree
Showing 3 changed files with 250 additions and 1 deletion.
2 changes: 2 additions & 0 deletions data/word_lists/pt.txt
Original file line number Diff line number Diff line change
Expand Up @@ -199,3 +199,5 @@ texto
abrir
quase
realizar
é
são
230 changes: 230 additions & 0 deletions data/word_lists/pt_advanced.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,230 @@
o
de
e
em
um
que
a
ser
para
não
com
por
ter
se
seu
eu
ele
fazer
mais
este
ou
poder
estar
esse
mas
ir
todo
outro
meu
muito
dizer
ano
isso
ela
também
grande
bom
nós
pessoa
saber
como
sobre
algum
ver
eles
nosso
ficar
dia
quando
querer
dever
vida
sem
mesmo
ainda
coisa
porque
bem
tempo
entre
sempre
passar
dois
novo
aquele
quem
falar
tudo
onde
vir
deixar
apenas
primeiro
vigilante
fervente
circuito
imprudente
uma
aqui
mundo
qualquer
organizar
trabalho
detalhe
país
conseguir
tu
depois
usar
achar
parte
homem
qual
chegar
haver
começar
conhecer
agora
assim
gostar
problema
cada
caso
mulher
elas
tão
encontrar
hoje
nada
levar
livro
pequeno
empresa
precisar
acontecer
momento
viver
nunca
pouco
pois
do
nem
tipo
história
parecer
sentir
contra
vez
casa
antes
filho
verdade
ler
social
importante
criar
escrever
continuar
cidade
receber
acabar
então
informação
nome
colocar
processo
diferente
gente
sair
tentar
isto
direito
pai
lugar
trabalhar
durante
criança
valor
governo
mostrar
ponto
palavra
hora
certo
perder
possível
apresentar
voltar
situação
mês
jogo
existir
sistema
ajudar
serviço
público
tanto
blog
entrar
nenhum
três
tomar
questão
amor
tal
grupo
através
amigo
comentário
seguir
contar
acreditar
alto
filme
esperar
tornar
semana
texto
abrir
quase
realizar
é
são
às
pós
você
além
tédio
sábio
ótimo
série
atrás
tóxico
alguém
hilário
tráfico
diversão
saudável
orgânico
impossível
benção
seções
ligação
poluição
condições
imediações
concepções
19 changes: 18 additions & 1 deletion src/text_generation.rs
Original file line number Diff line number Diff line change
Expand Up @@ -164,7 +164,6 @@ pub fn advanced(language: Language) -> String {
| Language::NorwegianNynorsk
| Language::Occitan
| Language::Polish
| Language::Portuguese
| Language::Russian
| Language::Swahili
| Language::Swedish
Expand Down Expand Up @@ -280,6 +279,24 @@ pub fn advanced(language: Language) -> String {
],
WESTERN_ARABIC_NUMERALS,
),
// Portuguese has many words with accents and "ç",
// so there is a different word_list for advanced mode with more words.
// extra words taken from: <https://github.com/monkeytypegame/monkeytype/blob/master/frontend/static/languages/portuguese_acentos_e_cedilha.json>
Language::Portuguese => advanced_generic(
"pt_advanced",
" ",
&[
Punctuation::suffix(".", true, 0.6),
Punctuation::suffix(",", false, 1.0),
Punctuation::suffix(";", false, 0.08),
Punctuation::suffix(":", false, 0.2),
Punctuation::suffix("!", true, 0.3),
Punctuation::suffix("?", true, 0.3),
Punctuation::wrapping("\"", "\"", false, 0.2),
Punctuation::wrapping("(", ")", false, 0.1),
],
WESTERN_ARABIC_NUMERALS,
),
}
}

Expand Down

0 comments on commit 4c20c0a

Please sign in to comment.