<QUESTION> Does llama3 add <EOS> token when do pretraining? #362

bugm · 2024-11-20T07:54:34Z

Hello,
I noticed that the llama3 tokenizer loaded with hf transformers.AutoTokenizer only add a token when call the encode function. May I ask during llama3 pretraining, which behavior is taken? only add token or add both and tokens for each training document.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

<QUESTION> Does llama3 add <EOS> token when do pretraining? #362

<QUESTION> Does llama3 add <EOS> token when do pretraining? #362

bugm commented Nov 20, 2024

<QUESTION> Does llama3 add <EOS> token when do pretraining? #362

<QUESTION> Does llama3 add <EOS> token when do pretraining? #362

Comments

bugm commented Nov 20, 2024