NGrams Generator

This ngrams package generates the unigram, bigram, trigram through different setttings. This supports the excerpts from several languages such as English, French, Spanish, Arabic and Portuguese.

Install

pip install git+https://github.com/the-deep-nlp/ngrams-generator.git

Usages

There are several parameters that can be set during the object instantiation.

from ngrams_generator import NGramsGenerator

ng = NGramsGenerator(generate_unigrams: bool, generate_bigrams: bool, generate_trigrams: bool, enable_stopwords: bool, enable_stemming: bool, enable_case_sensitive: bool, max_ngrams_items: int)

ngram_tokens = ng(list_of_entries)

Description of the parameters

max_ngrams_items: Maximum number of ngram tokens to publish

generate_unigrams: Whether to generate unigrams

generate_bigrams: Whether to generate bigrams

generate_trigrams: Whether to generate trigrams

enable_stopwords: Whether stopwords should be enabled

enable_stemming: Whether stemming should be enabled

enable_case_sensitive: Whether case sensitivity should be enabled

enable_end_of_sentence: Whether to consider end of sentence or not.

The output format is

Dict[str, Dict[str, int]]

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
src/ngrams_generator		src/ngrams_generator
LICENSE		LICENSE
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NGrams Generator

Install

Usages

Description of the parameters

About

Releases

Packages

Contributors 2

Languages

License

the-deep-nlp/ngrams-generator

Folders and files

Latest commit

History

Repository files navigation

NGrams Generator

Install

Usages

Description of the parameters

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages