OpenPecha/Botok

🏷 བོད་ཏོག [pʰøtɔk̚] Tibetan word tokenizer in Python

/ 100

Verified

78 stars and 12,134 monthly downloads. Used by 1 other package. Available on PyPI.

Maintenance 13 / 25

Adoption 19 / 25

Maturity 25 / 25

Community 18 / 25

Stars

Forks

Language

Python

License

Apache-2.0

Category

Last pushed

Mar 16, 2026

Monthly downloads

12,134

Commits (30d)

Dependencies

Reverse dependents

Get this data via API

curl "https://pt-edge.onrender.com/api/v1/quality/nlp/OpenPecha/Botok"

Open to everyone — 100 requests/day, no key needed. Get a free key for 1,000/day.

Related tools

EmilStenstrom/conllu

A CoNLL-U parser that takes a CoNLL-U formatted string and turns it into a nested python dictionary.

taishi-i/nagisa

A Japanese tokenizer based on recurrent neural networks

zaemyung/sentsplit

A flexible sentence segmentation library using CRF model and regex rules

natasha/razdel

Rule-based token, sentence segmentation for Russian language

polm/cutlet

Japanese to romaji converter in Python