novitangrn/ToMoLDA
Projek ‘Klasifikasi Teks dalam NLP untuk Mendeteksi Topik Berita Berbasis Teks’ dibuat untuk mendapatkan sebaran topik dari dokumen-dokumen yang ada dalam sebuah korpus. Data yang diambil berupa berita berbasis teks yang bisa didapatkan melalui proses scraping web secara real-time, atau bisa juga dengan mengunggah dataset lokal di menu yang telah disediakan. Kemudian dataset yang telah didapatkan diproses dengan menggunakan LDA (Latent Dirichlet Allocation). Metode LDA ini memudahkan dalam mencari atau memunculkan topik-topik tersembunyi saat melakukan pemrosesan serta dapat mendeteksi seberapa proporsionalnya kemunculan sebuah topik-topik tertentu.
No commits in the last 6 months.
Stars
1
Forks
—
Language
Python
License
Apache-2.0
Category
Last pushed
May 06, 2025
Commits (30d)
0
Get this data via API
curl "https://pt-edge.onrender.com/api/v1/quality/nlp/novitangrn/ToMoLDA"
Open to everyone — 100 requests/day, no key needed. Get a free key for 1,000/day.
Higher-rated alternatives
MIND-Lab/OCTIS
OCTIS: Comparing Topic Models is Simple! A python package to optimize and evaluate topic models...
i-dot-ai/themefinder
A topic modelling Python package for analysing one-to-many question-answer data.
bobxwu/TopMost
A Topic Modeling System Toolkit (ACL 2024 Demo)
bab2min/tomotopy
Python package of Tomoto, the Topic Modeling Tool
andifunke/topic-labeling
The project proposes a framework to apply topic models on a text-corpus and eventually topic...