jakedahn/qwen3-embeddings-mlx

MLX-powered Qwen3 embedding server for Apple Silicon Macs. Features 0.6B/4B/8B models, 44K tokens/sec throughput, REST API, batch processing, and model hot-swapping, and more

/ 100

Emerging

No commits in the last 6 months.

Stale 6m No Package No Dependents

Maintenance 2 / 25

Adoption 5 / 25

Maturity 9 / 25

Community 15 / 25

How are scores calculated?

Stars

Forks

Language

Python

License

MIT

Category

self-hosted-embedding-servers

Last pushed

Aug 09, 2025

Commits (30d)

GitHub

Self-Hosted Embedding Servers · 83 tools

Get this data via API

curl "https://pt-edge.onrender.com/api/v1/quality/embeddings/jakedahn/qwen3-embeddings-mlx"

Open to everyone — 100 requests/day, no key needed. Get a free key for 1,000/day.

Featured in

Embeddings Are Easier Than Whatever You're Doing Instead

Higher-rated alternatives

FlagOpen/FlagEmbedding

Retrieval and Retrieval-augmented LLMs

Blaizzy/mlx-embeddings

MLX-Embeddings is the best package for running Vision and Language Embedding models locally on...

qdrant/fastembed

Fast, Accurate, Lightweight Python library to make State of the Art Embedding

Merck/Sapiens

Sapiens is a human antibody language model based on BERT.

amansrivastava17/embedding-as-service

One-Stop Solution to encode sentence to fixed length vectors from various embedding techniques

Explore Embedding Tools

All categories Trending Embeddings directory Insights