Zen Embedding 8B GGUF

High-performance text embedding model based on Qwen3-Embedding-8B, optimized for efficient inference.

Downloads

Source	URL
HuggingFace	`hf download zenlm/zen-embedding-8B-GGUF`
Direct	https://download.hanzo.ai/llm-models/zen-embedding-8B-Q4_K_M.gguf

Works with llama.cpp and compatible inference engines.

Apache 2.0 (inherited from Qwen3-Embedding)

GGUF

Model size

8B params

Architecture

qwen3

Hardware compatibility

4-bit

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

Quantized

(18)

this model