In a Training Loop 🔄

64 532

Behrooz Azarkhalili

ermiaazarkhalili

AI & ML interests

LLMs, VLMs, PEFT, RL for LLMs and VLMs.

Organizations

Collections 6

View 6 collections

models 43

datasets 6

ermiaazarkhalili/alpaca-gpt4-short-100tok

Viewer • Updated Dec 20, 2025 • 5k • 8

ermiaazarkhalili/orca-mini-short-100tok

Viewer • Updated Dec 20, 2025 • 5k • 8

ermiaazarkhalili/orca-mini-v1-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 14

ermiaazarkhalili/alpaca-gpt4-en-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 14

ermiaazarkhalili/alpaca-cleaned-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 16

ermiaazarkhalili/alpaca-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 17

Behrooz Azarkhalili

AI & ML interests

Organizations

Collections 6

HuggingFaceH4/ultrachat_200k

teknium/OpenHermes-2.5

Open-Orca/OpenOrca

mlabonne/FineTome-100k

hewei2001/ReachQA

omoured/RefChartQA

AI-4-Everyone/Visual-TableQA

HuggingFaceM4/ChartQA

HuggingFaceH4/ultrachat_200k

teknium/OpenHermes-2.5

Open-Orca/OpenOrca

mlabonne/FineTome-100k

hewei2001/ReachQA

omoured/RefChartQA

AI-4-Everyone/Visual-TableQA

HuggingFaceM4/ChartQA

models 43

ermiaazarkhalili/LFM2-700M-GRPO-NuminaMath-50K

ermiaazarkhalili/LFM2-350M-GRPO-NuminaMath-50K

ermiaazarkhalili/SmolLM2-135M-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/SmolLM2-1.7B-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/LFM2-2.6B-GRPO-NuminaMath-50K

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-100K

ermiaazarkhalili/Qwen2.5-0.5B-Instruct-GRPO-NuminaMath-100K

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-50K

ermiaazarkhalili/Qwen2.5-0.5B-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/Qwen2.5-0.5B-SFT-OpenHermes-2.5-100-GGUF

datasets 6

ermiaazarkhalili/alpaca-gpt4-short-100tok

ermiaazarkhalili/orca-mini-short-100tok

ermiaazarkhalili/orca-mini-v1-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-gpt4-en-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-cleaned-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-high-prob-qwen-0.5b-10k

Behrooz Azarkhalili

AI & ML interests

Organizations

Collections 6

models 43 Sort: Recently updated

datasets 6 Sort: Recently updated

models 43

datasets 6