AXERA-TECH
/

Qwen2.5-7B-Instruct

+./main_api_axcl_aarch64 \
+--template_filename_axmodel "qwen2.5-7b-ctx-int4-ax650/qwen2_p128_l%d_together.axmodel" \
+--axmodel_num 28 \
+--url_tokenizer_model "http://0.0.0.0:12345" \
+--filename_post_axmodel "qwen2.5-7b-ctx-int4-ax650/qwen2_post.axmodel" \
+--filename_tokens_embed "qwen2.5-7b-ctx-int4-ax650/model.embed_tokens.weight.bfloat16.bin" \
+--tokens_embed_num 152064 \
+--tokens_embed_size 3584 \
+--use_mmap_load_embed 1 \
+--devices 0
+#--system_prompt "你的名字叫小智（allen）,你是一个人畜无害的AI助手。深圳市今天（4月1日）阴天，愚人节，气温在14°C至19°C之间，微风。" \
+#--kvcache_path "./kvcache" \