RAG.AXERA DEMO

rag_demo

项目说明

(hf) ➜  rag.axera git:(main) ✗ tree -L 2
.
├── assets
│   └── demo.png
├── config.py     # 配置 axmodel, tokenizer 文件路径
├── data
├── gui.py        # RAG 交互式程序 
├── index         # 文档编码向量索引保存位置
│   ├── docs.index
│   └── docs.pkl
├── llm_api.py    # llm 主程序 
├── models        # axmodel 模型存储位置
│   ├── Qwen2.5-1.5B-Instruct_axmodel
│   └── Qwen3-Embedding-0.6B_axmodel
├── pdf_sample    # 示例 pdf 文件
│   └── introduction.pdf
├── rag_engine.py # 文档向量编码程序 
├── README.md
├── requirements.txt
├── tokenizer
│   ├── Qwen2.5-1.5B-Instruct
│   └── Qwen3-Embedding-0.6B
└── utils
    └── infer_func.py

11 directories, 11 files

运行

AXCL 机器或 AX650 开发板上启动两个终端界面, 分别运行下面的命令:

python3 llm_api.py # 在 AX650 或 AXCL 开发板启动 llm 服务
python3 gui.py     # 启动交互式界面
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support