Llama.rs - llama.cpp的Rust移植,用于在CPU上进行快速的LLaMA推理。 Llama.rs – Rust port of llama.cpp for fast LLaMA inference on CPU (github.com)