LLM Runner RS

RustによるシンプルなLLM（Large Language Model）推論ランナーです。llama.cppのRustバインディングを使用しており、GGUF形式のモデルをサポートしています。

必要条件

Rust (Cargo)
curl または wget

準備

1. モデルのダウンロード

このプロジェクトでは、GGUF形式のLLMモデルが必要です。付属のスクリプトを使用して、いくつかの推奨モデルを簡単にダウンロードできます。

まず、スクリプトに実行権限を与えます。

chmod +x download_model.sh

次に、モデル名を指定してスクリプトを実行します。

Gemma 2 2B (推奨): バランスの良い性能と日本語能力

./download_model.sh gemma2b

Qwen 2.5 3B: 高い日本語性能

./download_model.sh qwen3b

TinyLlama 1.1B: 非常に軽量

./download_model.sh tinyllama

2. プロジェクトのビルド

cargo build --release

使い方

cargo run コマンドを使用して直接実行するか、ビルドしたバイナリを実行します。

基本的な使用法

cargo run --release -- --model-path <モデルへのパス> --prompt "<プロンプト>"

実行例

ダウンロードしたGemma 2 2Bモデルを使って実行する例です。

CPUのみで実行:

cargo run --release -- \
  --model-path ./models/gemma-2-2b-it-Q4_K_M.gguf \
  --prompt "Rustプログラミング言語の利点は何ですか？"

GPUオフロードを使用（例: 全レイヤー）:

cargo run --release -- \
  --model-path ./models/gemma-2-2b-it-Q4_K_M.gguf \
  --prompt "Hello, world!" \
  --n-gpu-layers 99

オプション

オプション	短縮形	説明	デフォルト値
`--model-path`	`-m`	必須: GGUFモデルファイルへのパス	-
`--prompt`		必須: 生成を開始するためのプロンプト	-
`--max-tokens`		生成する最大トークン数	256
`--n-gpu-layers`		GPUにオフロードするレイヤー数	0

ヘルプの表示

利用可能なすべてのオプションを確認するには、--help フラグを使用します。

cargo run -- --help

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.idea		.idea
src		src
.gitignore		.gitignore
Cargo.lock		Cargo.lock
Cargo.toml		Cargo.toml
LICENSE		LICENSE
README.md		README.md
download_model.sh		download_model.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM Runner RS

必要条件

準備

1. モデルのダウンロード

2. プロジェクトのビルド

使い方

基本的な使用法

実行例

オプション

ヘルプの表示

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LLM Runner RS

必要条件

準備

1. モデルのダウンロード

2. プロジェクトのビルド

使い方

基本的な使用法

実行例

オプション

ヘルプの表示

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages