embedding : handle --parallel argument

ggerganov · ggerganov · commit 21551c5f3dd1 · 2025-07-30T10:36:19.000+03:00
ggml-ci
diff --git a/examples/embedding/embedding.cpp b/examples/embedding/embedding.cpp
@@ -81,6 +81,10 @@ int main(int argc, char ** argv) {
 
     params.embedding = true;
 
+    if (params.n_parallel == 1) {
+        params.kv_unified = true;
+    }
+
     // utilize the full context
     if (params.n_batch < params.n_ctx) {
         LOG_WRN("%s: setting batch size to %d\n", __func__, params.n_ctx);
diff --git a/src/llama-batch.cpp b/src/llama-batch.cpp
@@ -59,7 +59,7 @@ bool llama_batch_allocr::init(
         for (int32_t i = 0; i < batch.n_tokens; ++i) {
             for (int32_t s = 0; s < batch.n_seq_id[i]; ++s) {
                 if (batch.seq_id && (batch.seq_id[i][s] < 0 || batch.seq_id[i][s] >= (llama_seq_id) n_seq_max)) {
-                    LLAMA_LOG_ERROR("%s: invalid seq_id[%d][%d] = %d > %d\n", __func__, i, s, batch.seq_id[i][s], (llama_seq_id) n_seq_max);
+                    LLAMA_LOG_ERROR("%s: invalid seq_id[%d][%d] = %d >= %d\n", __func__, i, s, batch.seq_id[i][s], (llama_seq_id) n_seq_max);
                     return false;
                 }
             }

Original file line number	Diff line number	Diff line change
`@@ -59,7 +59,7 @@ bool llama_batch_allocr::init(`
`59`	`59`	`for (int32_t i = 0; i < batch.n_tokens; ++i) {`
`60`	`60`	`for (int32_t s = 0; s < batch.n_seq_id[i]; ++s) {`
`61`	`61`	`if (batch.seq_id && (batch.seq_id[i][s] < 0 \|\| batch.seq_id[i][s] >= (llama_seq_id) n_seq_max)) {`
`62`		`- LLAMA_LOG_ERROR("%s: invalid seq_id[%d][%d] = %d > %d\n", __func__, i, s, batch.seq_id[i][s], (llama_seq_id) n_seq_max);`
	`62`	`+ LLAMA_LOG_ERROR("%s: invalid seq_id[%d][%d] = %d >= %d\n", __func__, i, s, batch.seq_id[i][s], (llama_seq_id) n_seq_max);`
`63`	`63`	`return false;`
`64`	`64`	`}`
`65`	`65`	`}`