mirror of
				https://github.com/ggml-org/llama.cpp.git
				synced 2025-11-03 09:22:01 +00:00 
			
		
		
		
	server : throw an error when slot unavailable (#4741)
				
					
				
			This commit is contained in:
		@@ -95,6 +95,15 @@ export async function* llama(prompt, params = {}, config = {}) {
 | 
				
			|||||||
              break;
 | 
					              break;
 | 
				
			||||||
            }
 | 
					            }
 | 
				
			||||||
          }
 | 
					          }
 | 
				
			||||||
 | 
					          if (result.error) {
 | 
				
			||||||
 | 
					            result.error = JSON.parse(result.error);
 | 
				
			||||||
 | 
					            if (result.error.content.includes('slot unavailable')) {
 | 
				
			||||||
 | 
					              // Throw an error to be caught by upstream callers
 | 
				
			||||||
 | 
					              throw new Error('slot unavailable');
 | 
				
			||||||
 | 
					            } else {
 | 
				
			||||||
 | 
					              console.error(`llama.cpp error: ${result.error.content}`);
 | 
				
			||||||
 | 
					            }
 | 
				
			||||||
 | 
					          }
 | 
				
			||||||
          if (result.error) {
 | 
					          if (result.error) {
 | 
				
			||||||
            result.error = JSON.parse(result.error);
 | 
					            result.error = JSON.parse(result.error);
 | 
				
			||||||
            console.error(`llama.cpp error: ${result.error.content}`);
 | 
					            console.error(`llama.cpp error: ${result.error.content}`);
 | 
				
			||||||
 
 | 
				
			|||||||
		Reference in New Issue
	
	Block a user