swift : fix token_to_piece implementation (#4278)

* Fix token_to_piece implementation in Swift * Fix errors
2025-10-30 08:42:00 +00:00 · 2023-12-02 03:19:45 +09:00
parent 511f52c334
commit b220222a64
2 changed files with 18 additions and 14 deletions
--- a/examples/batched.swift/Sources/main.swift
+++ b/examples/batched.swift/Sources/main.swift
@@ -230,18 +230,15 @@ private func token_to_piece(token: llama_token, buffer: inout [CChar]) -> String
    var result = [CChar](repeating: 0, count: 8)
    let nTokens = llama_token_to_piece(model, token, &result, Int32(result.count))
    if nTokens < 0 {
-        if result.count >= -Int(nTokens) {
+        let actualTokensCount = -Int(nTokens)
-            result.removeLast(-Int(nTokens))
+        result = .init(repeating: 0, count: actualTokensCount)
        } else {
            result.removeAll()
        }
        let check = llama_token_to_piece(
            model,
            token,
            &result,
            Int32(result.count)
        )
-        assert(check == nTokens)
+        assert(check == actualTokensCount)
    } else {
        result.removeLast(result.count - Int(nTokens))
    }
@@ -259,5 +256,4 @@ private func token_to_piece(token: llama_token, buffer: inout [CChar]) -> String
        buffer = []
        return bufferString
    }
    return nil
 }
--- a/examples/llama.swiftui/llama.cpp.swift/LibLlama.swift
+++ b/examples/llama.swiftui/llama.cpp.swift/LibLlama.swift
@@ -164,13 +164,21 @@ actor LlamaContext {
    private func token_to_piece(token: llama_token) -> String {
        let result = UnsafeMutablePointer<Int8>.allocate(capacity: 8)
        result.initialize(repeating: Int8(0), count: 8)
        defer {
            result.deallocate()
        }
        let nTokens = llama_token_to_piece(model, token, result, 8)
-        let _ = llama_token_to_piece(model, token, result, 8)
+        if nTokens < 0 {
-
+            let newResult = UnsafeMutablePointer<Int8>.allocate(capacity: Int(-nTokens))
-        let resultStr = String(cString: result)
+            newResult.initialize(repeating: Int8(0), count: Int(-nTokens))
-
+            defer {
-        result.deallocate()
+                newResult.deallocate()
-
+            }
-        return resultStr
+            _ = llama_token_to_piece(model, token, newResult, -nTokens)
            return String(cString: newResult)
        } else {
            return String(cString: result)
        }
    }
 }