chat-d32-demo

Running on Zero

burtenshaw HF Staff commited on Oct 16

Commit

fabb44a

verified ·

1 Parent(s): 1e13821

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -22,13 +22,8 @@ tokenizer, model = load_model()
 @spaces.GPU
-def generate(prompt, history):
-    conversation = []
-    for message in history:
-        conversation.append({
-            "role": message["role"],
-            "content": message["content"]
-        })
     inputs = tokenizer.apply_chat_template(
         conversation,
@@ -41,7 +36,7 @@ def generate(prompt, history):
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
-            max_new_tokens=1024,
         )
     generated_tokens = outputs[0, inputs.input_ids.shape[1]:]

 @spaces.GPU
+def generate(message, history):
+    conversation = history + [message]
     inputs = tokenizer.apply_chat_template(
         conversation,
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
+            max_new_tokens=512,
         )
     generated_tokens = outputs[0, inputs.input_ids.shape[1]:]