Spaces:

sakaltcommunity
/

Qwen2.5

Runtime error

App Files Files Community

Sakalti commited on Oct 11, 2024

Commit

1f16182

verified ·

1 Parent(s): 5a64991

Update app.py

Browse files

Files changed (1) hide show

app.py +24 -36

app.py CHANGED Viewed

@@ -1,8 +1,10 @@
 import gradio as gr
 from huggingface_hub import InferenceClient
 import time
-import threading
 client = InferenceClient("Qwen/Qwen2.5-3b-Instruct")
 def respond(
@@ -11,11 +13,10 @@ def respond(
     system_message,
     max_tokens,
     temperature,
-    top_p
 ):
     messages = [{"role": "system", "content": system_message}]
-    # メッセージ履歴を追加
     for val in history:
         if val[0]:
             messages.append({"role": "user", "content": val[0]})
@@ -24,40 +25,26 @@ def respond(
     messages.append({"role": "user", "content": message})
-    # 応答生成の別スレッド処理
-    def ai_response():
-        nonlocal response_content
-        start_time = time.time()
-        response = client.chat_completion(
-            messages,
-            max_tokens=max_tokens,
-            temperature=temperature,
-            top_p=top_p,
-        )
-        elapsed_time = time.time() - start_time  # 応答時間計測
-        response_content = response.choices[0].message.content
-        response_time = f"応答にかかった時間: {elapsed_time:.2f}秒"
-        return response_content, response_time
-    # 応答時間を表示するためのスレッド
-    response_content = "応答生成中です..."
-    thread = threading.Thread(target=ai_response)
-    thread.start()
-    # 応答を返すまでの間、経過時間を更新
-    elapsed_time_display = ""
-    elapsed_time = 0
-    while thread.is_alive():
-        elapsed_time += 1
-        elapsed_time_display = f"{elapsed_time}秒経過..."
-        time.sleep(1)
-        if not thread.is_alive():
-            break
-    thread.join()  # スレッド終了を待機
-    return response_content, elapsed_time_display
 demo = gr.ChatInterface(
     respond,
     additional_inputs=[
@@ -72,6 +59,7 @@ demo = gr.ChatInterface(
             label="Top-p (核サンプリング)",
         ),
     ],
     css="""
     .gradio-container {
         background-color: #212121;

 import gradio as gr
 from huggingface_hub import InferenceClient
 import time
+"""
+`huggingface_hub` の推論 API サポートについての詳細は、ドキュメントを確認してください: https://huggingface.co/docs/huggingface_hub/v0.22.2/en/guides/inference
+"""
 client = InferenceClient("Qwen/Qwen2.5-3b-Instruct")
 def respond(
     system_message,
     max_tokens,
     temperature,
+    top_p,
 ):
     messages = [{"role": "system", "content": system_message}]
     for val in history:
         if val[0]:
             messages.append({"role": "user", "content": val[0]})
     messages.append({"role": "user", "content": message})
+    # AI応答時間計測開始
+    start_time = time.time()
+    # 応答生成
+    response = client.chat_completion(
+        messages,
+        max_tokens=max_tokens,
+        temperature=temperature,
+        top_p=top_p,
+    )
+    # 応答にかかった時間を計測
+    elapsed_time = time.time() - start_time
+    # 応答内容と経過時間を返す
+    return response.choices[0].message.content, f"応答にかかった時間: {elapsed_time:.2f}秒"
+"""
+ChatInterfaceのカスタマイズ方法については、gradioのドキュメントを確認してください: https://www.gradio.app/docs/chatinterface
+"""
 demo = gr.ChatInterface(
     respond,
     additional_inputs=[
             label="Top-p (核サンプリング)",
         ),
     ],
+    # 背景色をCSSで設定
     css="""
     .gradio-container {
         background-color: #212121;