Spaces:
Sleeping
Sleeping
A newer version of the Gradio SDK is available:
6.1.0
metadata
title: F5-TTS Thai
emoji: 🎤
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.44.0
app_file: app.py
pinned: false
license: mit
python_version: 3.1
hardware: cpu-basic
short_description: Zero-shot Text-to-Speech for Thai language
F5-TTS ภาษาไทย 🎤
Zero-shot Text-to-Speech สำหรับภาษาไทย ด้วยโมเดล F5-TTS
✨ Features
- Multi-Speech Generation: สร้างเสียงพูดหลายสไตล์ในไฟล์เดียว
- Voice Cloning: โคลนเสียงจากไฟล์ตัวอย่างสั้นๆ
- Thai Language Support: รองรับภาษาไทยอย่างเต็มรูปแบบ
- Real-time Processing: ประมวลผลแบบ real-time
- Segment Editing: แก้ไขและปรับแต่งเสียงแต่ละส่วนได้
🚀 วิธีใช้งาน
Multi-Speech Generation
- เพิ่มประเภทคำพูด: คลิก "เพิ่มประเภทคำพูด" เพื่อเพิ่มสไตล์เสียงใหม่
- อัปโหลดเสียงตัวอย่าง: อัปโหลดไฟล์เสียงสำหรับแต่ละสไตล์
- ใส่ข้อความต้นฉบับ: พิมพ์ข้อความที่สอดคล้องกับเสียงตัวอย่าง
- เขียนสคริปต์: ใช้รูปแบบ
{ชื่อสไตล์} ข้อความที่จะพูด
ตัวอย่างการใช้งาน
{ปกติ} สวัสดีครับ มีอะไรให้ผมช่วยไหมครับ
{เศร้า} ผมเครียดจริงๆ นะตอนนี้...
{โกรธ} รู้ไหม! เธอไม่ควรอยู่ที่นี่!
{กระซิบ} ฉันมีอะไรจะบอกคุณ แต่มันเป็นความลับนะ
⚙️ Technical Details
Models Used
- F5-TTS: Zero-shot text-to-speech model
- Vocoder: Neural vocoder for high-quality audio synthesis
- Text Processing: Thai text normalization and processing
System Requirements
- RAM: อย่างน้อย 4GB (แนะนำ 8GB+)
- GPU: ไม่จำเป็น แต่จะช่วยเพิ่มความเร็ว
- Storage: ~2GB สำหรับโมเดลและ dependencies
🔧 Configuration
Model Settings
- NFE Steps: ควบคุมคุณภาพเสียง (16-64)
- Cross Fade Duration: ปรับการต่อเสียงระหว่างส่วน
- Speed: ปรับความเร็วการพูด
- CFG Strength: ปรับความแข็งแกร่งของ guidance
Tips สำหรับผลลัพธ์ที่ดี
- เสียงตัวอย่าง: ใช้เสียงที่ชัดเจน ไม่มีเสียงรบกวน ความยาว 5-10 วินาที
- ข้อความต้นฉบับ: ให้ตรงกับเสียงตัวอย่างที่สุด
- ข้อความที่จะสร้าง: เว้นวรรคและใส่เครื่องหมายวรรคตอนให้ชัดเจน
- การตั้งค่า: เริ่มด้วยค่า default แล้วค่อยปรับแต่ง
🚨 Limitations
- รองรับเฉพาะภาษาไทยเป็นหลัก
- คุณภาพเสียงขึ้นอยู่กับเสียงตัวอย่าง
- ใช้เวลาในการประมวลผลตามความยาวข้อความ
- ต้องใช้ internet เพื่อดาวน์โหลดโมเดล
📝 License
MIT License - ใช้งานได้อย่างอิสระ
🤝 Contributing
สามารถมีส่วนร่วมพัฒนาได้ที่ GitHub Repository
🐛 Bug Reports
หากพบปัญหาการใช้งาน กรุณาแจ้งได้ที่ Issues ของ GitHub Repository