การประมวลผลคำพูด
จากวิกิพีเดีย สารานุกรมเสรี
การประมวลผลคำพูด (speech processing) เป็นการศึกษาสัญญาณเสียงพูด และ วิธีในการประมวลผลสัญญาณประเภทนี้
การประมวลผลสัญญาณเสียงพูดในปัจจุบัน จะอยู่ในรูปของสัญญาณดิจิทัล โดยสาขานี้มีเนื้อหาร่วมระหว่าง การประมวลผลสัญญาณดิจิทัล และ การประมวลผลภาษาธรรมชาติ. กล่าวคือมีการประมวลผลทั้งสองส่วน ทั้งตัวสัญญาณเสียง (พาหะนำสาร) และภาษา (สาร)
การประมวลผลคำพูด อาจแบ่งเป็นหัวข้อย่อยได้ดังนี้
- การจดจำคำพูด (speech recognition) เป็นการวิเคราะห์ และ จดจำ เนื้อความคำพูด จากสัญญาณเสียงพูด
- การจดจำเสียงผู้พูด (speaker recognition) เป็นการใช้เสียงในการระบุตัวผู้พูด
- การปรับแต่งเสียงพูด (speech signal enhancement)
- การเข้ารหัสเสียงพูด (speech coding) เพื่อการบีบอัดข้อมูล
- การวิเคราะห์เสียงพูด (voice analysis) เพื่อใช้ประโยชน์ในทางการแพทย์ เช่นการวิเคราะห์ความผิดปกติของสายเสียง
- การสังเคราะห์เสียงพูด (speech synthesis) โดยทั่วไปหมายถึงการใช้คอมพิวเตอร์ในการสร้างเลียนเสียงพูดของมนุษย์