Beszédszintézis
A Wikipédiából, a szabad lexikonból.
A beszédszintézis célja az, hogy mesterségesen hozzon létre beszélő emberi – vagy ahhoz a lehető legjobban hasonlító – hangot. Az első ilyen szerkezetet Kempelen Farkas konstruálta, melynek egy példánya ma a müncheni Deutsches Museumban tekinthető meg.
Többféle eljárás létezik, ezek a leggyakrabban két fokozatban dolgoznak:
- az írott szöveget fonémákká alakítják;
- a fonémákat hangfeldolgozó eljárások segítségével – lehetőleg szakadásmentesen összeillesztve – valamilyen hangkeltő eszközön keresztül hanggá alakítják, pl. a hangképző szervek utánzásával vagy tárolt hangminták felhasználásával.
[szerkesztés] Megfontolások
- Nem minden fonéma létezik minden nyelvben (pl ü nincs az angol nyelvben).
- Egy írott szöveg lefordítása fonémákká nem triviális (pl. a hanglejtés miatt).
- Egy írott szöveg fonémákká alakítása nyelv- és kontextusfüggő.
[szerkesztés] Programok
- [http://www.ikp.uni-bonn.de/dt/forsch/phonetik/hadifix/HADIFIXforMBROLA.html Txt2Pho német szövegeket alakít fonémákká
- MBrola nyelvszintetizálási projekt
- FreeTTS, Jávában írt nyílt forráskódú TTS (Text-To-Speech = szövegből beszéd) rendszer
- Festvox, nyílt forráskódú nyelvszintetizálási projekt
Felolvasók:
Hangos (angol) szótárak (és még más is. pl. concordance)
Magyar kutatás (az egyik):
másik az MTA
a harmadik:
Kulcsszavak: voice portal, számítógépes nyelvészet, hangkódolás, prozódia, hangsúlyozás, nyelvfelismerés, Kempelen Farkas