Hääle retsept

Siin saate endale ise meelepärase sünteeshääle luua. Treeningkeskkonna kasutamiseks looge Kõneveebis kasutajakonto. Sisselogimisel kohustute järgima isikuandme kaitse seadust https://www.riigiteataja.ee/akt/12909389?leiaKehtiv.

Sünteeshääle loomine koosneb kolmest etapist: 

1)  kõne salvestus ehk kõnekorpuse loomine: laadige alla salvestaja.zip ja lugege oma arvutis sisse etteantud lauseid;

2) kõnekorpuse üleslaadimine:

3) sünteesimeetodi valik ning hääletrenn: 

Nüüd saate treenitud mudeli alla laadida ja sellega koos käiva tarkvara oma arvutis installeerida ja häälestada. Loodud sünteeshäält saate kasutada ka siin lehel.

Kontakt: heli@eki.ee

Tehnilised juhendid

Slaidid (PDF). Tutvustav video.

Kõne salvestamine

Sünteeshääle treenimine põhineb närvivõrkudel. See tähendab, et “õpetamine” seisneb piisava hulga tekstiliste lausete ja vastavate helifailide mudelile näitamises koos tingimusega “katsu saada võimalikult sarnane tulemus”. Korpuse loomiseks vajate umbes tuhande lause jagu salvestatud kõnet.

Lausete salvestamiseks laadige alla programm Salvestaja. Programm sisaldab vajalikku hulka lauseid, mis tuleb ette lugeda ja programmi abil salvestada. Salvestaja kasutusjuhendi leiate pärast programmi alla laadimist, lahti pakkimist ja avamist menüüst “Abi”. Kvaliteetse tulemuse saamiseks soovitame lugejaks võtta elukutselise näitleja või diktori, kes on harjunud keerulisi tekste sujuvalt lugema ning kelle hääle sarnast sünteeshäält te soovite saada. Informeerige teda salvestuse eesmärgist ja küsige tema kirjalikku nõusolekut. Üldjuhul on vaja mürata ja kajata ruumi, Windowsi, mikrofoni ning veidi aega ja kannatust.

Kui olete oma salvestatud korpuse üles laadinud, treenitakse selle alusel kõik eri mudelid automaatselt.

Allalaadimine ja paigaldamine

Kasutamiseks oma arvutis on lisaks mudelile vajalik ka seda toetav tarkvara. Treenitud mudel on alla laadimiseks pakendatud isoleeritud tarkvarakeskkonda. Kõik järgnevad rakendusjuhendid eeldavad, et kasutate Linuxit.

Häälikupõhine HMM

Looge uus kataloog ja pakkige sinna lahti alla laaditud hts2_minuhaal.zip. Konfigureerimisjuhendi leiate README failist. Kui configure ja make on edukalt lõpetanud, saate oma häälega ette loetud teksti, kui salvestate selle faili in.txt ja käivitate minuhaal.sh. Samasse kataloogi tekkib out_minuhaal.wav. Sisendfaili (utf8 lihttekst) nimi, väljundfaili nimi ja kasutatav hääl on skriptis muudetavad. Pange ainult tähele, et muud kaasas olevad hääled kasutavad vaikimisi kvantimissagedust 48kHz, Kõneveebis treenitud hääl 16kHz. Kui kasutate mudelit minuhaal.htsvoice, siis koos sellega ka käsurea võtit -s 16,

Tähemärgipõhine HMM ja DNN

Valmishääled on pakendatud Dockeri konteinerisse, rakendus on testitud Ubuntu ja podmani keskkonnas. Looge uus kataloog ja installeerige sinna konteiner: git clone https://github.com/jaotus/grafeem-synthesizer. Valige, kumb variant teile rohkem meeldis, kas HMM või DNN hääl ning vastavalt sellele ehitage ka konteineri sisu. Sama meetodi jaoks laadige alla häälepakett ning pakkige lahti konteineri juurkataloogis. Häälepakett täiendab juba olemasolevaid train/ ja voice/ alakatalooge treenitud häälemudeli kasutamiseks vajalike failidega. Sünteesimiseks käivitage juurkataloogi lisatud minuhaal.sh, mis teisendab test/txt/in_minuhaal.txt faili helifailiks test/wav/out_minuhaal.wav