Kõne akustiline analüüs

Akustilise analüüsi jaoks kasutatakse avatud lähtekoodiga tööriistakomplekti openSMILE (Eyben et al., 2010, 2013). Laiendatud Genfi minimalistliku akustiliste parameetrite kogumi (eGeMAPS) parameetrid arvutatakse iga kõnelõigu jaoks. Need 88 parameetrit hõlmavad statistilisi näitajaid (aritmeetiline keskmine, variatsioonikoefitsient, protsentiilid jne), mis on arvutatud ajas muutuvate akustiliste tunnuste jaoks, sealhulgas sagedusega seotud tunnused, energia/amplituudiga seotud tunnused, spektritunnused ja kestusega seotud tunnused (Eyben et al., 2016).

Akustiline analüüs

Analüüsiserveri lähtekood vt https://github.com/jaotus/shiny-opensmile/.


Eyben, F., Wöllmer, M., and Schuller, B. (2010). “openSMILE: The Munich versatile and fast open-source audio feature extractor,” in Proc. of the 18th ACM International Conference on Multimedia, MM 2010  (Florence), 1459–1462. doi: 10.1145/1873951.1874246

Eyben, F., Weninger, F., Groß, F., and Schuller, B. (2013). “Recent developments in openSMILE, the Munich open-source multimedia feature extractor,” in Proc. of the 21st ACM International Conference on Multimedia, MM 2013  (Barcelona), 835–838. doi: 10.1145/2502081.2502224

Eyben, F., Scherer, K., Schuller, B., Sundberg, J., Andre, E., Busso, C., Devillers, L., Epps, J., Laukka, P., Narayanan, S., and Truong, K. (2016). The Geneva minimalistic acoustic parameter set (GeMAPS) for voice research and affective computing. IEEE Transactions on Affective Computing  7(2), 190–202. doi: 10.1109/TAFFC.2015.2457417