Sprachsynthese
Shownotes
Sprachsynthese-Software (TTS) ist, vor allem in den letzten Jahren, in aller Munde. So gibt es zahlreiche Projekte, die sich eine möglichst natürliche Stimme als Ziel gesetzt haben. TTS-Enthusiast Thorsten Müller hat es sich zur Aufgabe gemacht, seine eigene Stimme zu synthetisieren und teilt seine Beweggründe und Erfahrungen. Das neueste Highlight: der erste in ein Modell gegossene Regiolekt.
- Thorsten Voice-Webseite: https://www.thorsten-voice.de/
- YouTube-Channel: https://www.youtube.com/channel/UCjqqTVVBTsxpm0iOhQ1fp9g
- GitHub-Projekt: https://github.com/thorstenMueller/Thorsten-Voice
- coqui.ai: https://github.com/coqui-ai/TTS
- piper: https://github.com/rhasspy/piper
- mimic-recording-studio: https://github.com/MycroftAI/mimic-recording-studio
- piper-recording-studio: https://github.com/rhasspy/piper-recording-studio
- Mozilla Common Voice: https://commonvoice.mozilla.org/de
- Online-Demo: https://huggingface.co/spaces/Thorsten-Voice/demo
- Online-Demo (süd-hessisch): https://huggingface.co/spaces/Thorsten-Voice/Hessisch
- Vortrag "FrOSCon 2023 - Qualitative und freie Sprachsynthese - darf’s ein bisschen weniger Cloud sein": https://media.ccc.de/v/froscon2023-2883-qualitative_und_freie_sprachsynthese_-_darf_s_ein_bisschen_weniger_cloud_sein
- "Frankfurt Webmontag - Spracherkennung und Synthese mal lokal, statt heißer Luft aus der Cloud": https://youtu.be/sGyiwi64X1A?t=485
Neuer Kommentar