Sprachsynthese

Shownotes

Sprachsynthese-Software (TTS) ist, vor allem in den letzten Jahren, in aller Munde. So gibt es zahlreiche Projekte, die sich eine möglichst natürliche Stimme als Ziel gesetzt haben. TTS-Enthusiast Thorsten Müller hat es sich zur Aufgabe gemacht, seine eigene Stimme zu synthetisieren und teilt seine Beweggründe und Erfahrungen. Das neueste Highlight: der erste in ein Modell gegossene Regiolekt.

Thorsten Voice-Webseite: https://www.thorsten-voice.de/
YouTube-Channel: https://www.youtube.com/channel/UCjqqTVVBTsxpm0iOhQ1fp9g
GitHub-Projekt: https://github.com/thorstenMueller/Thorsten-Voice
coqui.ai: https://github.com/coqui-ai/TTS
piper: https://github.com/rhasspy/piper
mimic-recording-studio: https://github.com/MycroftAI/mimic-recording-studio
piper-recording-studio: https://github.com/rhasspy/piper-recording-studio
Mozilla Common Voice: https://commonvoice.mozilla.org/de
Online-Demo: https://huggingface.co/spaces/Thorsten-Voice/demo
Online-Demo (süd-hessisch): https://huggingface.co/spaces/Thorsten-Voice/Hessisch
Vortrag "FrOSCon 2023 - Qualitative und freie Sprachsynthese - darf’s ein bisschen weniger Cloud sein": https://media.ccc.de/v/froscon2023-2883-qualitative_und_freie_sprachsynthese_-_darf_s_ein_bisschen_weniger_cloud_sein
"Frankfurt Webmontag - Spracherkennung und Synthese mal lokal, statt heißer Luft aus der Cloud": https://youtu.be/sGyiwi64X1A?t=485

Shownotes

Neuer Kommentar