Course Code: vcsgai
Duration: 14 hours
Prerequisites:
  • Rozumienie podstaw uczenia maszynowego
  • Zapoznanie z formatami plików audio i narzędziami do edycji
  • Podstawowe umiejętności programowania Python

Grupa docelowa

  • Deweloperzy i inżynierowie AI zainteresowani syntezą mowy
  • Twórcy treści i technolodzy mediów eksplorujący generowanie głosu
  • Zespoły badawczo-rozwojowe budujące spersonalizowane lub dynamiczne systemy audio
Overview:

Klonowanie głosu i generowanie mowy za pomocą AI pozwala użytkownikom na replikację ludzkich głosów lub generowanie syntetycznej mowy za pomocą modeli uczenia głębokiego i technik syntezy mowy.

To prowadzone przez instruktora szkolenie na żywo (online lub na miejscu) jest przeznaczone dla profesjonalistów na poziomie średnim, którzy chcą tworzyć, oceniać i stosować systemy klonowania głosu i TTS w realnych projektach.

Po zakończeniu tego szkolenia uczestnicy będą mogli:

  • Zrozumieć podstawowe koncepcje za neuralną syntezą mowy i klonowaniem głosu.
  • Oceniać komercyjne i open-source platformy TTS.
  • Klonować głosy z nagrań próbkowych z zachowaniem etycznych i prawnych wytycznych.
  • Integrować syntetyczne głosy w aplikacje, IVR lub kanały mediów.

Format kursu

  • Interaktywne wykłady i dyskusje.
  • Wiele ćwiczeń i praktyki.
  • Ręczne implementacje w środowisku live-lab.

Opcje dostosowania kursu

  • Aby poprosić o dostosowane szkolenie dla tego kursu, prosimy o kontakt, aby ułożyć.
Course Outline:

Wprowadzenie do syntezy mowy i klonowania głosu

  • Przegląd tekstu do mowy (TTS) i neuronalnej syntezy głosu
  • Klonowanie głosu vs generowanie mowy: przypadki użycia i granice
  • Kluczowe modele: Tacotron, WaveNet, FastSpeech, VITS

Praca z platformami komercyjnymi

  • Używanie ElevenLabs i Resemble AI
  • Tworzenie, klonowanie i edytowanie głosu
  • Dostęp do API i przepływy tekstu do mowy

Budowanie z narzędziami open-source

  • Instalowanie i konfigurowanie Coqui TTS
  • Trenowanie niestandardowych głosów i zarządzanie zestawami danych
  • Generowanie mowy z dokładną kontrolą (ton, prędkość, emocja)

Przygotowanie danych i zestawu głosowego Management

  • Zbieranie i oczyszczanie próbek głosu
  • Segmentowanie, oznaczanie i wstępne ustawianie transkrypcji
  • Etyczne pozyskiwanie i zgoda na głos

Integracja aplikacji

  • Wbudowywanie TTS w strony internetowe i aplikacje
  • Tworzenie systemów IVR i interaktywnych botów
  • Generowanie syntetycznego dialogu dla wideo i gier

Ocena jakości i realizmu

  • MOS (Mean Opinion Score) i testy zrozumiałości
  • Kontrolowanie ekspresji i prosody
  • Porównywanie opóźnień, wierności i realizmu

Etyczne, prawne i Go zarządzanie

  • Ryzyka deepfake i odpowiedzialne używanie
  • Zgoda, przypisywanie autorstwa i implikacje praw autorskich
  • Regulacje i polityki organizacji

Podsumowanie i następne kroki

Sites Published:

United Arab Emirates - Voice Cloning and Speech Generation with AI

Qatar - Voice Cloning and Speech Generation with AI

Egypt - Voice Cloning and Speech Generation with AI

Saudi Arabia - Voice Cloning and Speech Generation with AI

South Africa - Voice Cloning and Speech Generation with AI

Brasil - Voice Cloning and Speech Generation with AI

Canada - Voice Cloning and Speech Generation with AI

中国 - Voice Cloning and Speech Generation with AI

香港 - Voice Cloning and Speech Generation with AI

澳門 - Voice Cloning and Speech Generation with AI

台灣 - Voice Cloning and Speech Generation with AI

USA - Voice Cloning and Speech Generation with AI

Österreich - Voice Cloning and Speech Generation with AI

Schweiz - Voice Cloning and Speech Generation with AI

Deutschland - Voice Cloning and Speech Generation with AI

Czech Republic - Voice Cloning and Speech Generation with AI

Denmark - Voice Cloning and Speech Generation with AI

Estonia - Voice Cloning and Speech Generation with AI

Finland - Voice Cloning and Speech Generation with AI

Greece - Voice Cloning and Speech Generation with AI

Magyarország - Voice Cloning and Speech Generation with AI

Ireland - Voice Cloning and Speech Generation with AI

Luxembourg - Voice Cloning and Speech Generation with AI

Latvia - Voice Cloning and Speech Generation with AI

España - Voice Cloning and Speech Generation with AI

Italia - Voice Cloning and Speech Generation with AI

Lithuania - Voice Cloning and Speech Generation with AI

Nederland - Voice Cloning and Speech Generation with AI

Norway - Voice Cloning and Speech Generation with AI

Portugal - Voice Cloning and Speech Generation with AI

România - Voice Cloning and Speech Generation with AI

Sverige - Voice Cloning and Speech Generation with AI

Türkiye - Voice Cloning and Speech Generation with AI

Malta - Voice Cloning and Speech Generation with AI

Belgique - Voice Cloning and Speech Generation with AI

France - Voice Cloning and Speech Generation with AI

日本 - Voice Cloning and Speech Generation with AI

Australia - Voice Cloning and Speech Generation with AI

Malaysia - Voice Cloning and Speech Generation with AI

New Zealand - Voice Cloning and Speech Generation with AI

Philippines - Voice Cloning and Speech Generation with AI

Singapore - Voice Cloning and Speech Generation with AI

Thailand - Voice Cloning and Speech Generation with AI

Vietnam - Voice Cloning and Speech Generation with AI

India - Voice Cloning and Speech Generation with AI

Argentina - Voice Cloning and Speech Generation with AI

Chile - Voice Cloning and Speech Generation with AI

Costa Rica - Voice Cloning and Speech Generation with AI

Ecuador - Voice Cloning and Speech Generation with AI

Guatemala - Voice Cloning and Speech Generation with AI

Colombia - Voice Cloning and Speech Generation with AI

México - Voice Cloning and Speech Generation with AI

Panama - Voice Cloning and Speech Generation with AI

Peru - Voice Cloning and Speech Generation with AI

Uruguay - Voice Cloning and Speech Generation with AI

Venezuela - Voice Cloning and Speech Generation with AI

Polska - Voice Cloning and Speech Generation with AI

United Kingdom - Voice Cloning and Speech Generation with AI

South Korea - Voice Cloning and Speech Generation with AI

Pakistan - Voice Cloning and Speech Generation with AI

Sri Lanka - Voice Cloning and Speech Generation with AI

Bulgaria - Voice Cloning and Speech Generation with AI

Bolivia - Voice Cloning and Speech Generation with AI

Indonesia - Voice Cloning and Speech Generation with AI

Kazakhstan - Voice Cloning and Speech Generation with AI

Moldova - Voice Cloning and Speech Generation with AI

Morocco - Voice Cloning and Speech Generation with AI

Tunisia - Voice Cloning and Speech Generation with AI

Kuwait - Voice Cloning and Speech Generation with AI

Oman - Voice Cloning and Speech Generation with AI

Slovakia - Voice Cloning and Speech Generation with AI

Kenya - Voice Cloning and Speech Generation with AI

Nigeria - Voice Cloning and Speech Generation with AI

Botswana - Voice Cloning and Speech Generation with AI

Slovenia - Voice Cloning and Speech Generation with AI

Croatia - Voice Cloning and Speech Generation with AI

Serbia - Voice Cloning and Speech Generation with AI

Bhutan - Voice Cloning and Speech Generation with AI

Nepal - Voice Cloning and Speech Generation with AI

Uzbekistan - Voice Cloning and Speech Generation with AI