- Zrozumienie ogólnych koncepcji sztucznej inteligencji i uczenia maszynowego
- Znajomość formatów plików audio lub multimedialnych oraz narzędzi
Grupa docelowa
- Naukowcy danych i inżynierowie AI pracujący z danymi głosowymi
- Programiści oprogramowania tworzący aplikacje oparte na transkrypcjach
- Organizacje badające rozpoznawanie mowy w celu automatyzacji
Rozpoznawanie mowy i transkrypcja za pomocą sztucznej inteligencji polega na przekształcaniu języka mówionego w tekst pisany za pomocą modeli uczenia maszynowego i systemów przetwarzania języka naturalnego.
To szkolenie prowadzone przez instruktora (online lub na miejscu) jest skierowane do profesjonalistów poziomu średniozaawansowanego, którzy chcą wdrożyć, ocenić i optymalizować rozwiązania AI do przekształcania mowy w tekst w realnych przypadkach użycia.
Po zakończeniu tego szkolenia uczestnicy będą mogli:
- Zrozumieć, jak nowoczesne modele rozpoznawania mowy są trenowane i wdrażane.
- Oceniać otwarte i komercyjne API do transkrypcji mowy w tekst.
- Radzić sobie z wyzwaniami wielojęzyczności i transkrypcji specjalistycznej.
- Budować proste przepływy transkrypcji dla różnych źródeł audio.
Format kursu
- Interaktywne wykłady i dyskusje.
- Wiele ćwiczeń i praktyki.
- Ręczne wdrożenie w środowisku live-lab.
Opcje dostosowywania kursu
- Aby poprosić o dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu uzgodnienia.
Przegląd technologii Speech Recognition
- Historia i ewolucja rozpoznawania mowy
- Modele akustyczne, modele językowe i dekodowanie
- Nowoczesne architektury: sieci neuronowe z pamięcią (RNNs), transformatory i Whisper
Podstawy audio i przetwarzanie transkrypcji
- Obsługa formatów audio i częstotliwości próbkowania
- Oczyszczanie, przycinanie i segmentacja audio
- Generowanie tekstu z audio: w czasie rzeczywistym vs. w partiach
Praktyczne zajęcia z Whisper i innymi API
- Instalowanie i używanie OpenAI Whisper
- Wywoływanie API w chmurze (Google, Azure) do transkrypcji
- Porównywanie wydajności, opóźnień i kosztów
Język, akcenty i adaptacja do dziedziny
- Praca z wieloma językami i akcentami
- Słowniki niestandardowe i odporność na szum
- Obsługa języka prawniczego, medycznego lub technicznego
Formatowanie wyjścia i integracja
- Dodawanie znaczników czasu, interpunkcji i etykiet mówcy
- Eksport do formatów tekstowych, SRT lub JSON
- Integrowanie transkrypcji z aplikacjami lub bazami danych
Use Case Laboratoria implementacyjne
- Transkrypcja spotkań, wywiadów lub podcastów
- Systemy poleceń głosem do tekstu
- Nadpisy w czasie rzeczywistym dla strumieni wideo/audio
Ocena, ograniczenia i etyka
- Wskaźniki dokładności i benchmarkowanie modeli
- Uwzględnienie zniekształceń i sprawiedliwości w modelach mowy
- Rozważania dotyczące prywatności i zgodności
Podsumowanie i następne kroki
United Arab Emirates - Speech Recognition and Transcription Using AI
Qatar - Speech Recognition and Transcription Using AI
Egypt - Speech Recognition and Transcription Using AI
Saudi Arabia - Speech Recognition and Transcription Using AI
South Africa - Speech Recognition and Transcription Using AI
Brasil - Speech Recognition and Transcription Using AI
Canada - Speech Recognition and Transcription Using AI
中国 - Speech Recognition and Transcription Using AI
香港 - Speech Recognition and Transcription Using AI
澳門 - Speech Recognition and Transcription Using AI
台灣 - Speech Recognition and Transcription Using AI
USA - Speech Recognition and Transcription Using AI
Österreich - Speech Recognition and Transcription Using AI
Schweiz - Speech Recognition and Transcription Using AI
Deutschland - Speech Recognition and Transcription Using AI
Czech Republic - Speech Recognition and Transcription Using AI
Denmark - Speech Recognition and Transcription Using AI
Estonia - Speech Recognition and Transcription Using AI
Finland - Speech Recognition and Transcription Using AI
Greece - Speech Recognition and Transcription Using AI
Magyarország - Speech Recognition and Transcription Using AI
Ireland - Speech Recognition and Transcription Using AI
Luxembourg - Speech Recognition and Transcription Using AI
Latvia - Speech Recognition and Transcription Using AI
España - Speech Recognition and Transcription Using AI
Italia - Speech Recognition and Transcription Using AI
Lithuania - Speech Recognition and Transcription Using AI
Nederland - Speech Recognition and Transcription Using AI
Norway - Speech Recognition and Transcription Using AI
Portugal - Speech Recognition and Transcription Using AI
România - Speech Recognition and Transcription Using AI
Sverige - Speech Recognition and Transcription Using AI
Türkiye - Speech Recognition and Transcription Using AI
Malta - Speech Recognition and Transcription Using AI
Belgique - Speech Recognition and Transcription Using AI
France - Speech Recognition and Transcription Using AI
日本 - Speech Recognition and Transcription Using AI
Australia - Speech Recognition and Transcription Using AI
Malaysia - Speech Recognition and Transcription Using AI
New Zealand - Speech Recognition and Transcription Using AI
Philippines - Speech Recognition and Transcription Using AI
Singapore - Speech Recognition and Transcription Using AI
Thailand - Speech Recognition and Transcription Using AI
Vietnam - Speech Recognition and Transcription Using AI
India - Speech Recognition and Transcription Using AI
Argentina - Speech Recognition and Transcription Using AI
Chile - Speech Recognition and Transcription Using AI
Costa Rica - Speech Recognition and Transcription Using AI
Ecuador - Speech Recognition and Transcription Using AI
Guatemala - Speech Recognition and Transcription Using AI
Colombia - Speech Recognition and Transcription Using AI
México - Speech Recognition and Transcription Using AI
Panama - Speech Recognition and Transcription Using AI
Peru - Speech Recognition and Transcription Using AI
Uruguay - Speech Recognition and Transcription Using AI
Venezuela - Speech Recognition and Transcription Using AI
Polska - Speech Recognition and Transcription Using AI
United Kingdom - Speech Recognition and Transcription Using AI
South Korea - Speech Recognition and Transcription Using AI
Pakistan - Speech Recognition and Transcription Using AI
Sri Lanka - Speech Recognition and Transcription Using AI
Bulgaria - Speech Recognition and Transcription Using AI
Bolivia - Speech Recognition and Transcription Using AI
Indonesia - Speech Recognition and Transcription Using AI
Kazakhstan - Speech Recognition and Transcription Using AI
Moldova - Speech Recognition and Transcription Using AI
Morocco - Speech Recognition and Transcription Using AI
Tunisia - Speech Recognition and Transcription Using AI
Kuwait - Speech Recognition and Transcription Using AI
Oman - Speech Recognition and Transcription Using AI
Slovakia - Speech Recognition and Transcription Using AI
Kenya - Speech Recognition and Transcription Using AI
Nigeria - Speech Recognition and Transcription Using AI
Botswana - Speech Recognition and Transcription Using AI
Slovenia - Speech Recognition and Transcription Using AI
Croatia - Speech Recognition and Transcription Using AI
Serbia - Speech Recognition and Transcription Using AI
Bhutan - Speech Recognition and Transcription Using AI