Speech Recognition and Transcription Using AI

Course Code: srtai

Duration: 14 hours

Prerequisites:

Zrozumienie ogólnych koncepcji sztucznej inteligencji i uczenia maszynowego
Znajomość formatów plików audio lub multimedialnych oraz narzędzi

Grupa docelowa

Naukowcy danych i inżynierowie AI pracujący z danymi głosowymi
Programiści oprogramowania tworzący aplikacje oparte na transkrypcjach
Organizacje badające rozpoznawanie mowy w celu automatyzacji

Overview:

Rozpoznawanie mowy i transkrypcja za pomocą sztucznej inteligencji polega na przekształcaniu języka mówionego w tekst pisany za pomocą modeli uczenia maszynowego i systemów przetwarzania języka naturalnego.

To szkolenie prowadzone przez instruktora (online lub na miejscu) jest skierowane do profesjonalistów poziomu średniozaawansowanego, którzy chcą wdrożyć, ocenić i optymalizować rozwiązania AI do przekształcania mowy w tekst w realnych przypadkach użycia.

Po zakończeniu tego szkolenia uczestnicy będą mogli:

Zrozumieć, jak nowoczesne modele rozpoznawania mowy są trenowane i wdrażane.
Oceniać otwarte i komercyjne API do transkrypcji mowy w tekst.
Radzić sobie z wyzwaniami wielojęzyczności i transkrypcji specjalistycznej.
Budować proste przepływy transkrypcji dla różnych źródeł audio.

Format kursu

Interaktywne wykłady i dyskusje.
Wiele ćwiczeń i praktyki.
Ręczne wdrożenie w środowisku live-lab.

Opcje dostosowywania kursu

Aby poprosić o dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu uzgodnienia.

Course Outline:

Przegląd technologii Speech Recognition

Historia i ewolucja rozpoznawania mowy
Modele akustyczne, modele językowe i dekodowanie
Nowoczesne architektury: sieci neuronowe z pamięcią (RNNs), transformatory i Whisper

Podstawy audio i przetwarzanie transkrypcji

Obsługa formatów audio i częstotliwości próbkowania
Oczyszczanie, przycinanie i segmentacja audio
Generowanie tekstu z audio: w czasie rzeczywistym vs. w partiach

Praktyczne zajęcia z Whisper i innymi API

Instalowanie i używanie OpenAI Whisper
Wywoływanie API w chmurze (Google, Azure) do transkrypcji
Porównywanie wydajności, opóźnień i kosztów

Język, akcenty i adaptacja do dziedziny

Praca z wieloma językami i akcentami
Słowniki niestandardowe i odporność na szum
Obsługa języka prawniczego, medycznego lub technicznego

Formatowanie wyjścia i integracja

Dodawanie znaczników czasu, interpunkcji i etykiet mówcy
Eksport do formatów tekstowych, SRT lub JSON
Integrowanie transkrypcji z aplikacjami lub bazami danych

Use Case Laboratoria implementacyjne

Transkrypcja spotkań, wywiadów lub podcastów
Systemy poleceń głosem do tekstu
Nadpisy w czasie rzeczywistym dla strumieni wideo/audio

Ocena, ograniczenia i etyka

Wskaźniki dokładności i benchmarkowanie modeli
Uwzględnienie zniekształceń i sprawiedliwości w modelach mowy
Rozważania dotyczące prywatności i zgodności

Podsumowanie i następne kroki

Sites Published:

United Arab Emirates - Speech Recognition and Transcription Using AI

Qatar - Speech Recognition and Transcription Using AI

Egypt - Speech Recognition and Transcription Using AI

Saudi Arabia - Speech Recognition and Transcription Using AI

South Africa - Speech Recognition and Transcription Using AI

Brasil - Speech Recognition and Transcription Using AI

Canada - Speech Recognition and Transcription Using AI

中国 - Speech Recognition and Transcription Using AI

香港 - Speech Recognition and Transcription Using AI

澳門 - Speech Recognition and Transcription Using AI

台灣 - Speech Recognition and Transcription Using AI

USA - Speech Recognition and Transcription Using AI

Österreich - Speech Recognition and Transcription Using AI

Schweiz - Speech Recognition and Transcription Using AI

Deutschland - Speech Recognition and Transcription Using AI

Czech Republic - Speech Recognition and Transcription Using AI

Denmark - Speech Recognition and Transcription Using AI

Estonia - Speech Recognition and Transcription Using AI

Finland - Speech Recognition and Transcription Using AI

Greece - Speech Recognition and Transcription Using AI

Magyarország - Speech Recognition and Transcription Using AI

Ireland - Speech Recognition and Transcription Using AI

Luxembourg - Speech Recognition and Transcription Using AI

Latvia - Speech Recognition and Transcription Using AI

España - Speech Recognition and Transcription Using AI

Italia - Speech Recognition and Transcription Using AI

Lithuania - Speech Recognition and Transcription Using AI

Nederland - Speech Recognition and Transcription Using AI

Norway - Speech Recognition and Transcription Using AI

Portugal - Speech Recognition and Transcription Using AI

România - Speech Recognition and Transcription Using AI

Sverige - Speech Recognition and Transcription Using AI

Türkiye - Speech Recognition and Transcription Using AI

Malta - Speech Recognition and Transcription Using AI

Belgique - Speech Recognition and Transcription Using AI

France - Speech Recognition and Transcription Using AI

日本 - Speech Recognition and Transcription Using AI

Australia - Speech Recognition and Transcription Using AI

Malaysia - Speech Recognition and Transcription Using AI

New Zealand - Speech Recognition and Transcription Using AI

Philippines - Speech Recognition and Transcription Using AI

Singapore - Speech Recognition and Transcription Using AI

Thailand - Speech Recognition and Transcription Using AI

Vietnam - Speech Recognition and Transcription Using AI

India - Speech Recognition and Transcription Using AI

Argentina - Speech Recognition and Transcription Using AI

Chile - Speech Recognition and Transcription Using AI

Costa Rica - Speech Recognition and Transcription Using AI

Ecuador - Speech Recognition and Transcription Using AI

Guatemala - Speech Recognition and Transcription Using AI

Colombia - Speech Recognition and Transcription Using AI

México - Speech Recognition and Transcription Using AI

Panama - Speech Recognition and Transcription Using AI

Peru - Speech Recognition and Transcription Using AI

Uruguay - Speech Recognition and Transcription Using AI

Venezuela - Speech Recognition and Transcription Using AI

Polska - Speech Recognition and Transcription Using AI

United Kingdom - Speech Recognition and Transcription Using AI

South Korea - Speech Recognition and Transcription Using AI

Pakistan - Speech Recognition and Transcription Using AI

Sri Lanka - Speech Recognition and Transcription Using AI

Bulgaria - Speech Recognition and Transcription Using AI

Bolivia - Speech Recognition and Transcription Using AI

Indonesia - Speech Recognition and Transcription Using AI

Kazakhstan - Speech Recognition and Transcription Using AI

Moldova - Speech Recognition and Transcription Using AI

Morocco - Speech Recognition and Transcription Using AI

Tunisia - Speech Recognition and Transcription Using AI

Kuwait - Speech Recognition and Transcription Using AI

Oman - Speech Recognition and Transcription Using AI

Slovakia - Speech Recognition and Transcription Using AI

Kenya - Speech Recognition and Transcription Using AI

Nigeria - Speech Recognition and Transcription Using AI

Botswana - Speech Recognition and Transcription Using AI

Slovenia - Speech Recognition and Transcription Using AI

Croatia - Speech Recognition and Transcription Using AI

Serbia - Speech Recognition and Transcription Using AI

Bhutan - Speech Recognition and Transcription Using AI

Nepal - Speech Recognition and Transcription Using AI

Uzbekistan - Speech Recognition and Transcription Using AI