Course Code: srtai
Duration: 14 hours
Prerequisites:
  • Zrozumienie ogólnych koncepcji sztucznej inteligencji i uczenia maszynowego
  • Znajomość formatów plików audio lub multimedialnych oraz narzędzi

Grupa docelowa

  • Naukowcy danych i inżynierowie AI pracujący z danymi głosowymi
  • Programiści oprogramowania tworzący aplikacje oparte na transkrypcjach
  • Organizacje badające rozpoznawanie mowy w celu automatyzacji
Overview:

Rozpoznawanie mowy i transkrypcja za pomocą sztucznej inteligencji polega na przekształcaniu języka mówionego w tekst pisany za pomocą modeli uczenia maszynowego i systemów przetwarzania języka naturalnego.

To szkolenie prowadzone przez instruktora (online lub na miejscu) jest skierowane do profesjonalistów poziomu średniozaawansowanego, którzy chcą wdrożyć, ocenić i optymalizować rozwiązania AI do przekształcania mowy w tekst w realnych przypadkach użycia.

Po zakończeniu tego szkolenia uczestnicy będą mogli:

  • Zrozumieć, jak nowoczesne modele rozpoznawania mowy są trenowane i wdrażane.
  • Oceniać otwarte i komercyjne API do transkrypcji mowy w tekst.
  • Radzić sobie z wyzwaniami wielojęzyczności i transkrypcji specjalistycznej.
  • Budować proste przepływy transkrypcji dla różnych źródeł audio.

Format kursu

  • Interaktywne wykłady i dyskusje.
  • Wiele ćwiczeń i praktyki.
  • Ręczne wdrożenie w środowisku live-lab.

Opcje dostosowywania kursu

  • Aby poprosić o dostosowane szkolenie dla tego kursu, prosimy o kontakt z nami w celu uzgodnienia.
Course Outline:

Przegląd technologii Speech Recognition

  • Historia i ewolucja rozpoznawania mowy
  • Modele akustyczne, modele językowe i dekodowanie
  • Nowoczesne architektury: sieci neuronowe z pamięcią (RNNs), transformatory i Whisper

Podstawy audio i przetwarzanie transkrypcji

  • Obsługa formatów audio i częstotliwości próbkowania
  • Oczyszczanie, przycinanie i segmentacja audio
  • Generowanie tekstu z audio: w czasie rzeczywistym vs. w partiach

Praktyczne zajęcia z Whisper i innymi API

  • Instalowanie i używanie OpenAI Whisper
  • Wywoływanie API w chmurze (Google, Azure) do transkrypcji
  • Porównywanie wydajności, opóźnień i kosztów

Język, akcenty i adaptacja do dziedziny

  • Praca z wieloma językami i akcentami
  • Słowniki niestandardowe i odporność na szum
  • Obsługa języka prawniczego, medycznego lub technicznego

Formatowanie wyjścia i integracja

  • Dodawanie znaczników czasu, interpunkcji i etykiet mówcy
  • Eksport do formatów tekstowych, SRT lub JSON
  • Integrowanie transkrypcji z aplikacjami lub bazami danych

Use Case Laboratoria implementacyjne

  • Transkrypcja spotkań, wywiadów lub podcastów
  • Systemy poleceń głosem do tekstu
  • Nadpisy w czasie rzeczywistym dla strumieni wideo/audio

Ocena, ograniczenia i etyka

  • Wskaźniki dokładności i benchmarkowanie modeli
  • Uwzględnienie zniekształceń i sprawiedliwości w modelach mowy
  • Rozważania dotyczące prywatności i zgodności

Podsumowanie i następne kroki

Sites Published:

United Arab Emirates - Speech Recognition and Transcription Using AI

Qatar - Speech Recognition and Transcription Using AI

Egypt - Speech Recognition and Transcription Using AI

Saudi Arabia - Speech Recognition and Transcription Using AI

South Africa - Speech Recognition and Transcription Using AI

Brasil - Speech Recognition and Transcription Using AI

Canada - Speech Recognition and Transcription Using AI

中国 - Speech Recognition and Transcription Using AI

香港 - Speech Recognition and Transcription Using AI

澳門 - Speech Recognition and Transcription Using AI

台灣 - Speech Recognition and Transcription Using AI

USA - Speech Recognition and Transcription Using AI

Österreich - Speech Recognition and Transcription Using AI

Schweiz - Speech Recognition and Transcription Using AI

Deutschland - Speech Recognition and Transcription Using AI

Czech Republic - Speech Recognition and Transcription Using AI

Denmark - Speech Recognition and Transcription Using AI

Estonia - Speech Recognition and Transcription Using AI

Finland - Speech Recognition and Transcription Using AI

Greece - Speech Recognition and Transcription Using AI

Magyarország - Speech Recognition and Transcription Using AI

Ireland - Speech Recognition and Transcription Using AI

Luxembourg - Speech Recognition and Transcription Using AI

Latvia - Speech Recognition and Transcription Using AI

España - Speech Recognition and Transcription Using AI

Italia - Speech Recognition and Transcription Using AI

Lithuania - Speech Recognition and Transcription Using AI

Nederland - Speech Recognition and Transcription Using AI

Norway - Speech Recognition and Transcription Using AI

Portugal - Speech Recognition and Transcription Using AI

România - Speech Recognition and Transcription Using AI

Sverige - Speech Recognition and Transcription Using AI

Türkiye - Speech Recognition and Transcription Using AI

Malta - Speech Recognition and Transcription Using AI

Belgique - Speech Recognition and Transcription Using AI

France - Speech Recognition and Transcription Using AI

日本 - Speech Recognition and Transcription Using AI

Australia - Speech Recognition and Transcription Using AI

Malaysia - Speech Recognition and Transcription Using AI

New Zealand - Speech Recognition and Transcription Using AI

Philippines - Speech Recognition and Transcription Using AI

Singapore - Speech Recognition and Transcription Using AI

Thailand - Speech Recognition and Transcription Using AI

Vietnam - Speech Recognition and Transcription Using AI

India - Speech Recognition and Transcription Using AI

Argentina - Speech Recognition and Transcription Using AI

Chile - Speech Recognition and Transcription Using AI

Costa Rica - Speech Recognition and Transcription Using AI

Ecuador - Speech Recognition and Transcription Using AI

Guatemala - Speech Recognition and Transcription Using AI

Colombia - Speech Recognition and Transcription Using AI

México - Speech Recognition and Transcription Using AI

Panama - Speech Recognition and Transcription Using AI

Peru - Speech Recognition and Transcription Using AI

Uruguay - Speech Recognition and Transcription Using AI

Venezuela - Speech Recognition and Transcription Using AI

Polska - Speech Recognition and Transcription Using AI

United Kingdom - Speech Recognition and Transcription Using AI

South Korea - Speech Recognition and Transcription Using AI

Pakistan - Speech Recognition and Transcription Using AI

Sri Lanka - Speech Recognition and Transcription Using AI

Bulgaria - Speech Recognition and Transcription Using AI

Bolivia - Speech Recognition and Transcription Using AI

Indonesia - Speech Recognition and Transcription Using AI

Kazakhstan - Speech Recognition and Transcription Using AI

Moldova - Speech Recognition and Transcription Using AI

Morocco - Speech Recognition and Transcription Using AI

Tunisia - Speech Recognition and Transcription Using AI

Kuwait - Speech Recognition and Transcription Using AI

Oman - Speech Recognition and Transcription Using AI

Slovakia - Speech Recognition and Transcription Using AI

Kenya - Speech Recognition and Transcription Using AI

Nigeria - Speech Recognition and Transcription Using AI

Botswana - Speech Recognition and Transcription Using AI

Slovenia - Speech Recognition and Transcription Using AI

Croatia - Speech Recognition and Transcription Using AI

Serbia - Speech Recognition and Transcription Using AI

Bhutan - Speech Recognition and Transcription Using AI

Nepal - Speech Recognition and Transcription Using AI

Uzbekistan - Speech Recognition and Transcription Using AI