Course Code: llmsrl
Duration: 21 hours
Prerequisites:
  • Conocimientos básicos de Machine Learning

Audiencia

  • Científicos de datos
  • Ingenieros de software
Overview:

Large Language Models (LLMs) son tipos avanzados de redes neuronales diseñadas para comprender y generar texto similar al humano en función de la información que reciben. Reinforcement Learning (RL) es un tipo de aprendizaje automático en el que un agente aprende a tomar decisiones realizando acciones en un entorno para maximizar las recompensas acumuladas.

Esta capacitación en vivo dirigida por un instructor (en línea o en el sitio) está dirigida a científicos de datos de nivel intermedio que deseen obtener una comprensión integral y habilidades prácticas tanto en Large Language Models (LLMs) como en Reinforcement Learning (RL).

Al final de esta capacitación, los participantes serán capaces de:

  • Comprender los componentes y la funcionalidad de los modelos de transformadores.
  • Optimice y ajuste los LLM para tareas y aplicaciones específicas.
  • Comprender los principios básicos y las metodologías del aprendizaje por refuerzo.
  • Aprenda cómo las técnicas de aprendizaje por refuerzo pueden mejorar el rendimiento de los LLM.

Formato del curso

  • Conferencia interactiva y discusión.
  • Muchos ejercicios y práctica.
  • Implementación práctica en un entorno de laboratorio en vivo.

Opciones de personalización del curso

  • Para solicitar una formación personalizada para este curso, póngase en contacto con nosotros para concertar una cita.
Course Outline:

Introducción a Large Language Models (LLMs)

  • Descripción general de los LLM
  • Definición y significado
  • Aplicaciones de la IA en la actualidad

Arquitectura de transformadores

  • ¿Qué es un transformador y cómo funciona?
  • Componentes y características principales
  • Incrustación y codificación posicional
  • Atención multicabezal
  • Red neuronal feed-forward
  • Normalización y conexiones residuales

Modelos de transformadores

  • Mecanismo de autoatención
  • Arquitectura de codificador-decodificador
  • Incrustaciones posicionales
  • BERT (Representaciones de codificador bidireccional de transformadores)
  • GPT (Transformador Preentrenado Generativo)

Optimización del rendimiento y dificultades

  • Longitud del contexto
  • Mamba y modelos de espacio de estados
  • Atención rápida
  • Transformadores dispersos
  • Transformadores de visión
  • Importancia de la cuantificación

Mejora de los transformadores

  • Generación de texto aumentada de recuperación
  • Mezcla de modelos
  • Árbol de los pensamientos

Ajuste fino

  • Teoría de la adaptación de bajo rango
  • Ajuste fino con QLora

Leyes de escalado y optimización en LLM

  • Importancia de las leyes de escalamiento para los LLM
  • Escalado de tamaño de datos y modelos
  • Escalado computacional
  • Escalado de eficiencia de parámetros

Optimización

  • Relación entre el tamaño del modelo, el tamaño de los datos, el presupuesto de proceso y los requisitos de inferencia
  • Optimización del rendimiento y la eficiencia de los LLM
  • Mejores prácticas y herramientas para la formación y el ajuste de los LLM

Formación y puesta a punto de los LLM

  • Pasos y retos de la formación de LLMs desde cero
  • Adquisición y mantenimiento de datos
  • Requisitos de datos, CPU y memoria a gran escala
  • Desafíos de optimización
  • Panorama de los LLM de código abierto

Fundamentos de Reinforcement Learning (RL)

  • Introducción a Reinforcement Learning
  • Aprendizaje a través del refuerzo positivo
  • Definición y conceptos básicos
  • Proceso de decisión de Markov (MDP)
  • Programación dinámica
  • Métodos de Monte Carlo
  • Aprendizaje de la diferencia temporal

Profundo Reinforcement Learning

  • Redes Q profundas (DQN)
  • Optimización de políticas proximales (PPO)
  • Elements de Reinforcement Learning

Integración de LLMs y Reinforcement Learning

  • Combinación de LLM con Reinforcement Learning
  • Cómo se utiliza RL en los LLM
  • Reinforcement Learning con retroalimentación humana (RLHF)
  • Alternativas a RLHF

Casos de estudio y aplicaciones

  • Aplicaciones en el mundo real
  • Casos de éxito y retos

Temas Avanzados

  • Técnicas avanzadas
  • Métodos avanzados de optimización
  • Investigación y desarrollos de vanguardia

Resumen y próximos pasos

Sites Published:

United Arab Emirates - Large Language Models (LLMs) and Reinforcement Learning (RL)

Qatar - Large Language Models (LLMs) and Reinforcement Learning (RL)

Egypt - Large Language Models (LLMs) and Reinforcement Learning (RL)

Saudi Arabia - Large Language Models (LLMs) and Reinforcement Learning (RL)

South Africa - Large Language Models (LLMs) and Reinforcement Learning (RL)

Brasil - Large Language Models (LLMs) and Reinforcement Learning (RL)

Canada - Large Language Models (LLMs) and Reinforcement Learning (RL)

中国 - Large Language Models (LLMs) and Reinforcement Learning (RL)

香港 - Large Language Models (LLMs) and Reinforcement Learning (RL)

澳門 - Large Language Models (LLMs) and Reinforcement Learning (RL)

台灣 - Large Language Models (LLMs) and Reinforcement Learning (RL)

USA - Large Language Models (LLMs) and Reinforcement Learning (RL)

Österreich - Large Language Models (LLMs) and Reinforcement Learning (RL)

Schweiz - Large Language Models (LLMs) and Reinforcement Learning (RL)

Deutschland - Large Language Models (LLMs) and Reinforcement Learning (RL)

Czech Republic - Large Language Models (LLMs) and Reinforcement Learning (RL)

Denmark - Large Language Models (LLMs) and Reinforcement Learning (RL)

Estonia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Finland - Large Language Models (LLMs) and Reinforcement Learning (RL)

Greece - Large Language Models (LLMs) and Reinforcement Learning (RL)

Magyarország - Large Language Models (LLMs) and Reinforcement Learning (RL)

Ireland - Large Language Models (LLMs) and Reinforcement Learning (RL)

Luxembourg - Large Language Models (LLMs) and Reinforcement Learning (RL)

Latvia - Large Language Models (LLMs) and Reinforcement Learning (RL)

España - Large Language Models (LLMs) and Reinforcement Learning (RL)

Italia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Lithuania - Large Language Models (LLMs) and Reinforcement Learning (RL)

Nederland - Large Language Models (LLMs) and Reinforcement Learning (RL)

Norway - Large Language Models (LLMs) and Reinforcement Learning (RL)

Portugal - Large Language Models (LLMs) and Reinforcement Learning (RL)

România - Large Language Models (LLMs) and Reinforcement Learning (RL)

Sverige - Large Language Models (LLMs) and Reinforcement Learning (RL)

Türkiye - Large Language Models (LLMs) and Reinforcement Learning (RL)

Malta - Large Language Models (LLMs) and Reinforcement Learning (RL)

Belgique - Large Language Models (LLMs) and Reinforcement Learning (RL)

France - Large Language Models (LLMs) and Reinforcement Learning (RL)

日本 - Large Language Models (LLMs) and Reinforcement Learning (RL)

Australia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Malaysia - Large Language Models (LLMs) and Reinforcement Learning (RL)

New Zealand - Large Language Models (LLMs) and Reinforcement Learning (RL)

Philippines - Large Language Models (LLMs) and Reinforcement Learning (RL)

Singapore - Large Language Models (LLMs) and Reinforcement Learning (RL)

Thailand - Large Language Models (LLMs) and Reinforcement Learning (RL)

Vietnam - Large Language Models (LLMs) and Reinforcement Learning (RL)

India - Large Language Models (LLMs) and Reinforcement Learning (RL)

Argentina - Large Language Models (LLMs) and Reinforcement Learning (RL)

Chile - Large Language Models (LLMs) and Reinforcement Learning (RL)

Costa Rica - Large Language Models (LLMs) and Reinforcement Learning (RL)

Ecuador - Large Language Models (LLMs) and Reinforcement Learning (RL)

Guatemala - Large Language Models (LLMs) and Reinforcement Learning (RL)

Colombia - Large Language Models (LLMs) and Reinforcement Learning (RL)

México - Large Language Models (LLMs) and Reinforcement Learning (RL)

Panama - Large Language Models (LLMs) and Reinforcement Learning (RL)

Peru - Large Language Models (LLMs) and Reinforcement Learning (RL)

Uruguay - Large Language Models (LLMs) and Reinforcement Learning (RL)

Venezuela - Large Language Models (LLMs) and Reinforcement Learning (RL)

Polska - Large Language Models (LLMs) and Reinforcement Learning (RL)

United Kingdom - Large Language Models (LLMs) and Reinforcement Learning (RL)

South Korea - Large Language Models (LLMs) and Reinforcement Learning (RL)

Pakistan - Large Language Models (LLMs) and Reinforcement Learning (RL)

Sri Lanka - Large Language Models (LLMs) and Reinforcement Learning (RL)

Bulgaria - Large Language Models (LLMs) and Reinforcement Learning (RL)

Bolivia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Indonesia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Kazakhstan - Large Language Models (LLMs) and Reinforcement Learning (RL)

Moldova - Large Language Models (LLMs) and Reinforcement Learning (RL)

Morocco - Large Language Models (LLMs) and Reinforcement Learning (RL)

Tunisia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Kuwait - Large Language Models (LLMs) and Reinforcement Learning (RL)

Oman - Large Language Models (LLMs) and Reinforcement Learning (RL)

Slovakia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Kenya - Large Language Models (LLMs) and Reinforcement Learning (RL)

Nigeria - Large Language Models (LLMs) and Reinforcement Learning (RL)

Botswana - Large Language Models (LLMs) and Reinforcement Learning (RL)

Slovenia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Croatia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Serbia - Large Language Models (LLMs) and Reinforcement Learning (RL)

Bhutan - Large Language Models (LLMs) and Reinforcement Learning (RL)

Nepal - Large Language Models (LLMs) and Reinforcement Learning (RL)

Uzbekistan - Large Language Models (LLMs) and Reinforcement Learning (RL)