- Conocimientos básicos de Machine Learning
Audiencia
- Científicos de datos
- Ingenieros de software
Large Language Models (LLMs) son tipos avanzados de redes neuronales diseñadas para comprender y generar texto similar al humano en función de la información que reciben. Reinforcement Learning (RL) es un tipo de aprendizaje automático en el que un agente aprende a tomar decisiones realizando acciones en un entorno para maximizar las recompensas acumuladas.
Esta capacitación en vivo dirigida por un instructor (en línea o en el sitio) está dirigida a científicos de datos de nivel intermedio que deseen obtener una comprensión integral y habilidades prácticas tanto en Large Language Models (LLMs) como en Reinforcement Learning (RL).
Al final de esta capacitación, los participantes serán capaces de:
- Comprender los componentes y la funcionalidad de los modelos de transformadores.
- Optimice y ajuste los LLM para tareas y aplicaciones específicas.
- Comprender los principios básicos y las metodologías del aprendizaje por refuerzo.
- Aprenda cómo las técnicas de aprendizaje por refuerzo pueden mejorar el rendimiento de los LLM.
Formato del curso
- Conferencia interactiva y discusión.
- Muchos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una formación personalizada para este curso, póngase en contacto con nosotros para concertar una cita.
Introducción a Large Language Models (LLMs)
- Descripción general de los LLM
- Definición y significado
- Aplicaciones de la IA en la actualidad
Arquitectura de transformadores
- ¿Qué es un transformador y cómo funciona?
- Componentes y características principales
- Incrustación y codificación posicional
- Atención multicabezal
- Red neuronal feed-forward
- Normalización y conexiones residuales
Modelos de transformadores
- Mecanismo de autoatención
- Arquitectura de codificador-decodificador
- Incrustaciones posicionales
- BERT (Representaciones de codificador bidireccional de transformadores)
- GPT (Transformador Preentrenado Generativo)
Optimización del rendimiento y dificultades
- Longitud del contexto
- Mamba y modelos de espacio de estados
- Atención rápida
- Transformadores dispersos
- Transformadores de visión
- Importancia de la cuantificación
Mejora de los transformadores
- Generación de texto aumentada de recuperación
- Mezcla de modelos
- Árbol de los pensamientos
Ajuste fino
- Teoría de la adaptación de bajo rango
- Ajuste fino con QLora
Leyes de escalado y optimización en LLM
- Importancia de las leyes de escalamiento para los LLM
- Escalado de tamaño de datos y modelos
- Escalado computacional
- Escalado de eficiencia de parámetros
Optimización
- Relación entre el tamaño del modelo, el tamaño de los datos, el presupuesto de proceso y los requisitos de inferencia
- Optimización del rendimiento y la eficiencia de los LLM
- Mejores prácticas y herramientas para la formación y el ajuste de los LLM
Formación y puesta a punto de los LLM
- Pasos y retos de la formación de LLMs desde cero
- Adquisición y mantenimiento de datos
- Requisitos de datos, CPU y memoria a gran escala
- Desafíos de optimización
- Panorama de los LLM de código abierto
Fundamentos de Reinforcement Learning (RL)
- Introducción a Reinforcement Learning
- Aprendizaje a través del refuerzo positivo
- Definición y conceptos básicos
- Proceso de decisión de Markov (MDP)
- Programación dinámica
- Métodos de Monte Carlo
- Aprendizaje de la diferencia temporal
Profundo Reinforcement Learning
- Redes Q profundas (DQN)
- Optimización de políticas proximales (PPO)
- Elements de Reinforcement Learning
Integración de LLMs y Reinforcement Learning
- Combinación de LLM con Reinforcement Learning
- Cómo se utiliza RL en los LLM
- Reinforcement Learning con retroalimentación humana (RLHF)
- Alternativas a RLHF
Casos de estudio y aplicaciones
- Aplicaciones en el mundo real
- Casos de éxito y retos
Temas Avanzados
- Técnicas avanzadas
- Métodos avanzados de optimización
- Investigación y desarrollos de vanguardia
Resumen y próximos pasos
United Arab Emirates - Large Language Models (LLMs) and Reinforcement Learning (RL)
Qatar - Large Language Models (LLMs) and Reinforcement Learning (RL)
Egypt - Large Language Models (LLMs) and Reinforcement Learning (RL)
Saudi Arabia - Large Language Models (LLMs) and Reinforcement Learning (RL)
South Africa - Large Language Models (LLMs) and Reinforcement Learning (RL)
Brasil - Large Language Models (LLMs) and Reinforcement Learning (RL)
Canada - Large Language Models (LLMs) and Reinforcement Learning (RL)
中国 - Large Language Models (LLMs) and Reinforcement Learning (RL)
香港 - Large Language Models (LLMs) and Reinforcement Learning (RL)
澳門 - Large Language Models (LLMs) and Reinforcement Learning (RL)
台灣 - Large Language Models (LLMs) and Reinforcement Learning (RL)
USA - Large Language Models (LLMs) and Reinforcement Learning (RL)
Österreich - Large Language Models (LLMs) and Reinforcement Learning (RL)
Schweiz - Large Language Models (LLMs) and Reinforcement Learning (RL)
Deutschland - Large Language Models (LLMs) and Reinforcement Learning (RL)
Czech Republic - Large Language Models (LLMs) and Reinforcement Learning (RL)
Denmark - Large Language Models (LLMs) and Reinforcement Learning (RL)
Estonia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Finland - Large Language Models (LLMs) and Reinforcement Learning (RL)
Greece - Large Language Models (LLMs) and Reinforcement Learning (RL)
Magyarország - Large Language Models (LLMs) and Reinforcement Learning (RL)
Ireland - Large Language Models (LLMs) and Reinforcement Learning (RL)
Luxembourg - Large Language Models (LLMs) and Reinforcement Learning (RL)
Latvia - Large Language Models (LLMs) and Reinforcement Learning (RL)
España - Large Language Models (LLMs) and Reinforcement Learning (RL)
Italia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Lithuania - Large Language Models (LLMs) and Reinforcement Learning (RL)
Nederland - Large Language Models (LLMs) and Reinforcement Learning (RL)
Norway - Large Language Models (LLMs) and Reinforcement Learning (RL)
Portugal - Large Language Models (LLMs) and Reinforcement Learning (RL)
România - Large Language Models (LLMs) and Reinforcement Learning (RL)
Sverige - Large Language Models (LLMs) and Reinforcement Learning (RL)
Türkiye - Large Language Models (LLMs) and Reinforcement Learning (RL)
Malta - Large Language Models (LLMs) and Reinforcement Learning (RL)
Belgique - Large Language Models (LLMs) and Reinforcement Learning (RL)
France - Large Language Models (LLMs) and Reinforcement Learning (RL)
日本 - Large Language Models (LLMs) and Reinforcement Learning (RL)
Australia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Malaysia - Large Language Models (LLMs) and Reinforcement Learning (RL)
New Zealand - Large Language Models (LLMs) and Reinforcement Learning (RL)
Philippines - Large Language Models (LLMs) and Reinforcement Learning (RL)
Singapore - Large Language Models (LLMs) and Reinforcement Learning (RL)
Thailand - Large Language Models (LLMs) and Reinforcement Learning (RL)
Vietnam - Large Language Models (LLMs) and Reinforcement Learning (RL)
India - Large Language Models (LLMs) and Reinforcement Learning (RL)
Argentina - Large Language Models (LLMs) and Reinforcement Learning (RL)
Chile - Large Language Models (LLMs) and Reinforcement Learning (RL)
Costa Rica - Large Language Models (LLMs) and Reinforcement Learning (RL)
Ecuador - Large Language Models (LLMs) and Reinforcement Learning (RL)
Guatemala - Large Language Models (LLMs) and Reinforcement Learning (RL)
Colombia - Large Language Models (LLMs) and Reinforcement Learning (RL)
México - Large Language Models (LLMs) and Reinforcement Learning (RL)
Panama - Large Language Models (LLMs) and Reinforcement Learning (RL)
Peru - Large Language Models (LLMs) and Reinforcement Learning (RL)
Uruguay - Large Language Models (LLMs) and Reinforcement Learning (RL)
Venezuela - Large Language Models (LLMs) and Reinforcement Learning (RL)
Polska - Large Language Models (LLMs) and Reinforcement Learning (RL)
United Kingdom - Large Language Models (LLMs) and Reinforcement Learning (RL)
South Korea - Large Language Models (LLMs) and Reinforcement Learning (RL)
Pakistan - Large Language Models (LLMs) and Reinforcement Learning (RL)
Sri Lanka - Large Language Models (LLMs) and Reinforcement Learning (RL)
Bulgaria - Large Language Models (LLMs) and Reinforcement Learning (RL)
Bolivia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Indonesia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Kazakhstan - Large Language Models (LLMs) and Reinforcement Learning (RL)
Moldova - Large Language Models (LLMs) and Reinforcement Learning (RL)
Morocco - Large Language Models (LLMs) and Reinforcement Learning (RL)
Tunisia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Kuwait - Large Language Models (LLMs) and Reinforcement Learning (RL)
Oman - Large Language Models (LLMs) and Reinforcement Learning (RL)
Slovakia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Kenya - Large Language Models (LLMs) and Reinforcement Learning (RL)
Nigeria - Large Language Models (LLMs) and Reinforcement Learning (RL)
Botswana - Large Language Models (LLMs) and Reinforcement Learning (RL)
Slovenia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Croatia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Serbia - Large Language Models (LLMs) and Reinforcement Learning (RL)
Bhutan - Large Language Models (LLMs) and Reinforcement Learning (RL)
Nepal - Large Language Models (LLMs) and Reinforcement Learning (RL)
Uzbekistan - Large Language Models (LLMs) and Reinforcement Learning (RL)