Tecnologías clave de ChatGPT: Reinforcement Learning from Human Feedback

Alejandro Vaca· 4 abr 2023· 30min

Charla sobre las técnicas de Reinforcement Learning from Human Feedback (RLHF), qué podemos aprender de ellas y qué aplicaciones prácticas en la industria pueden venir de la mano de esta tecnología.

¿Qué vas a aprender al asistir a esta charla?

  • Cómo afecta RLHF a la IA generativa y qué oportunidades surgen en la industria a raíz de RLHF.

Alejandro Vaca

Ganador del Cajamar UniversityHack 2020; galardonado en 2021 con el Premio a Mejor Data Scientist del Hackaton de SpainAI, al obtener 2 primeros puestos (análisis preescriptivo con series temporales & Computer Vision) y un tercero (NLP). Desarrollador principal de RigoBERTa, un modelo de lenguaje del Estado del Arte en español. Ganador del primer premio del Hackaton SomosNLP 2022 por BioMedIA, proyecto que posteriormente fue presentado en el NAACL 2022, obteniendo el Premio a la Mejor Presentación de Póster.