Charla sobre ChatGPT: lecturas y enlaces adicionales

Esta entrada de blog contiene enlaces a documentos y bibliografía de la charla «ChatGPT, Teoría y práctica»

La bibliografía sobre transformers y modelos de lenguaje basados en transformers es a fecha de hoy muy extensa. Os recomendamos:

  • Las entrada de blog de Stephen Wolfram sobre ChatGPT, que ha reunido también en forma de libro.
  • El artículo donde se propone usar solamente Atención (y propagación): «Attention Is All You Need«, de Vaswani et al. En particular ahí se detalla la cadena de operaciones que ejecuta un paso de un transformer para ir de una capa a la siguiente.