Un póster educativo en tonos pastel que explica el proceso de entrenamiento de un modelo de lenguaje grande en 8 paneles con mascotas adorables, ideal para explicaciones en redes sociales o educación sobre IA para principiantes.
{"type":"póster infográfico educativo adorable","topic":"El proceso de entrenamiento de los modelos de lenguaje grandes","subtitle":"¡Aprende de datos masivos y conviértete en un asistente que sabe charlar de todo!","style":{"overall":"póster explicativo adorable, infografía de aula en tonos pastel, paneles redondeados, fondo crema suave, estética de dibujos hechos a mano, ilustración vectorial limpia, tono educativo cálido y amigable","palette":["crema","lavanda","azul cielo","verde menta","amarillo-naranja","rosa","marrón suave"],"rendering":"ilustración plana de alta calidad con sombreado sutil, tipografía china nítida, detalles tipo pegatina, estrellas pequeñas, corazones, flechas y bocadillos de diálogo"},"layout":{"format":"póster horizontal","grid":{"rows":2,"columns":4,"count":8},"sections":[{"title":"1. Recopilación de datos","position":"arriba a la izquierda","count":1,"labels":["Web","Noticias","Conversaciones"]},{"title":"2. Preprocesamiento de datos","position":"fila superior, segunda columna","count":1,"labels":["¡¡El clima está genial hoy!!","Hoy|clima|está|genial!!"]},{"title":"3. Preentrenamiento","position":"fila superior, tercera columna","count":1,"labels":["Clima","Muy bien","Genial","?","......"]},{"title":"4. Ajuste fino supervisado (SFT)","position":"arriba a la derecha","count":1,"labels":["P: ¿Por qué brilla el sol?","R: Porque...","¡Buena respuesta!"]},{"title":"5. Entrenamiento del modelo de recompensa (RM)","position":"abajo a la izquierda","count":1,"labels":["¡La respuesta A es mejor!","La respuesta B es regular"]},{"title":"6. Aprendizaje por refuerzo (RLHF)","position":"fila inferior, segunda columna","count":1,"labels":["Recompensa +1","Castigo -1"]},{"title":"7. Evaluación y pruebas","position":"fila inferior, tercera columna","count":1,"labels":["Conocimiento","Razonamiento","Seguridad","Estabilidad"]},{"title":"8. Despliegue y aplicación","position":"abajo a la derecha","count":1,"labels":["Chat","Programación","Escritura"]}],"topDecorations":{"count":4,"items":["pequeña chispa arriba a la izquierda","trazos de confeti rosa alrededor del título","mascota blanca adorable arriba a la derecha sosteniendo una varita de estrella","bocadillo de diálogo que dice ¡Vamos!"]},"bottomDecorations":{"count":4,"items":["pequeña mascota blanca con pajarita abajo a la izquierda","franja de resumen con 7 cajas pequeñas redondeadas y flechas","frase de cierre centrada en la parte inferior","nota adhesiva abajo a la derecha con texto alentador y un corazón"]}},"characters":{"main mascots":{"count":4,"types":["mascota blanca rechoncha tipo oso con mejillas rosadas","pequeño robot redondo con pantalla facial oscura y antena verde","chica profesora humana con coleta","personaje blanco esponjoso con lupa"]},"recurring_robot_design":"robot pequeño y adorable, cuerpo redondeado, carcasa verde pálido y crema, pantalla facial azul marino con ojos brillantes, extremidades diminutas"},"sectionDetails":[{"title":"1. Recopilación de datos","panelColor":"lavanda","scene":"una mascota blanca con gorra morada usa una computadora portátil mientras está sentada junto a una pila de libros coloridos; etiquetas redondeadas flotantes representan fuentes de internet","caption":"¡Cuantos más datos, más rico el conocimiento!"},{"title":"2. Preprocesamiento de datos","panelColor":"azul cielo","scene":"la mascota con gorra azul barre restos de papel dispersos hacia un cubo; una oración desordenada se transforma en texto limpio segmentado con una flecha","caption":"¡Convirtiendo el desorden en algo ordenado~"},{"title":"3. Preentrenamiento","panelColor":"verde menta","scene":"el robot lee un libro verde abierto mientras los bocadillos de diálogo a su alrededor muestran tokens y respuestas simples, sugiriendo el aprendizaje del lenguaje","caption":"¡Como un niño aprendiendo a hablar!"},{"title":"4. Ajuste fino supervisado (SFT)","panelColor":"amarillo dorado","scene":"una profesora señala una tarjeta de preguntas y respuestas mientras una mascota adorable escucha; énfasis en pares de preguntas y respuestas de alta calidad etiquetados por humanos","caption":"¡Aprendiendo con un profesor, las respuestas son más fiables!"},{"title":"5. Entrenamiento del modelo de recompensa (RM)","panelColor":"rosa","scene":"el robot se encuentra entre una marca de verificación verde y una X roja, comparando dos opciones de respuesta para aprender cuál es mejor","caption":"¡Aprendiendo a \"elegir la mejor respuesta\"!"},{"title":"6. Aprendizaje por refuerzo (RLHF)","panelColor":"azul lavanda","scene":"el robot sostiene herramientas mientras un tablero de recompensas muestra retroalimentación positiva y negativa con flechas","caption":"¡Fomentando lo bueno, corrigiendo lo malo!"},{"title":"7. Evaluación y pruebas","panelColor":"azul","scene":"un personaje examinador blanco y esponjoso sostiene una lupa junto a una lista de verificación con cuatro marcas verdes","caption":"¡Chequeo completo para asegurar la calidad!"},{"title":"8. Despliegue y aplicación","panelColor":"rojo-rosa suave","scene":"el robot aparece rodeado de iconos de aplicaciones para chat, escritura, programación y documentos, mostrando el despliegue en el mundo real","caption":"¡Listo para trabajar, acompañándote a chatear y escribir!"}],"bottomSummary":{"title":"Resumen:","count":7,"steps":["Recopilación de datos: sentando las bases","Preprocesamiento: organizando los datos","Preentrenamiento: adquiriendo conocimiento","Ajuste fino: aprendiendo a responder","Modelo de recompensa: aprendiendo a evaluar","Aprendizaje por refuerzo: alineación con preferencias humanas","Evaluación y pruebas: control de calidad"],"closingText":""¡Este es el camino de crecimiento del modelo de lenguaje, desde "no saber nada" hasta convertirse en un "superestudiante"! ٩(๑^o^๑)۶""},"language":"Chino simplificado","quality":"infografía pulida lista para redes sociales, espaciado equilibrado, texto en chino legible, encantadora y altamente compartible"}