Cambios implementados: Streaming habilitado para OpenAI: Ahora usa stream=True en las llamadas al chat Procesamiento en tiempo real: El servidor recibe chunks de la respuesta y los concatena Mejor experiencia: Las respuestas largas se generan más rápido (el servidor empieza a recibir antes) Cómo funciona:
156 KiB
156 KiB