✅ Backend v1.2.5

Cambios implementados: Streaming habilitado para OpenAI: Ahora usa stream=True en las llamadas al chat Procesamiento en tiempo real: El servidor recibe chunks de la respuesta y los concatena Mejor experiencia: Las respuestas largas se generan más rápido (el servidor empieza a recibir antes) Cómo funciona:
2025-12-04 14:25:16 -03:00
parent 65a74cf754
commit 56decba945
1 changed files with 13 additions and 4 deletions
--- a/backend/app/main.py
+++ b/backend/app/main.py
@@ -4,6 +4,7 @@
 from fastapi import FastAPI, File, UploadFile, Form, Depends, HTTPException, status
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.security import HTTPBearer, HTTPAuthorizationCredentials
+from fastapi.responses import StreamingResponse
 from sqlalchemy.orm import Session, joinedload
 from sqlalchemy import func, case, or_
 from typing import List, Optional
@@ -20,6 +21,7 @@ import shutil
 from datetime import datetime, timedelta
 import sys
 import requests
+import json

 # Función para enviar notificaciones al webhook
 def send_answer_notification(answer, question, mechanic, db):
@@ -276,7 +278,7 @@ def extract_pdf_text_smart(pdf_content: bytes, max_chars: int = None) -> dict:
        }


-BACKEND_VERSION = "1.2.4"
+BACKEND_VERSION = "1.2.5"
 app = FastAPI(title="Checklist Inteligente API", version=BACKEND_VERSION)

 # S3/MinIO configuration
@@ -3621,14 +3623,21 @@ Longitud de respuesta: {response_length}
                api_key=ai_config.api_key
            )
            
-            response = client.chat.completions.create(
+            # Usar streaming para respuestas más fluidas
+            stream = client.chat.completions.create(
                model=ai_config.model_name or "gpt-4",
                messages=messages,
                max_tokens=max_tokens,
-                temperature=0.7
+                temperature=0.7,
+                stream=True
            )
            
-            ai_response = response.choices[0].message.content
+            # Recolectar respuesta completa del stream
+            ai_response = ""
+            for chunk in stream:
+                if chunk.choices[0].delta.content is not None:
+                    ai_response += chunk.choices[0].delta.content
+            
            confidence = 0.85  # OpenAI no devuelve confidence directo
            
        elif ai_config.provider == 'anthropic':