ConTodo
Finanzas / Plataforma

Costos de IA y archivos + modelo de créditos diarios

¿Cuánto cuesta la IA, subir archivos y todo? + cómo limitarlo

1. La buena noticia: la IA cuesta CENTAVOS

Gemini Flash (capa de pago, referencial jun-2026): ~US$ 0.10 por 1M tokens de entrada y ~US$ 0.40 por 1M de salida.

Una consulta típica de Flai usa ~1,500 tokens de entrada + ~300 de salida:

ConceptoCálculoCosto
1 consulta1,500×$0.10/1M + 300×$0.40/1M≈ US$ 0.0003 (3 décimas de céntimo)
1,000 consultas≈ US$ 0.27
10,000 consultas/mesUS$ 2.7
100,000 consultas/mes≈ US$ 27

En capa gratuita es US$ 0, pero con límites de velocidad (lo que vimos: 503/429 bajo demanda). Por eso conviene una key con cuota.

2. Subir archivos (fotos, PDF, CSV) — casi gratis

  • Se guardan en MinIO en tu VPS → usa el disco que ya pagas (100 GB) y tu ancho de banda (8 TB/mes). Costo extra ≈ US$ 0.
  • Una foto de entrega pesa ~0.2–1 MB → 10,000 fotos ≈ 2–10 GB (cabe de sobra).
  • Si algún día migras a S3: ~US$ 0.023 por GB/mes + egreso. Para 50 GB ≈ US$ 1.2/mes.

3. Costo real por empresa (tenant) al mes

ÍtemUso piloto (OZAS)Costo
IA (Flai)~50–200 consultas/díaUS$ 0.4 – 2
Archivosfotos de reparto~US$ 0 (VPS)
Infra (compartida en VPS)fracción del VPS~US$ 1–2
Total por empresa≈ US$ 2–4 / mes

Tu precio (US$ 40/mes + US$ 5–6/usuario) deja margen enorme. La IA no es el costo que preocupa; el límite es para evitar abuso y empaquetar/vender (add-ons).

4. Modelo de créditos diarios (recomendado) — ya implementado

Límite de consultas de IA por día y por empresa (en Redis), configurable por plan:

PlanCréditos IA/díaAlmacenamientoUsuarios
Piloto1005 GB2
Estándar50020 GBincluidos + add-on
Pro2,000100 GBmás
Add-on IA+paquete (ej. +1,000/mes)
  • Cómo funciona: cada consulta a Flai descuenta 1 crédito del día del tenant (IA_DAILY_LIMIT, default 500). Al pasarse → "alcanzaste tu límite de hoy" (HTTP 429). Se renueva cada 24h. ✅ implementado en /api/v1/flai.
  • Las acciones confirmadas (crear venta, marcar entrega) NO consumen crédito — solo las consultas.
  • Subidas: tope de tamaño (10 MB) + cuota de almacenamiento por plan (a cablear).
  • Visible: el consumo por empresa/usuario se ve en el panel admin (ver [[25-flai-consumo-whatsapp]]).

5. Recomendación

  1. Usa una key de Gemini con cuota (o Vercel AI Gateway) — el costo es de dólares al mes, no preocupa.
  2. Deja los créditos diarios por plan activos (ya están) para control y para vender add-ons de IA.
  3. Archivos: en el VPS hoy (gratis); a S3 cuando escales.

Relacionado: [[25-flai-consumo-whatsapp]] (medición por tenant) · [[26-despliegue-costos-admin]] · [[22-ozas-implementacion]] (pricing).