Finanzas / Plataforma
Costos de IA y archivos + modelo de créditos diarios
¿Cuánto cuesta la IA, subir archivos y todo? + cómo limitarlo
1. La buena noticia: la IA cuesta CENTAVOS
Gemini Flash (capa de pago, referencial jun-2026): ~US$ 0.10 por 1M tokens de entrada y ~US$ 0.40 por 1M de salida.
Una consulta típica de Flai usa ~1,500 tokens de entrada + ~300 de salida:
| Concepto | Cálculo | Costo |
|---|---|---|
| 1 consulta | 1,500×$0.10/1M + 300×$0.40/1M | ≈ US$ 0.0003 (3 décimas de céntimo) |
| 1,000 consultas | ≈ US$ 0.27 | |
| 10,000 consultas/mes | ≈ US$ 2.7 | |
| 100,000 consultas/mes | ≈ US$ 27 |
En capa gratuita es US$ 0, pero con límites de velocidad (lo que vimos: 503/429 bajo demanda). Por eso conviene una key con cuota.
2. Subir archivos (fotos, PDF, CSV) — casi gratis
- Se guardan en MinIO en tu VPS → usa el disco que ya pagas (100 GB) y tu ancho de banda (8 TB/mes). Costo extra ≈ US$ 0.
- Una foto de entrega pesa ~0.2–1 MB → 10,000 fotos ≈ 2–10 GB (cabe de sobra).
- Si algún día migras a S3: ~US$ 0.023 por GB/mes + egreso. Para 50 GB ≈ US$ 1.2/mes.
3. Costo real por empresa (tenant) al mes
| Ítem | Uso piloto (OZAS) | Costo |
|---|---|---|
| IA (Flai) | ~50–200 consultas/día | US$ 0.4 – 2 |
| Archivos | fotos de reparto | ~US$ 0 (VPS) |
| Infra (compartida en VPS) | fracción del VPS | ~US$ 1–2 |
| Total por empresa | ≈ US$ 2–4 / mes |
Tu precio (US$ 40/mes + US$ 5–6/usuario) deja margen enorme. La IA no es el costo que preocupa; el límite es para evitar abuso y empaquetar/vender (add-ons).
4. Modelo de créditos diarios (recomendado) — ya implementado
Límite de consultas de IA por día y por empresa (en Redis), configurable por plan:
| Plan | Créditos IA/día | Almacenamiento | Usuarios |
|---|---|---|---|
| Piloto | 100 | 5 GB | 2 |
| Estándar | 500 | 20 GB | incluidos + add-on |
| Pro | 2,000 | 100 GB | más |
| Add-on IA | +paquete (ej. +1,000/mes) | — | — |
- Cómo funciona: cada consulta a Flai descuenta 1 crédito del día del tenant (
IA_DAILY_LIMIT, default 500). Al pasarse → "alcanzaste tu límite de hoy" (HTTP 429). Se renueva cada 24h. ✅ implementado en/api/v1/flai. - Las acciones confirmadas (crear venta, marcar entrega) NO consumen crédito — solo las consultas.
- Subidas: tope de tamaño (10 MB) + cuota de almacenamiento por plan (a cablear).
- Visible: el consumo por empresa/usuario se ve en el panel admin (ver [[25-flai-consumo-whatsapp]]).
5. Recomendación
- Usa una key de Gemini con cuota (o Vercel AI Gateway) — el costo es de dólares al mes, no preocupa.
- Deja los créditos diarios por plan activos (ya están) para control y para vender add-ons de IA.
- Archivos: en el VPS hoy (gratis); a S3 cuando escales.
Relacionado: [[25-flai-consumo-whatsapp]] (medición por tenant) · [[26-despliegue-costos-admin]] · [[22-ozas-implementacion]] (pricing).