← Blog / diagnostico
diagnostico

ROI de un diagnóstico de IA: cómo medirlo sin engañarse

El ROI de un proyecto IA se infla o se minimiza según la metodología. Qué medir, qué contabilizar, cómo evitar 'savings' ficticios — y cómo presentar el número a finanzas sin que lo destruyan en comité.

·11 min de lectura·

Por qué la conversación de ROI se tuerce

En IA pasa algo parecido a lo que pasó con cloud hace una década: cada vendor promete ROI 10x, cada cliente quiere creer, y cada CFO después pregunta "¿dónde está el cash?". La respuesta honesta requiere método; sin método el ROI es narrativa.

Este artículo aterriza la metodología que usamos en Fanfusion Hub para calcular ROI de proyectos IA, con las trampas que vimos en el camino. Sirve para diagnósticos iniciales, para pilotos de 90 días y para business cases de scale.

El esqueleto del cálculo

ROI básico: (Beneficio - Costo) / Costo. Suena simple. Lo complicado es qué metés en cada variable.

Costos reales (todos)

  • Licencia de plataforma: el número de la cotización. Fácil.
  • Tokens / uso de modelos: variable según volumen. Para pymes típicamente USD 200-2.000/mes; empresas grandes 5-50k/mes. Hay que estimar con baseline conservador y ajustar mensual.
  • Integración inicial: horas del equipo técnico. Si son 4 ingenieros × 6 semanas × tarifa interna, son USD 30-60k en pyme, más en empresa grande.
  • Training y enablement: horas del equipo operativo aprendiendo el sistema. Suele subestimarse.
  • Ajustes y iteración: no termina después de go-live. Presupuesto 20-30% del setup inicial para los primeros 6 meses.
  • Soporte vendor / partner: SLA, horas de consultoría. A veces incluido, a veces por separado.
  • Costos de oportunidad del equipo: mientras trabajan en esto no hacen otra cosa. Real pero difícil de contabilizar.

Error clásico: mostrar solo la licencia. Costo real es licencia × 2-4.

Beneficios verdaderos

Hay tres familias de beneficio; cada una tiene método distinto para contabilizar.

Familia 1: ahorro directo Casos donde el agente IA hace lo que hacía un humano, y el humano se elimina o reasigna.

  • Fórmula: (horas humanas ahorradas × costo/hora).
  • Trampa: si el humano "reasignado" no genera valor en la nueva posición, el ahorro es ficticio. Necesita comprobación.
  • Honestidad: contabilizar solo reducción real de headcount o horas facturables reasignadas a producción.

Familia 2: capacidad adicional El agente IA permite atender más volumen sin crecer el equipo.

  • Fórmula: (volumen adicional × valor unitario - costo marginal adicional).
  • Trampa: asumir que todo el volumen adicional se capturará. Hay que descontar por tasa de conversión real.
  • Honestidad: medir incremento de ingresos atribuible con metodología A/B o pre/post cuidadosa.

Familia 3: mejora de KPIs con impacto indirecto Mejor CSAT, menor churn, mayor conversión.

  • Fórmula: compleja; requiere atribución estadística.
  • Trampa: atribuir 100% de la mejora a IA cuando hubo otras iniciativas simultáneas.
  • Honestidad: descomponer la mejora entre factores; solo atribuir la parte razonablemente causada por IA.

La tabla que finanzas quiere ver

Cualquier business case tiene que responder estas preguntas en una tabla simple:

ItemAño 1Año 2Año 3
Costos
Licencia plataformaXXX
Uso de modelos (tokens)YY*1.5Y*2
Integración inicialZ00
Iteración y mejorasZ/3Z/4Z/5
Training y enablementWW/3W/5
Total costo
Beneficios
Ahorro directo (headcount)AA*1.2A*1.3
Capacidad adicional (revenue)BB*1.5B*2
Mejora KPIs (atribución)CC*1.3C*1.4
Total beneficio
Neto
ROI %
Payback period (meses)

Esta tabla, con números específicos a tu caso y con supuestos documentados, sobrevive comité. Un slide con "+40% productividad" no.

Los supuestos son el alma

Cada número en la tabla viene de un supuesto. Documentalos:

  • "Bajamos MTTR de 4h a 1h30". Supuesto: mejora sostenida a 90 días sin regresión. Revisar con data real.
  • "Contenemos 55% de tickets sin humano". Supuesto: precisión del modelo mantenida. Ver tasa de reapertura.
  • "Ahorramos 2 FTEs de soporte". Supuesto: esas 2 personas se reasignan a función productiva o se dan de baja por atrición natural.
  • "Incrementamos conversión de leads 15%". Supuesto: el incremento es causado por IA, medido en A/B o pre/post con control de variables.

Supuestos escritos + revisión trimestral = credibilidad. Supuestos ocultos + narrativa "va a ir genial" = proyecto destruido por finanzas en 6 meses.

Tiempo a valor: el KPI escondido

ROI total de 3 años importa, pero CFO vive en cash flow. Preguntas relevantes:

  • ¿Cuándo el proyecto es cash-positive mensual? (Beneficio > costo de operar.)
  • ¿Cuál es el payback period? (Cuántos meses hasta recuperar inversión acumulada.)
  • ¿Cuál es el break-even de adopción? (Qué porcentaje de tráfico/volumen necesitás para cubrir costos.)

Un ROI de 5x a 3 años con payback de 14 meses es muy distinto a uno con payback de 28 meses. El segundo compite en comité contra otras inversiones de payback más corto.

Los "ahorros" que no son ahorros

Categorías frecuentes que vemos infladas:

Ahorro 1: "Tiempo del CEO"

"El CEO va a ganar 2 horas semanales al no tener que revisar reportes manuales". OK, si el CEO en esas 2 horas hace algo con valor incremental medible. Si solo no hace nada distinto, el ahorro es ficticio.

Ahorro 2: "Mejor experiencia"

"CSAT sube 5 puntos". Sí, pero ¿se traduce en retención, NPS, o venta? Si no, el beneficio es performative, no financiero.

Ahorro 3: "Menos errores"

"Reducimos 30% los errores operativos". Hay que contabilizar solo los errores que costaban dinero (re-envíos, reembolsos, tickets re-abiertos). Errores sin costo tangible son ruido.

Ahorro 4: "Velocidad sin monetizar"

"Respondemos 10x más rápido". Si la respuesta más rápida no mueve ningún otro KPI (conversión, retención, contención), no hay ROI — hay percepción de valor.

Ahorro 5: "Valor estratégico"

"Nos posiciona como innovadores". Defendible en algunos contextos (branding, talent attraction), pero no es ROI financiero. Separalo en otra categoría.

Estructura de business case que funciona

Formato que hemos visto pasar comité:

Slide 1: Problema operativo

Dato crudo con impacto en el negocio. "6 horas tiempo medio de primera respuesta, 30% de tickets abandonados, NPS 22 en canal WhatsApp."

Slide 2: Solución propuesta

Qué se construye, con plataforma, alcance. Incluye arquitectura de alto nivel.

Slide 3: Baseline y target

Comparación visual. "Hoy → Target a 6 meses → Target a 18 meses".

Slide 4: Inversión requerida

Costo total Año 1, desglosado. Evitar "cuota mensual de USD X" sin contexto.

Slide 5: Beneficios esperados

Tres familias con números específicos y supuestos.

Slide 6: ROI y payback

La tabla. Escenarios base/conservador/optimista.

Slide 7: Riesgos y mitigaciones

Honestidad. "Si el modelo no alcanza concordancia X, postergamos scale. Kill-switch en semana 10."

Slide 8: Plan de implementación

90 días. Milestones. Decisión points.

Slide 9: Pedido al comité

Aprobación específica: "Aprobar USD X para piloto 90 días. Post-piloto, re-aprobar para scale basado en data."

La contabilidad del piloto

Un piloto no debería cargar su propio ROI aislado; debería tratarse como inversión para validar hipótesis. Aun así, conviene contabilizar:

  • Costos del piloto (reales).
  • Mejoras observadas en período piloto (con cuidado por corto tiempo).
  • Hallazgos que no se podían saber de antemano.
  • Evidencia para decisión go/no-go en scale.

Error común: el piloto "muestra ROI negativo" porque el período corto no permite amortizar setup. Hay que interpretar el piloto como experimento, no como operación a escala.

Casos reales (anonimizados)

Pyme de ecommerce, 40 empleados: Inversión total 12 meses USD 85k (plataforma + integración + training). Beneficios medidos: ahorro de 1 FTE reasignado (USD 60k), +8% conversión en chat web (USD 180k revenue incremental sobre baseline de USD 2,2M). ROI = (240k - 85k) / 85k = 182%. Payback = 5,5 meses.

Banco regional, 800 empleados: Inversión total 12 meses USD 680k (plataforma enterprise + integración profunda + equipo dedicado). Beneficios medidos: reducción del 40% en escalaciones a contact center (ahorro de USD 420k en horas humanas reales reasignadas), mejora del 22% en contención primer contacto (ahorro USD 280k). ROI = (700k - 680k) / 680k = 3%. Payback = 12 meses. Interpretación: el valor real está en año 2 donde costos estabilizan y beneficios siguen creciendo. El board aprobó scale basado en trayectoria, no año 1 solo.

Clínica multisite, 120 empleados: Inversión total 12 meses USD 140k. Beneficios medidos: reducción del 35% en no-shows por recordatorios proactivos (USD 320k revenue recuperado), mejora de NPS de 52 a 68. ROI = (320k - 140k) / 140k = 129%. Payback = 7 meses.

Estos números son realistas, no hero stories. Proyectos que salen bien tienen ROI 100-300% año 1; proyectos ambiciosos enterprise frecuentemente son break-even año 1 con rampa fuerte año 2.

Errores comunes al calcular ROI de IA

Error 1: contar ahorros que no se materializan. Decir "ahorramos X horas" si nadie redujo headcount ni reasignó es ficción. Los ahorros deben traducirse en outcomes reales (más ventas con mismo team, menos headcount, mejor servicio con mismo costo).

Error 2: ignorar costos completos. El ROI debe considerar: plataforma + tokens + integración + horas de equipo cliente + training + opportunity cost. Omitir componentes infla ROI artificialmente.

Error 3: no comparar contra baseline justo. "Nuestro squad resuelve 60% de tickets" suena bien. Versus ¿qué? Si la alternativa humana resuelve 95% en 2 días, el squad con 60% en 30 segundos puede ser peor, o mejor, según tu necesidad.

Error 4: comparar período atípico. Comparar squad vs baseline humana cuando la baseline era un mes extraordinario (Black Friday, crisis) distorsiona. Usar períodos comparables.

Error 5: ROI único para toda la iniciativa. No todos los componentes rinden igual. Desagregar por squad, por KPI, por período. Algunos componentes pueden estar dando pérdida aun cuando el ROI agregado es positivo.

Error 6: confundir output con outcome. "El squad genera 1000 respuestas/día" es output. "1000 respuestas resolvieron temas que antes requerían humano" es outcome. El ROI se construye sobre outcomes.

Modelos de ROI por industria

SaaS B2B. ROI primario: aceleración de pipeline velocity (del primer contacto al cierre). Revenue attribution complejo pero medible con cohort analysis. ROI típico: 2-4x en año 1, 5-10x en año 2.

E-commerce. ROI primario: conversión y AOV (average order value). Agentes que responden al instante suelen subir conversion 1.5-3x. ROI típico: 4-8x en año 1.

Servicios profesionales. ROI primario: productividad del equipo. Más clientes atendidos con mismo headcount. ROI típico: 2-3x en año 1, escalando con cantidad de clientes.

Banca / financieras. ROI primario: reducción de fraude + compliance automatizado. ROI difícil de calcular porque evita pérdidas, no genera revenue. Empresas serias lo miden con counterfactuals. ROI típico: 3-6x pero con incertidumbre.

Gobierno / sector público. ROI primario: eficiencia operativa + satisfacción ciudadana. No hay revenue tradicional; se mide con cost-per-service y NPS. ROI típico: 1.5-3x en año 1, con multipliers sociales no capturables en dinero.

Cadencia de medición

Medir ROI no es one-time al final. Cadencia:

  • Mes 1: baseline confirmada, implementación. No mide ROI aún.
  • Mes 2: primeras señales. Directional, no conclusive.
  • Mes 3: ROI parcial calculable. Margen de incertidumbre alto.
  • Mes 6: ROI estable. Decisiones de expansión basadas en esto.
  • Año 1: ROI maduro. Revisiones trimestrales en adelante.
  • Año 2+: Baseline pasa a ser "con squad". ROI se redefine contra expansión de scope.

Preguntas frecuentes

¿Qué ROI es "bueno" para un proyecto IA?

Depende de alternativa. Versus hacer nada, cualquier ROI positivo razonable es bueno. Versus otra inversión, hay que comparar rangos. 100-200% año 1 con payback < 12 meses es competitivo.

¿Y si el ROI sale negativo?

Decisión honesta. A veces el problema es el scope (muy ambicioso para presupuesto), el momento (empresa no lista), o la tecnología (caso no encaja con IA). Post-mortem detalla qué falló. A veces el aprendizaje vale la inversión aun sin ROI operativo.

¿Los costos de tokens explotan con escala?

Pueden hacerlo si no hay optimización. Técnicas para controlar: routing de consultas simples a modelos más baratos, cache de respuestas frecuentes, prompt engineering eficiente. Proyecto maduro tiene costo por interacción en tendencia descendente.

¿Cómo pruebo atribución causal?

A/B si hay tráfico suficiente. Pre/post con control de estacionalidad. Diferencia-en-diferencias si hay segmentos comparables. Nunca claim causal basado solo en correlación temporal.

¿El ROI incluye consideraciones de riesgo?

Debería. Escenario conservador con supuestos pesimistas muestra ROI piso. Si el piso es negativo, el proyecto depende de ejecución perfecta — mal.

¿Cómo comparo vendors con ROI distintos?

Normalizar supuestos. Pedí a cada vendor que use tu baseline y tus targets, no los de ellos. Compará modelo de costos totales (no solo licencia).

¿Cada cuánto revisar el ROI post go-live?

Mensual en primeros 6 meses (alta variabilidad), trimestral después. Al año, review formal con actualización del business case para decidir continuación / expansión.


Si vas a presentar un proyecto IA a comité y querés llegar con números que sobrevivan escrutinio, empezá con un diagnóstico de 10 minutos — construimos el business case con metodología que finanzas acepta. Más contexto: Cómo preparar un diagnóstico, Señales de que estás listo, Del diagnóstico al piloto en 90 días, plataforma en /platform.

CompartirXLinkedIn

Convertí la lectura en un piloto.

Si esta nota mapeó un problema que estás resolviendo, arrancamos con un diagnóstico de 10 minutos. Convertimos el análisis en un plan piloto firmado.