¿Cómo estimar tu consumo de tokens con IA en Athento? – Athento

El consumo de tokens que realices dependerá de múltiples factores:

El tipo de tarea de IA que uses (extracción de datos, análisis de imágenes, conversación con documentos o expedientes, etc.).
El servicio que elijas (por ejemplo, OpenAI o Gemini).

Cómo se cuentan los tokens

En las integraciones de Athento con modelos de lenguaje (LLM) como OpenAI o Gemini, el consumo total de tokens por operación es la suma de:

Tokens de entrada (prompt tokens): todo lo que envías al modelo: texto del documento o fragmentos relevantes (en RAG, embeddings, etc.), instrucciones, contexto, e incluso el historial de conversación si aplica.
Tokens de salida (completion tokens): todo lo que el modelo devuelve como respuesta: texto generado (resumen, clasificación, datos extraídos, etc.), estructuras como JSON o listas.

💡 Regla general para texto: 1 token ≈ 4 caracteres.
Recuerda que Athento no envía solo el texto del documento: también añade instrucciones y, según la funcionalidad, información adicional como el contexto de conversación.

Herramientas útiles

Contador de tokens de OpenAI para hacer estimaciones previas.

Factores que afectan el consumo

Tamaño del documento o imagen procesada → más contenido = más tokens.
Tipo de operación IA → RAG, extracción, clasificación, análisis de imagen, etc.
Profundidad del contexto → conversaciones largas o con histórico incluido aumentan los tokens.
Número de documentos procesados al mismo tiempo.

Buenas prácticas para optimizar el consumo

Usa tu propia cuenta del servicio IA para hacer pruebas y seguimiento detallado de consumos en los logs.
Envía texto extraído en lugar de imágenes/páginas completas siempre que sea posible.
Si debes enviar páginas, limita el envío solo a las que contengan información relevante para la operación.
Trabaja con TopN pequeños en las bases de conocimiento

Ejemplos orientativos

Caso	Tipo de envío	Tamaño aprox.	Contexto añadido	Tokens aprox.
Factura	Páginas completas	1 pág.	Contexto por campo para 16 campos	≈ 40.000
Cámara de comercio (CO)	Texto extraído	18.500 caracteres (8 págs.)	≈ 1.000 tokens de contexto añadido para la extracción de 10 campos	≈ 6.500
Contrato mercantil	Texto extraído	65.000 caracteres (57 págs.)	≈ 1.500 tokens de contexto añadido para la extracción de 10 campos	≈ 20.000
RUC Ecuador	Texto extraído	3.000 caracteres (2 págs.)	≈ 2.000 tokens de contexto añadido para la extracción de 30 campos	≈ 4.000
Imagen 1000×732px, 215KB	Imagen	—	≈ 300 tokens de contexto añadido	≈ 1.000
Pregunta RAG de un usuario	Chat	Envío de embeddings para 10 documentos de entre 1 y 2 páginas	≈ 200 tokens de contexto añadido	≈ 10.000

Relacionada con

Cómo se cuentan los tokens

Herramientas útiles

Factores que afectan el consumo

Buenas prácticas para optimizar el consumo

Ejemplos orientativos

Artículos relacionados