TL;DR

Los prompts en español cuestan ~50% más tokens que en inglés, pero la diferencia de calidad es insignificante para tareas de programación. Usar tu idioma nativo te permite pensar más rápido y dar instrucciones más claras — eso importa más que ahorrar tokens.

El contexto

Soy un ingeniero de software hispanohablante que usa Claude Code como herramienta principal de desarrollo. En los últimos meses he acumulado 21.000+ sesiones y 245.000+ mensajes. Mi flujo de trabajo está muy orientado a la ejecución: sesiones largas de depuración, discusiones de arquitectura, revisiones de código — todo en español.

En algún momento me hice la pregunta obvia: ¿debería estar escribiendo todos estos prompts en inglés? El inglés es la lingua franca de la programación. La mayoría de los datos de entrenamiento están en inglés. Todos los benchmarks están en inglés. Seguro que estoy perdiendo rendimiento, ¿no?

Decidí averiguarlo.


Parte 1: El impuesto de tokens

Los LLMs no ven palabras — ven tokens. Y los tokenizers están fuertemente optimizados para el inglés. La palabra authentication es un solo token. Su equivalente en español, autenticación, son tres tokens.

Pasé prompts equivalentes por el tokenizer de Claude (proxy cl100k_base) para medir el coste real. Estos son prompts reales que uso a diario en Claude Code:

Tipo de prompt Inglés Español Sobrecoste
Corrección de bug 20 tokens 31 tokens +55%
Creación de endpoint API 32 tokens 46 tokens +44%
Tarea de refactorización 26 tokens 41 tokens +58%
Generación de documentación 33 tokens 52 tokens +58%
Depuración de DevOps 37 tokens 58 tokens +57%
Revisión de código (larga) 65 tokens 106 tokens +63%
Discusión de arquitectura 58 tokens 93 tokens +60%
Media de todas las pruebas 352 tokens 544 tokens +54,5%

Eso es un sobrecoste del 54,5% en tokens de media. Para prompts más largos y complejos, empeora — el prompt de revisión de código llegó al +63%.

¿Por qué la diferencia es tan grande?

Los tokenizers BPE construyen su vocabulario a partir de datos de entrenamiento, que son predominantemente en inglés. Las palabras comunes en inglés tienen su propio token. Las palabras en español a menudo se dividen en sub-palabras:

authentication 1 token
autenticación 3 tokens
deployment 1 token
despliegue 4 tokens
configuration 1 token
configuración 3 tokens
database 1 token
base de datos 3 tokens
environment 1 token
entorno 2 tokens
backward compatibility 2 tokens
compatibilidad hacia atrás 5 tokens

Observa que middleware se mantiene en 1 token en ambos idiomas — los términos técnicos tomados directamente del inglés no pagan el impuesto. Esto es importante: cuanto más técnico sea tu prompt, más anglicismos contiene, y menor es la diferencia.


Parte 2: La realidad de la ventana de contexto

En una sesión típica de Claude Code, tus prompts son una fracción mínima del contexto total. Esto es lo que realmente llena la ventana de contexto:

Sistema
~35% — Inglés (system prompt, tools)
Código
~40% — Inglés (contenido de archivos, diffs)
Herramientas
~15% — Inglés (bash, grep)
~10% — Tu idioma

Tus mensajes suelen representar ~10% del contexto. Un sobrecoste del 54% sobre el 10% del contexto es un aumento del ~5,5% en el uso total de tokens. Ese es el número real.

54% suena aterrador. 5,5% suena manejable. Ambos números son correctos — la diferencia está en contra qué lo mides.


Parte 3: ¿Afecta el idioma a la calidad?

Esta es la pregunta que realmente importa. Los tokens son dinero, pero la calidad lo es todo.

Para generación de código: sin diferencia significativa

Claude genera el mismo Go, TypeScript o Python independientemente de si le preguntas en inglés o en español. La salida de código es agnóstica al idioma. Los nombres de variables, las firmas de funciones y las decisiones de arquitectura no cambian según el idioma del prompt.

Considera estos dos prompts equivalentes:

English

Add pagination to the list endpoint. Use cursor-based
pagination with a default page size of 20.
Spanish

Añade paginación al endpoint de listado. Usa paginación
basada en cursor con un tamaño de página por defecto de 20.

Ambos producen código idéntico. Los nombres de funciones generados, las consultas SQL, los structs de respuesta — todo igual. Claude entiende la intención independientemente del idioma que la envuelve.

Para tareas de razonamiento: ligera ventaja del inglés

Los benchmarks académicos como MMLU y GSM8K muestran una pequeña ventaja (2-5%) para prompts en inglés en tareas que requieren mucho razonamiento. Es esperable — el modelo ha visto más ejemplos de razonamiento encadenado en inglés durante el entrenamiento.

Pero hay un matiz: esos benchmarks evalúan el idioma del modelo, no el tuyo. Cuando escribes en español, Claude sigue razonando internamente en la representación que usa y solo traduce la salida final. No le estás obligando a “pensar en español”.

Para claridad en las instrucciones: gana el idioma nativo

Aquí es donde está la diferencia real. Testé mi propia velocidad de escritura y descubrí que escribo ~30% más rápido en español que en inglés. No solo más rápido — también con más precisión. Cuando intenté escribir una nota rápida en inglés para probarlo, inmediatamente cometí una errata. ¿En español? Limpio a la primera.

Cuando intentaba escribir prompts en inglés:

Cuando escribo en español, expreso exactamente lo que quiero decir, con todos los matices, condiciones y casos límite. Un prompt que me lleva 5 segundos en español me lleva 8-10 en inglés — y la versión en español suele ser más precisa y sin erratas.

El mejor prompt no es el que tiene menos tokens. Es el que describe con mayor precisión lo que quieres. Tu idioma nativo te da eso.


Parte 4: Los números de 21.000 sesiones

He estado usando español exclusivamente con Claude Code desde que hice este análisis. Esto es lo que muestran los datos:

Nunca he tenido un caso en que Claude malinterpretara un prompt en español de una forma que no habría malinterpretado en inglés. Los modos de fallo son los mismos: requisitos ambiguos, contexto faltante, casos límite poco especificados. El idioma no es el cuello de botella — la claridad sí lo es.


Parte 5: El coste real

Pongamos números reales. Con Claude Sonnet a $3/M tokens de entrada:

Escenario Inglés Español Coste extra
Un prompt (media) 35 tokens 54 tokens $0.000057
Sesión típica (20 prompts) 700 tokens 1,080 tokens $0.00114
Día intenso (200 prompts) 7,000 tokens 10,800 tokens $0.0114
Mes de uso intensivo 140K tokens 216K tokens $0.228

El “impuesto” del español en mis prompts de entrada cuesta aproximadamente 23 céntimos al mes. Eso es menos de un céntimo por día laborable. Y recuerda: esto solo afecta a tus mensajes, no al system prompt, los resultados de herramientas o el contenido del código que componen la mayor parte del uso de tokens.

Con el modelo de suscripción de Claude Code, esto es aún menos relevante — pagas una tarifa plana independientemente del número de tokens.


El veredicto

Ventajas del idioma nativo

  • Piensas más rápido, escribes prompts más rápido
  • Instrucciones más precisas
  • Mejores discusiones de arquitectura
  • Menor carga cognitiva
  • Expresión natural de casos límite

Ventajas del inglés

  • ~50% menos tokens en prompts
  • 2-5% mejor en benchmarks de razonamiento
  • Ligera ventaja en temas raros o de nicho
  • Más fácil compartir prompts con equipos angloparlantes

Usa tu idioma nativo.

El sobrecoste de tokens es real pero irrelevante a la escala del uso real. La diferencia de calidad es medible en benchmarks pero invisible en la práctica. La ventaja en claridad de pensar en tu propio idioma es significativa y se acumula a lo largo de miles de interacciones.

La única excepción: si estás escribiendo prompts que se van a compartir como plantillas con un equipo angloparlante, escríbelos en inglés. Pero para tu trabajo diario — tus sesiones de depuración, tus discusiones de arquitectura, tus mensajes de “arregla este bug” — usa el idioma que te permita pensar más rápido.

Eso es lo que hago yo. 21.000 sesiones y contando.


Análisis de Jairo Caro-Accino. Conteos de tokens medidos con el tokenizer cl100k_base. Datos de sesiones obtenidos de las analíticas de uso de Claude Code.