This article is also available in English.
Read in EN →
Tutorial: Cómo Usar Claude Code con Modelos Locales y Baratos Usando Claude Code Router
Tecnología
9 min ETA

Tutorial: Cómo Usar Claude Code con Modelos Locales y Baratos Usando Claude Code Router

IA4

IA4PYMES

Research Team

El lanzamiento de Claude Code por parte de Anthropic ha redefinido el desarrollo de software asistido por terminal. A diferencia de las herramientas de chat tradicionales, Claude Code opera como un agente autónomo local: es capaz de leer y editar archivos en tu repositorio, ejecutar comandos bash, correr tests y corregir bugs en un bucle continuo de planificación y ejecución.

Sin embargo, el despliegue de esta potente herramienta en entornos corporativos choca con dos grandes barreras:

  1. El coste de los tokens: Dado que el agente envía grandes bloques de contexto (código fuente, historial y resultados de consola) en cada paso, una sesión de depuración intensa puede consumir millones de tokens de la API de Anthropic, inflando los costes rápidamente.
  2. Soberanía y privacidad: Muchas empresas tienen prohibido por normativa enviar su código propietario a servidores y APIs externas de terceros.

Para resolver este cuello de botella, el ecosistema de código abierto ha desarrollado Claude Code Router (disponible a través del paquete @musistudio/claude-code-router). Esta herramienta actúa como un middleware local que intercepta las peticiones de Claude Code y las redirige hacia modelos de inferencia mucho más baratos (como DeepSeek) o incluso a modelos locales open-source que se ejecutan completamente offline.

Analizamos el potencial de esta arquitectura y cómo configurarla paso a paso en tu flujo de trabajo.


1. El potencial de reutilizar el "harness" de Claude Code

El verdadero valor de Claude Code no reside únicamente en el modelo Claude 4.6 Sonnet que lleva detrás, sino en su harness o arnés de ejecución: el conjunto de prompts de sistema altamente refinados, la gestión de herramientas (tool calling) y el bucle de retroalimentación que le permite interactuar de forma segura con tu máquina local.

Gracias a Claude Code Router, podemos disociar este arnés del modelo propietario de Anthropic. Esto abre tres grandes oportunidades para las PYMEs:

  • Reducción de costes drástica (hasta 95%): Redirigir las consultas de análisis masivo a modelos hiperbaratos como Gemini 3.5 Flash o DeepSeek-Coder-V4 a través de APIs de bajo coste.
  • Privacidad absoluta (Soberanía Digital): Enrutar las llamadas a modelos open-source instalados localmente en tu propio hardware. De esta forma, el código de tu empresa nunca abandona tu red interna, cumpliendo estrictamente con el RGPD.
  • Flexibilidad de desarrollo: Cambiar de modelo en caliente según la complejidad de la tarea sin tener que cambiar de herramienta de consola.

2. Los modelos Open-Source en 2026: Preparados para mover el arnés

Hace un par de años, usar un modelo open-source para tareas complejas de agentes terminaba en bucles infinitos o fallos en el formato de respuesta. Sin embargo, en 2026, los modelos de pesos abiertos de última generación (como Qwen 3.6 Coder, Mimo 2.5 o DeepSeek-Coder-V4) han madurado de forma extraordinaria.

Estos modelos modernos cuentan con:

  • Habilidades nativas de Tool-Calling: Saben cuándo y cómo estructurar una llamada a una herramienta (como leer un archivo o ejecutar un test) con una tasa de error inferior a modelos comerciales antiguos.
  • Capacidad de razonamiento interno (Reasoning Tokens): Modelos como Mimo 2.5 o DeepSeek-Coder-V4 procesan cadenas de pensamiento lógicas complejas antes de emitir código, lo que los hace ideales para gestionar el bucle de Claude Code.
  • Ventanas de contexto ampliadas: Soportan contextos masivos, esenciales para analizar repositorios de código medianos y grandes de forma local.

🔍 ¿Quieres implementar flujos de desarrollo con IA locales y seguros en tu empresa?

El uso de asistentes de código y agentes autónomos locales permite ahorrar costes y proteger la propiedad intelectual de tu software. En IA4PYMES te ayudamos a auditar tu flujo de ingeniería, desplegar modelos open-source como Qwen 3.6 Coder en local y configurar proxies de inferencia seguros.

Agenda tu consultoría de 60 minutos aquí (100% reembolsable si contratas el proyecto con nosotros, y con garantía de viabilidad de 15 minutos).


3. Guía paso a paso: Instalación y configuración de Claude Code Router

Para poner en marcha esta infraestructura y empezar a usar Claude Code con modelos externos o locales, sigue estos pasos:

Paso 1: Instalar las dependencias globales

Primero, instala la herramienta oficial de Claude Code y el router de código abierto desde npm:

npm install -g @anthropic-ai/claude-code
npm install -g @musistudio/claude-code-router

Paso 2: Configurar las conexiones (Ollama y APIs externas)

Claude Code Router busca la configuración de proveedores en tu carpeta de usuario (habitualmente en ~/.claude-code-router/config.json). Puedes configurar distintos proveedores:

  • Para usar DeepSeek en la nube (Hiperbarato): Configura la URL de API de DeepSeek y tu clave de API en el archivo para usar el modelo DeepSeek-Coder-V4.
  • Para usar modelos 100% locales (Ollama): Asegúrate de tener Ollama corriendo en tu máquina con un modelo potente descargado, como por ejemplo:
    ollama run qwen3.6-coder:32b
    
    O alternativamente Mimo 2.5.

Paso 3: Lanzar el agente

En lugar de iniciar el agente con el comando estándar (claude), utiliza el comando del router:

ccr code

Este comando levantará un proxy local que intercepta las peticiones de Claude Code y las traduce dinámicamente al formato del modelo de destino (Gemini, DeepSeek u Ollama) de manera transparente para el sistema operativo.

Paso 4: Cambiar de modelo en caliente

Una vez dentro de la consola del agente, puedes usar el comando interactivo del router:

/model deepseek

O bien:

/model ollama/qwen3.6-coder

El agente reconfigurará el enrutador al instante y continuará resolviendo tareas en tu repositorio sin interrumpir tu sesión de desarrollo.


4. Análisis de ROI para PYMEs Tecnológicas

La adopción de esta estrategia tiene un impacto directo en la cuenta de resultados de tu equipo de desarrollo:

Factura de API reducida

Una sesión intensa de depuración de bugs de 4 horas con Claude 4.6 Sonnet nativo puede costar fácilmente entre 8 y 12 euros en tokens de entrada y salida debido a la recursión del contexto. Redirigiendo el trabajo a DeepSeek-Coder-V4 a través de SiliconFlow o la API oficial de DeepSeek, el coste de la misma sesión se reduce a menos de 0.40 euros (un ahorro del 95%).

Soberanía del código y cumplimiento normativo

Al utilizar modelos locales como Qwen 3.6 Coder o Mimo 2.5 corriendo en servidores de la propia empresa, se elimina por completo la transferencia de código a servidores de terceros en EE.UU. Esto permite a las PYMEs que desarrollan software para sectores regulados (Fintech, Healthtech, Administraciones Públicas) adoptar asistentes autónomos de terminal garantizando el cumplimiento estricto del RGPD.


Conclusión

El potencial de Claude Code es inmenso, pero su coste y la privacidad del código restringían su uso en el sector empresarial. Al integrar Claude Code Router con los potentes modelos open-source de 2026 (como Qwen 3.6 Coder y Mimo 2.5), las PYMEs pueden democratizar el acceso a asistentes de programación de última generación en todos sus equipos, manteniendo la confidencialidad de su propiedad intelectual y reduciendo los costes de infraestructura a prácticamente cero.

initiating_deployment...

Pasa de la teoría a la ejecución

El conocimiento sin implementación técnica es solo entretenimiento. Agenda tu consultoría de 60 minutos: te devolvemos el 100% del importe si en los primeros 15 minutos vemos que la IA no es viable para tu caso, y si decides contratar el proyecto con nosotros, te descontamos el coste total de la sesión del presupuesto final.

Reservar Consultoría