El modelo HRM: IA inspirada en el cerebro que supera a gigantes

En estos últimos meses hemos hablado de dos visiones divergentes en el diseño de modelos de inteligencia artificial. En Japón, Sakana AI propone una IA que piensa en voz baja, deliberativa y biológicamente inspirada. En China, Hunyuan-T1 marca el avance geoestratégico de Tencent hacia una potencia computacional optimizada para productividad y rendimiento masivo. Pero en este verano ha surgido una tercera propuesta que desafía a ambas: el modelo HRM (Hierarchical Reasoning Model) de Sapient Intelligence.

Frente al gigantismo de modelos como GPT-4.5 o DeepSeek R1, el HRM no destaca por su tamaño, sino por su diseño. Con apenas 27 millones de parámetros, este modelo modular ha sido capaz de resolver tareas que exigen razonamiento estructurado —como el benchmark ARC-AGI o la resolución de Sudokus— sin necesidad de preentrenamiento masivo ni técnicas como chain-of-thought. La pregunta que plantea es provocadora: ¿y si hemos estado confundiendo inteligencia con capacidad de cálculo?

La arquitectura del HRM: pensar como un córtex, no como un transformer

El HRM no se basa en la predictibilidad estadística de los transformers tradicionales. Su arquitectura modular separa explícitamente dos niveles: un sistema de planificación abstracta y otro de ejecución detallada, imitando la forma en que el cerebro humano procesa tareas complejas. Este diseño no busca completar frases, sino construir soluciones jerárquicas, razonando por capas.

Al igual que los Continual Thinking Models de Sakana AI —que emulan procesos de deliberación neuronal secuencial—, el HRM apuesta por una IA que no responde por inercia, sino que razona internamente antes de emitir una acción. Esta similitud revela un patrón emergente: la inspiración biológica ya no es solo estética, sino estructural. Modelos como el HRM y los CTMs están dejando atrás el paradigma de la IA reactiva para entrar en el de la IA introspectiva.

Tamaño no es destino: cuando 27M superan a 270B

La verdadera sorpresa del HRM no está en lo que promete, sino en lo que ya ha logrado. Con sus apenas 27M de parámetros —una fracción ínfima frente a modelos como Claude 3.7 o DeepSeek R1— ha superado a ambos en tareas de razonamiento visual y simbólico. Todo ello sin entrenamiento prolongado ni necesidad de prompts intermedios. El modelo razona “desde dentro”, sin depender de indicaciones externas.

Este resultado no solo desafía las métricas tradicionales de rendimiento, sino que también cuestiona los fundamentos de la carrera por el tamaño. Mientras gigantes como Tencent apuestan por modelos ultra-grandes como Hunyuan-T1, capaces de decodificar con eficiencia y alinear sus respuestas mediante autoevaluación, Sapient Intelligence propone otro camino: diseñar modelos que piensan mejor, no más.

Más allá del laboratorio: diagnósticos médicos y predicción climática

Lo más interesante del HRM es su salida temprana del laboratorio hacia aplicaciones reales. Ya se está utilizando en diagnóstico de enfermedades raras, donde su capacidad para construir hipótesis lógicas supera a sistemas más grandes pero menos estructurados. También ha sido implementado en modelos climáticos, donde las decisiones a largo plazo y la gestión de variables inciertas requieren algo más que velocidad: requieren comprensión.

Este tipo de despliegue anticipado muestra que los modelos pequeños pero bien diseñados pueden integrarse más rápido en contextos críticos, donde la transparencia, interpretabilidad y adaptabilidad son prioritarias. Frente a la complejidad de gobernar LLMs de escala masiva, el HRM ofrece una alternativa más controlable, explicable y económica.

Tres modelos, tres visiones: ¿en qué dirección queremos que evolucione la IA?

En pocos meses, hemos visto tres apuestas radicalmente distintas sobre cómo debe evolucionar la inteligencia artificial. Desde Tokio, Sakana AI sugiere que la lentitud cognitiva puede ser una virtud cuando se trata de razonar. Desde Shenzhen, Tencent afirma que el dominio computacional y la eficiencia estratégica son el camino hacia la supremacía tecnológica. Desde California, Sapient Intelligence responde con un diseño que replica la arquitectura jerárquica del cerebro humano, apostando por inteligencia funcional antes que por escala.

Estas tres propuestas no compiten en la misma liga, ni buscan exactamente lo mismo. Pero todas desafían la lógica dominante del “más es mejor”. Y todas nos obligan a hacernos la misma pregunta: ¿queremos construir máquinas que digan cosas rápidamente, o que piensen de verdad?

Publicaciones Similares