Qwen3, nuevo modelo de inteligencia artificial, destaca por su capacidad multilenguaje, razonamiento avanzado y eficiencia en recursos

Qwen3 revoluciona la inteligencia artificial con capacidades multilingües, razonamiento avanzado y eficiencia en recursos, estableciendo nuevos estándares en el sector.

Publicado: 30-04-2025 16:16

El esperado modelo Qwen3 se lanzó oficialmente el 28 de abril de 2025, marcando un avance significativo en el campo de la inteligencia artificial. Este modelo, disponible en diferentes tamaños desde 600 millones hasta 235 mil millones de parámetros, ofrece capacidades avanzadas en razonamiento, matemáticas, codificación y escritura creativa. Además, incluye modelos especializados en distintas áreas y soporta más de 100 idiomas, con una longitud de contexto de hasta 32.768 tokens, que puede incrementarse a 128.000 utilizando técnicas como RoPE-Scaling.

El entrenamiento de Qwen3 se realizó en dos fases, en las que se duplicó la cantidad de datos preentrenados, pasando de 18 a 36 billones de tokens. Se emplearon datos adicionales recopilados de PDFs y se generaron datos sintéticos, con un postentrenamiento en varias etapas enfocado en mejorar las habilidades de razonamiento y conocimientos generales mediante técnicas de refuerzo y transferencia de conocimientos. Esto permitió que las versiones más grandes, como las de 32.000 millones y 235.000 millones, alcanzaran niveles superiores en lógica y análisis.

Una novedad destacada de Qwen3 es la disponibilidad de modelos en formato mixture-of-experts, que permite una mayor eficiencia en el uso de recursos, ya que modelos con 30.000 millones de parámetros utilizan solo 3.000 millones para cada cálculo, logrando una generación de tokens más rápida y eficiente. Todos los modelos incorporan una función de razonamiento llamada «enable_thinking», que simula un proceso de «pensamiento» antes de responder, facilitando respuestas más precisas y analíticas y permitiendo que funcionen tanto como modelos tradicionales como especializados en razonamiento.

Desde su lanzamiento, se ha destacado que Qwen3 supera a otros modelos en matemáticas, lógica y capacidades de codificación, además de ser muy apto para tareas creativas. En comparación con modelos similares, como Llama 4, Qwen3 ofrece la ventaja de que su licencia Apache 2.0 facilita su uso en diferentes regiones, incluida la Unión Europea, y puede descargarse y probarse fácilmente, ya que la mayoría de sus versiones están quantizadas para correr en GPU y en plataformas como llama.cpp.

Las pruebas iniciales con el modelo han demostrado que, en tareas de conteo y razonamiento, como contar letras en palabras en alemán e inglés, Qwen3 ofrece resultados muy precisos, destacando especialmente en su modo de razonamiento, que puede activarse para facilitar tareas de análisis y cálculo. Aunque en ámbitos matemáticos complejos todavía presenta limitaciones, como en la factorización de ciertos números, su desempeño en tareas de comprensión del lenguaje y lógica práctica lo posiciona como una herramienta poderosa para diversas aplicaciones de IA. En definitiva, el lanzamiento de Qwen3 marca un paso importante en la evolución de los modelos de lenguaje, ofreciendo mayor flexibilidad, rendimiento y facilidad de uso en múltiples contextos y regiones del mundo.