Releases
GLM 4.7
Chinese AI lab Z.ai has released an updated version of their open source coding model GLM 4.6.
The GLM models (and more specifically, the GLM coding plan) are known for their decent performance and incredibly low cost and great rate limits.
The model can be dropped in directly to Claude Code as well as a wide variety of other agentic coding platforms for as low as $3 a month.
The 4.6 model was around the same level as Sonnet 4, and now the 4.7 version appears to be Sonnet 4.5 or maybe even a little better.

In my usage it has much better instruction following and can complete much larger tasks than its predecessor was able to.
It also is noticeably better at frontend design, being behind only Gemini 3 in Design Arena.

This would be much more exciting if it weren’t for Opus 4.5. GLM 4.7, or any other model, cannot hold a candle to Opus right now, making this a battle for second place.
If you only need a second place model or have not been spoiled with Opus 4.5, then I would highly recommend checking this out, as it is the same quality as Sonnet 4.5 for
| Model | $ per million (input) | $ per million (output) | Tokens per second |
|---|
| Claude Sonnet 4.5 | $3 | $15 | 57 |
| Claude Opus 4.5 | $5 | $25 | 64 |
| GPT 5.2 | $1.75 | $14 | 38 |
| Gemini 3 Pro Preview | $2 | $12 | 80 |
| GLM 4.7 | $0.60 | $2.20 | 280 |
Data from Openrouter
MiniMax 2.1
Another big release from China this week is the updated version of MiniMax 2.
Minimax is the same lab that makes the Hailuo video generation models, which are always near the top of the video generation leaderboards.
The Minimax 2 model is the Gemini Flash of the Chinese models, being smaller and cheaper than most other models while still being very strong.
It is a 230 billion parameter mixture of experts model, with 10 billion active parameters.
For reference, DeepSeek is 685 billion params with 37 billion active, and GLM 4.7 is 358 billion total with 32 billion active.
This means that with the same hardware, MiniMax will be ~3 times faster than the other two models.

| Model | $ per million (input) | $ per million (output) | Tokens per second |
|---|
| GLM 4.7 | $0.60 | $2.20 | 280 |
| MiniMax M2.1 | $0.30 | $1.20 | 66 |
| DeepSeek 3.2 | $0.28 | $0.42 | 29 |
It is ridiculous how cheap DeepSeek is given its size
The model is being pushed as a coding model, and is decent from what I have seen, being around the GLM 4.6 level, which would be at the top for Chinese models, if it weren’t for GLM 4.7 being released within a week as well.
It does have a chance of being run on home servers, as it should fit on a computer with 128GB of memory with 4 bit weights, which none of the other frontier Chinese models can do.
Overall it seems to be a decent model, fairly cheap, and fast, but nothing special that we do not already have.
Quick Hits
Qwen Image Edit Update
Qwen Image Edit is the most popular open source image editing model right now.
When it was released, it was in the top 3 for image editing models, but the competition in the space has been fierce and it has dropped outside of the top 10.
However, because it is open source, the community has been making fine tuned versions that have increased its capabilities for narrow tasks.
What the Qwen team has done for this release is to add in many of the popular community finetunes and then also add some more of their own training on top, resulting in a stronger model.
Official benchmark scores are not out yet, but I suspect we will be seeing Qwen Image Edit back at the top again.
Finish
Happy holidays! I hope you enjoyed the news this week. If you want to get the news every week, be sure to join our mailing list below.
From Jocelin Carmes on Twitter Nota: Este artigo foi traduzido automaticamente com Claude Sonnet 4.5; a qualidade pode estar reduzida, especialmente na terminologia técnica.
Lançamentos
GLM 4.7
O laboratório chinês de IA Z.ai lançou uma versão atualizada do seu modelo de código aberto GLM 4.6.
Os modelos GLM (e mais especificamente, o plano de codificação GLM) são conhecidos pelo seu desempenho decente e custo incrivelmente baixo com excelentes limites de taxa.
O modelo pode ser integrado diretamente ao Claude Code, assim como a uma ampla variedade de outras plataformas de codificação agêntica por apenas $3 por mês.
O modelo 4.6 estava aproximadamente no mesmo nível do Sonnet 4, e agora a versão 4.7 parece estar no nível do Sonnet 4.5 ou talvez até um pouco melhor.

No meu uso, ele tem um seguimento de instruções muito melhor e pode completar tarefas muito maiores do que seu predecessor era capaz.
Também é visivelmente melhor em design frontend, ficando atrás apenas do Gemini 3 no Design Arena.

Isso seria muito mais empolgante se não fosse pelo Opus 4.5. O GLM 4.7, ou qualquer outro modelo, não chega aos pés do Opus agora, tornando esta uma batalha pelo segundo lugar.
Se você precisa apenas de um modelo de segundo lugar ou não foi mimado com o Opus 4.5, então eu recomendaria muito experimentar este, pois tem a mesma qualidade do Sonnet 4.5 por
| Modelo | $ por milhão (entrada) | $ por milhão (saída) | Tokens por segundo |
|---|
| Claude Sonnet 4.5 | $3 | $15 | 57 |
| Claude Opus 4.5 | $5 | $25 | 64 |
| GPT 5.2 | $1.75 | $14 | 38 |
| Gemini 3 Pro Preview | $2 | $12 | 80 |
| GLM 4.7 | $0.60 | $2.20 | 280 |
Dados do Openrouter
MiniMax 2.1
Outro grande lançamento da China esta semana é a versão atualizada do MiniMax 2.
Minimax é o mesmo laboratório que cria os modelos de geração de vídeo Hailuo, que estão sempre perto do topo das classificações de geração de vídeo.
O modelo Minimax 2 é o Gemini Flash dos modelos chineses, sendo menor e mais barato do que a maioria dos outros modelos, enquanto ainda é muito forte.
É um modelo de mistura de especialistas de 230 bilhões de parâmetros, com 10 bilhões de parâmetros ativos.
Para referência, o DeepSeek tem 685 bilhões de parâmetros com 37 bilhões ativos, e o GLM 4.7 tem 358 bilhões no total com 32 bilhões ativos.
Isso significa que com o mesmo hardware, o MiniMax será ~3 vezes mais rápido do que os outros dois modelos.

| Modelo | $ por milhão (entrada) | $ por milhão (saída) | Tokens por segundo |
|---|
| GLM 4.7 | $0.60 | $2.20 | 280 |
| MiniMax M2.1 | $0.30 | $1.20 | 66 |
| DeepSeek 3.2 | $0.28 | $0.42 | 29 |
É ridículo o quão barato o DeepSeek é dado o seu tamanho
O modelo está sendo promovido como um modelo de codificação, e é decente pelo que vi, estando aproximadamente no nível do GLM 4.6, que estaria no topo para modelos chineses, se não fosse pelo GLM 4.7 ter sido lançado dentro de uma semana também.
Ele tem uma chance de ser executado em servidores domésticos, pois deve caber em um computador com 128GB de memória com pesos de 4 bits, o que nenhum dos outros modelos chineses de fronteira pode fazer.
No geral, parece ser um modelo decente, razoavelmente barato e rápido, mas nada de especial que já não tenhamos.
Destaques Rápidos
Atualização do Qwen Image Edit
Qwen Image Edit é o modelo de edição de imagens de código aberto mais popular atualmente.
Quando foi lançado, estava entre os 3 melhores modelos de edição de imagens, mas a competição no espaço tem sido feroz e ele caiu para fora do top 10.
No entanto, por ser de código aberto, a comunidade tem feito versões ajustadas que aumentaram suas capacidades para tarefas específicas.
O que a equipe Qwen fez para este lançamento foi adicionar muitos dos ajustes finos populares da comunidade e depois adicionar mais treinamento próprio por cima, resultando em um modelo mais forte.
As pontuações oficiais de benchmark ainda não foram divulgadas, mas suspeito que veremos o Qwen Image Edit de volta ao topo novamente.
Finalização
Boas festas! Espero que você tenha gostado das novidades desta semana. Se você quiser receber as notícias toda semana, certifique-se de se juntar à nossa lista de e-mails abaixo.
De Jocelin Carmes no Twitter Nota: Este artículo fue traducido automáticamente con Claude Sonnet 4.5; la calidad puede verse degradada, especialmente en la terminología técnica.
Lanzamientos
GLM 4.7
El laboratorio de IA chino Z.ai ha lanzado una versión actualizada de su modelo de código abierto GLM 4.6.
Los modelos GLM (y más específicamente, el plan de codificación GLM) son conocidos por su rendimiento decente y su costo increíblemente bajo con excelentes límites de tasa.
El modelo se puede integrar directamente en Claude Code así como en una amplia variedad de otras plataformas de codificación agéntica por tan solo $3 al mes.
El modelo 4.6 estaba aproximadamente al mismo nivel que Sonnet 4, y ahora la versión 4.7 parece estar a la altura de Sonnet 4.5 o quizás incluso un poco mejor.

En mi uso, tiene un seguimiento de instrucciones mucho mejor y puede completar tareas mucho más grandes de las que su predecesor era capaz.
También es notablemente mejor en diseño frontend, quedando solo por detrás de Gemini 3 en Design Arena.

Esto sería mucho más emocionante si no fuera por Opus 4.5. GLM 4.7, o cualquier otro modelo, no puede competir con Opus en este momento, haciendo de esta una batalla por el segundo lugar.
Si solo necesitas un modelo de segundo lugar o no has sido consentido con Opus 4.5, entonces recomendaría encarecidamente probar esto, ya que tiene la misma calidad que Sonnet 4.5 por
| Modelo | $ por millón (entrada) | $ por millón (salida) | Tokens por segundo |
|---|
| Claude Sonnet 4.5 | $3 | $15 | 57 |
| Claude Opus 4.5 | $5 | $25 | 64 |
| GPT 5.2 | $1.75 | $14 | 38 |
| Gemini 3 Pro Preview | $2 | $12 | 80 |
| GLM 4.7 | $0.60 | $2.20 | 280 |
Datos de Openrouter
MiniMax 2.1
Otro gran lanzamiento desde China esta semana es la versión actualizada de MiniMax 2.
Minimax es el mismo laboratorio que desarrolla los modelos de generación de video Hailuo, que siempre están cerca de la cima de las clasificaciones de generación de video.
El modelo Minimax 2 es el Gemini Flash de los modelos chinos, siendo más pequeño y económico que la mayoría de los otros modelos mientras sigue siendo muy potente.
Es un modelo de mezcla de expertos de 230 mil millones de parámetros, con 10 mil millones de parámetros activos.
Para referencia, DeepSeek tiene 685 mil millones de parámetros con 37 mil millones activos, y GLM 4.7 tiene 358 mil millones en total con 32 mil millones activos.
Esto significa que con el mismo hardware, MiniMax será aproximadamente 3 veces más rápido que los otros dos modelos.

| Modelo | $ por millón (entrada) | $ por millón (salida) | Tokens por segundo |
|---|
| GLM 4.7 | $0.60 | $2.20 | 280 |
| MiniMax M2.1 | $0.30 | $1.20 | 66 |
| DeepSeek 3.2 | $0.28 | $0.42 | 29 |
Es ridículo lo económico que es DeepSeek dado su tamaño
El modelo está siendo promovido como un modelo de codificación, y es decente por lo que he visto, estando alrededor del nivel de GLM 4.6, lo que estaría en la cima para los modelos chinos, si no fuera porque GLM 4.7 fue lanzado en la misma semana también.
Tiene la posibilidad de ejecutarse en servidores domésticos, ya que debería caber en una computadora con 128GB de memoria con pesos de 4 bits, lo cual ninguno de los otros modelos chinos de frontera puede hacer.
En general, parece ser un modelo decente, bastante económico y rápido, pero nada especial que no tengamos ya.
Noticias Breves
Actualización de Qwen Image Edit
Qwen Image Edit es el modelo de edición de imágenes de código abierto más popular en este momento.
Cuando fue lanzado, estaba entre los 3 mejores modelos de edición de imágenes, pero la competencia en el espacio ha sido feroz y ha caído fuera del top 10.
Sin embargo, debido a que es de código abierto, la comunidad ha estado creando versiones ajustadas que han aumentado sus capacidades para tareas específicas.
Lo que el equipo de Qwen ha hecho para este lanzamiento es agregar muchos de los ajustes comunitarios populares y luego también añadir algo más de su propio entrenamiento encima, resultando en un modelo más potente.
Las puntuaciones oficiales de benchmark aún no están disponibles, pero sospecho que veremos a Qwen Image Edit de vuelta en la cima nuevamente.
Final
¡Felices fiestas! Espero que hayas disfrutado las noticias de esta semana. Si quieres recibir las noticias cada semana, asegúrate de unirte a nuestra lista de correo a continuación.
De Jocelin Carmes en Twitter