Releases
GLM 4.7 Flash
Z.ai has released the smaller version of their very strong GLM 4.7 model, called GLM 4.7 Flash.
The model is a 30 billion parameter mixture of experts model, making it ideal to run locally (if you have >24GB of CPU and GPU memory).

Its performance is frankly ridiculous for its size.
Its SWE-Bench verified score is better than Sonnet 3.6, the model that started the vibe coding revolution.
This means that in about a year, we have been able to compress a frontier model down into something many people can run at home on their own hardware.
It does not only perform well on benchmarks.
I have started using the model locally, and it is the first local model that seems to have an intuitive understanding of when to use tools for real world tasks.
Most open source models that I run need to be begged to call a tool, and when they do they tend to only call it once, even if it fails or the right information is not returned.
GLM 4.7 Flash doesn’t have this issue, making it extremely usable for day to day agent tasks.
I can see it replacing all of my non-coding AI usage in the future as I build out the tools and harness around it.
If you are interested in running or using local models, you should be required to try out GLM 4.7 Flash.
If you want to run it, I would look at using llama.cpp as it is fast and supported across all systems.
Devin Code review
Code review on Github feels antiquated now in the age of AI, as code review becomes the major time sink for humans when coding.
The folks over at Cognition, the company behind Devin, thought so as well and have made their own AI powered PR review platform that they are offering for free right now, called Devin Review.
Instead of listing files and changes alphabetically or by line number, Devin Review instead groups them together in terms of logical features for you to be able to quickly look through and see all the related code right next to each other. It also goes and summarizes and explains what the code is doing as well. It can flag potential things that are missing and also report any bugs that it finds as well in this view.
It also has other nice-to-haves, like proper display of when code is moved. Normally on GitHub, you just see code getting deleted and then a new chunk appears somewhere else in another file that is the exact same duplicate code, but you don’t see any indication that those two things are identical or are linked in any way. In Devin, it shows you the relationship between this code, which makes it very easy to see when things are refactored.
There are many tools trying to revolutionize the code review space in the age of AI, but all of them previously have been coupled to GitHub. Devin Review is the first one that I have seen that seems to offer a more modern approach to code review, and I expect to see many more companies and products like this in the future.
Quick Hits
Qwen3 TTS
Qwen has had their own text-to-speech model for a while now, but it was closed source and you had to pay through their API to be able to go and use it. That was until this week, when they open-sourced their Qwen3 TTS model.
**
In terms of raw voice quality and clarity, it is not at the same level as Eleven Labs or Chatterbox TTS. But where it does excel is emotional voice control. You are able to give a text description of the speaker and the way they talk, and then also a description for the way you would like the text you are passing into the model to be described as well. This allows it to be one of the most expressive text-to-speech models out there, which you can now run for yourself at home.
It comes in two sizes, 600 million parameters and 1.7 billion parameters, both of which are feasible to run on edge devices although not always at real time. You can try it right now on Huggingface.
Video Generation Skills
Skills are markdown files that allow an LLM to easily learn new concepts.
Usually, these relate to code or some other text-based task.
This week, though, we got two new skills made by the community that are for video generation with LLMs, being the Remotion and Manim skills.
Remotion is a React based animation library, which is useful because LLMs already know React coding very well.
Manim is a python library that you have probably seen before, as it is what 3Blue1Brown uses to animate their videos.
Video made with the Remotion skill
If you are interested in making videos or animations with LLMs I would recommend adding these skills, as they make it very easy to do.
Suno at home?
Suno has been at the top of the AI text to song world for a while now, with no real competitors especially in the open source world.
That changed this week, as a group of researchers has released HeartMuLa (Heart Music Language model), which has a similar song creation experience to Suno and has quality that is comparable.
Before, none of the open source music generation models were able to make anything that I would consider listening to, but HeartMuLa is different. It is able to make full length songs that are cohesive, based on your text description of the song characteristics.
It also allows you to input the lyrics and the structure of the song as well.
The full sized 7 billion parameter model has yet to be released, but they have dropped the 3 billion parameter model, which to me sounds similar to Suno V3.
The general consensus seems to be that it is fairly good, although one downside I have been seeing people say is that it does not have a large amount of diversity for song styles.
If you are interested in testing it, you can check out the demo for it on Huggingface, or go to their Github if you want to run it yourself.
Finish
I hope you enjoyed the news this week. If you want to get the news every week, be sure to join our mailing list below.
Google street view as seen by Nano Banana by Fofr on Twitter Nota: Este artigo foi traduzido automaticamente com Claude Sonnet 4.5; a qualidade pode estar reduzida, especialmente na terminologia técnica.
Lançamentos
GLM 4.7 Flash
A Z.ai lançou a versão menor do seu modelo muito forte GLM 4.7, chamado GLM 4.7 Flash.
O modelo é um modelo de mistura de especialistas com 30 bilhões de parâmetros, tornando-o ideal para executar localmente (se você tiver mais de 24GB de memória CPU e GPU).

Seu desempenho é francamente ridículo para o seu tamanho.
Sua pontuação verificada no SWE-Bench é melhor que a do Sonnet 3.6, o modelo que iniciou a revolução da codificação vibe.
Isso significa que em cerca de um ano, conseguimos comprimir um modelo de fronteira em algo que muitas pessoas podem executar em casa em seu próprio hardware.
Ele não apenas tem bom desempenho em benchmarks.
Comecei a usar o modelo localmente, e é o primeiro modelo local que parece ter uma compreensão intuitiva de quando usar ferramentas para tarefas do mundo real.
A maioria dos modelos de código aberto que executo precisa ser implorada para chamar uma ferramenta, e quando o fazem, tendem a chamá-la apenas uma vez, mesmo que falhe ou as informações corretas não sejam retornadas.
O GLM 4.7 Flash não tem esse problema, tornando-o extremamente utilizável para tarefas de agentes do dia a dia.
Posso vê-lo substituindo todo o meu uso de IA não relacionado a codificação no futuro, à medida que construo as ferramentas e o ambiente ao seu redor.
Se você está interessado em executar ou usar modelos locais, você deveria ser obrigado a experimentar o GLM 4.7 Flash.
Se quiser executá-lo, eu recomendaria usar o llama.cpp, pois é rápido e suportado em todos os sistemas.
Revisão de código Devin
A revisão de código no Github parece antiquada agora na era da IA, já que a revisão de código se torna o principal dreno de tempo para humanos ao programar.
O pessoal da Cognition, a empresa por trás do Devin, pensou da mesma forma e criou sua própria plataforma de revisão de PR alimentada por IA que estão oferecendo gratuitamente agora, chamada Devin Review.
Em vez de listar arquivos e alterações alfabeticamente ou por número de linha, o Devin Review os agrupa em termos de recursos lógicos para que você possa revisar rapidamente e ver todo o código relacionado logo ao lado. Ele também resume e explica o que o código está fazendo. Pode sinalizar coisas potencialmente ausentes e também relatar quaisquer bugs que encontrar nesta visualização.
Ele também tem outros recursos interessantes, como a exibição adequada de quando o código é movido. Normalmente no GitHub, você apenas vê o código sendo excluído e então um novo bloco aparece em outro lugar em outro arquivo que é exatamente o mesmo código duplicado, mas você não vê nenhuma indicação de que essas duas coisas são idênticas ou estão vinculadas de alguma forma. No Devin, ele mostra a relação entre esse código, o que torna muito fácil ver quando as coisas são refatoradas.
Existem muitas ferramentas tentando revolucionar o espaço de revisão de código na era da IA, mas todas elas anteriormente estavam acopladas ao GitHub. O Devin Review é o primeiro que vi que parece oferecer uma abordagem mais moderna para revisão de código, e espero ver muitas mais empresas e produtos como este no futuro.
Destaques Rápidos
Qwen3 TTS
A Qwen tem seu próprio modelo de texto para fala há algum tempo, mas era de código fechado e você tinha que pagar através da API deles para poder usá-lo. Isso foi até esta semana, quando lançaram como código aberto seu modelo Qwen3 TTS.
**
Em termos de qualidade bruta e clareza de voz, não está no mesmo nível que Eleven Labs ou Chatterbox TTS. Mas onde ele se destaca é no controle emocional da voz. Você pode fornecer uma descrição em texto do falante e da forma como fala, e também uma descrição da maneira como gostaria que o texto que está passando para o modelo fosse descrito. Isso permite que seja um dos modelos de texto para fala mais expressivos disponíveis, que agora você pode executar em casa.
Ele vem em dois tamanhos, 600 milhões de parâmetros e 1,7 bilhão de parâmetros, ambos viáveis de executar em dispositivos de ponta, embora nem sempre em tempo real. Você pode experimentá-lo agora no Huggingface.
Skills de Geração de Vídeo
Skills são arquivos markdown que permitem que um LLM aprenda facilmente novos conceitos.
Geralmente, estes se relacionam a código ou alguma outra tarefa baseada em texto.
Esta semana, no entanto, tivemos dois novos skills criados pela comunidade que são para geração de vídeo com LLMs, sendo os skills Remotion e Manim.
Remotion é uma biblioteca de animação baseada em React, o que é útil porque os LLMs já conhecem muito bem a codificação em React.
Manim é uma biblioteca python que você provavelmente já viu antes, pois é o que 3Blue1Brown usa para animar seus vídeos.
Vídeo feito com o skill Remotion
Se você está interessado em fazer vídeos ou animações com LLMs, eu recomendaria adicionar esses skills, pois facilitam muito o processo.
Suno em casa?
O Suno está no topo do mundo de IA de texto para música há algum tempo, sem concorrentes reais, especialmente no mundo de código aberto.
Isso mudou esta semana, já que um grupo de pesquisadores lançou o HeartMuLa (Heart Music Language model), que tem uma experiência de criação de música similar ao Suno e qualidade comparável.
Antes, nenhum dos modelos de geração de música de código aberto era capaz de fazer algo que eu consideraria ouvir, mas HeartMuLa é diferente. Ele é capaz de fazer músicas completas que são coesas, baseadas em sua descrição de texto das características da música.
Ele também permite que você insira as letras e a estrutura da música.
O modelo completo de 7 bilhões de parâmetros ainda não foi lançado, mas eles lançaram o modelo de 3 bilhões de parâmetros, que para mim soa similar ao Suno V3.
O consenso geral parece ser que é bastante bom, embora uma desvantagem que tenho visto as pessoas dizerem é que não tem uma grande diversidade de estilos musicais.
Se você está interessado em testá-lo, pode conferir a demonstração no Huggingface, ou ir ao Github deles se quiser executá-lo você mesmo.
Finalização
Espero que você tenha gostado das notícias desta semana. Se quiser receber as notícias toda semana, não deixe de entrar na nossa lista de e-mails abaixo.
Google street view visto por Nano Banana por Fofr no Twitter Nota: Este artículo fue traducido automáticamente con Claude Sonnet 4.5; la calidad puede verse degradada, especialmente en la terminología técnica.
Lanzamientos
GLM 4.7 Flash
Z.ai ha lanzado la versión más pequeña de su muy potente modelo GLM 4.7, llamado GLM 4.7 Flash.
El modelo es un modelo de mezcla de expertos de 30 mil millones de parámetros, lo que lo hace ideal para ejecutar localmente (si tienes >24GB de memoria CPU y GPU).

Su rendimiento es francamente ridículo para su tamaño.
Su puntuación verificada en SWE-Bench es mejor que Sonnet 3.6, el modelo que inició la revolución de la programación por vibra.
Esto significa que en aproximadamente un año, hemos sido capaces de comprimir un modelo de frontera en algo que muchas personas pueden ejecutar en casa en su propio hardware.
No solo tiene un buen rendimiento en benchmarks.
He comenzado a usar el modelo localmente, y es el primer modelo local que parece tener una comprensión intuitiva de cuándo usar herramientas para tareas del mundo real.
La mayoría de los modelos de código abierto que ejecuto necesitan ser suplicados para llamar a una herramienta, y cuando lo hacen tienden a llamarla solo una vez, incluso si falla o no se devuelve la información correcta.
GLM 4.7 Flash no tiene este problema, lo que lo hace extremadamente útil para tareas de agentes del día a día.
Puedo verlo reemplazando todo mi uso de IA no relacionado con programación en el futuro a medida que construya las herramientas y el arnés a su alrededor.
Si estás interesado en ejecutar o usar modelos locales, deberías estar obligado a probar GLM 4.7 Flash.
Si quieres ejecutarlo, recomendaría usar llama.cpp ya que es rápido y está soportado en todos los sistemas.
Revisión de código de Devin
La revisión de código en Github se siente anticuada ahora en la era de la IA, ya que la revisión de código se convierte en el mayor sumidero de tiempo para los humanos al programar.
La gente de Cognition, la compañía detrás de Devin, pensó lo mismo y ha creado su propia plataforma de revisión de PR impulsada por IA que están ofreciendo gratis en este momento, llamada Devin Review.
En lugar de listar archivos y cambios alfabéticamente o por número de línea, Devin Review los agrupa en términos de características lógicas para que puedas revisar rápidamente y ver todo el código relacionado justo al lado. También resume y explica lo que está haciendo el código. Puede señalar cosas potenciales que faltan y también reportar cualquier error que encuentre en esta vista.
También tiene otros extras agradables, como la visualización adecuada de cuando el código es movido. Normalmente en GitHub, solo ves código siendo eliminado y luego un nuevo fragmento aparece en otro lugar en otro archivo que es exactamente el mismo código duplicado, pero no ves ninguna indicación de que esas dos cosas son idénticas o están vinculadas de alguna manera. En Devin, te muestra la relación entre este código, lo que hace muy fácil ver cuándo las cosas son refactorizadas.
Hay muchas herramientas tratando de revolucionar el espacio de revisión de código en la era de la IA, pero todas ellas previamente han estado acopladas a GitHub. Devin Review es la primera que he visto que parece ofrecer un enfoque más moderno para la revisión de código, y espero ver muchas más compañías y productos como este en el futuro.
Noticias Rápidas
Qwen3 TTS
Qwen ha tenido su propio modelo de texto a voz durante un tiempo, pero era de código cerrado y tenías que pagar a través de su API para poder usarlo. Eso fue hasta esta semana, cuando liberaron como código abierto su modelo Qwen3 TTS.
**
En términos de calidad de voz y claridad puras, no está al mismo nivel que Eleven Labs o Chatterbox TTS. Pero donde sí sobresale es en el control emocional de la voz. Puedes dar una descripción de texto del hablante y la forma en que habla, y luego también una descripción de la manera en que te gustaría que se describiera el texto que estás pasando al modelo. Esto le permite ser uno de los modelos de texto a voz más expresivos que existen, que ahora puedes ejecutar tú mismo en casa.
Viene en dos tamaños, 600 millones de parámetros y 1.7 mil millones de parámetros, ambos factibles de ejecutar en dispositivos edge aunque no siempre en tiempo real. Puedes probarlo ahora mismo en Huggingface.
Habilidades de Generación de Video
Las habilidades (skills) son archivos markdown que permiten a un LLM aprender fácilmente nuevos conceptos.
Usualmente, estos se relacionan con código o alguna otra tarea basada en texto.
Esta semana, sin embargo, recibimos dos nuevas habilidades creadas por la comunidad que son para generación de video con LLMs, siendo las habilidades de Remotion y Manim.
Remotion es una biblioteca de animación basada en React, que es útil porque los LLMs ya conocen muy bien la programación en React.
Manim es una biblioteca de python que probablemente hayas visto antes, ya que es lo que 3Blue1Brown usa para animar sus videos.
Video hecho con la habilidad de Remotion
Si estás interesado en hacer videos o animaciones con LLMs, recomendaría agregar estas habilidades, ya que hacen que sea muy fácil hacerlo.
¿Suno en casa?
Suno ha estado en la cima del mundo de texto a canción con IA durante un tiempo, sin competidores reales especialmente en el mundo de código abierto.
Eso cambió esta semana, ya que un grupo de investigadores ha lanzado HeartMuLa (Heart Music Language model), que tiene una experiencia de creación de canciones similar a Suno y tiene una calidad comparable.
Antes, ninguno de los modelos de generación de música de código abierto podía hacer nada que yo considerara digno de escuchar, pero HeartMuLa es diferente. Es capaz de hacer canciones completas que son cohesivas, basadas en tu descripción de texto de las características de la canción.
También te permite ingresar las letras y la estructura de la canción.
El modelo completo de 7 mil millones de parámetros aún no ha sido lanzado, pero han liberado el modelo de 3 mil millones de parámetros, que para mí suena similar a Suno V3.
El consenso general parece ser que es bastante bueno, aunque una desventaja que he visto que la gente dice es que no tiene una gran cantidad de diversidad para estilos de canciones.
Si estás interesado en probarlo, puedes ver la demostración en Huggingface, o ir a su Github si quieres ejecutarlo tú mismo.
Final
Espero que hayas disfrutado las noticias de esta semana. Si quieres recibir las noticias cada semana, asegúrate de unirte a nuestra lista de correo a continuación.
Google street view visto por Nano Banana por Fofr en Twitter