News
Anthropic Stops AI Espionage
This week Anthropic announced they have disrupted a large-scale AI cyberattack, the first of its kind.
The attackers, who Anthropic believe with “high certainty” were a Chinese state sponsored group, used a jailbroken version of Claude Code to target 30 entities around the world, including large tech companies, financial institutions, chemical manufacturing companies, and government agencies.
Jailbreaking an LLM means to bypass the safety measures and restrictions that are built into the model, allowing it to perform actions that it normally wouldn’t be allowed to do. This can include accessing sensitive information, performing unauthorized actions, or bypassing ethical guidelines. This is usually done with sophisticated prompt engineering.
The attack, which occurred in mid September, utilized Claude Code with custom MCP servers and tools as the orchestrator for a larger system, allowing it to do reconnaissance, initial access, persistence, and data extraction phases all with minimal human interaction. According to Anthropic, Claude was able to do 80-90% of the tasks fully autonomously, with humans mostly being used in a supervisory role.
Anthropic released a full thirteen page report on the incident, which goes into detail how Claude was used to orchestrate these attacks.
Anthropic says they will work on their classifiers behind the scenes to detect this kind of behaviour earlier on, so that future attacks can be prevented.
Even with Anthropic beefing up their protections, we will only be seeing more of these attacks in the future, as other model providers roll out models of equal or greater strength.
This I can see is the main reason for being against open source AI. For instance, if these actors go and use a self hosted version of GLM 4.6, an open source model that is of about equal quality to Sonnet 4, which these hackers used (Sonnet 4.5 was released in late September), then the attacks would not be able to be “turned off” by anyone.
I am still all for open source AI and think its a net positive, but saying its entirely fault free is incorrect.
Releases
GPT 5.1
OpenAI has released an update to GPT 5, GPT 5.1.
This update is not focused on raw intelligence and benchmark scaling, but rather on the intangibles and more day to day qualities of the model.
The first highlight is the dynamic reasoning capabilities, something that it inherited from the GPT-5-Codex models.
This means that the model will think less for easy queries and more for complex ones.
10th percentile are the easiest questions, 90th the hardest. Y axis is tokens.
The next have to do with the model’s personality, which is now supposedly more friendly.
They have also shipped multiple new personality types that you can choose from.
Speaking of model outputs, the model should be more concise and clear with its responses, and is more steerable with system prompts. For instance, you can tell it to not use em dashes anymore and it will actually listen. This is mostly due to the model’s instruction following capabilities being improved.
They also released Mini and Codex variants of the model as well which seem to have similar characteristics.
I had previously said that GPT-5 was the strongest model out there right now, and this update provides a small but substantial bump to the model’s capabilities.
Quick Hits
Open AI Fights For User’s Data
OpenAI continues to fight the New York Times in court, as their lawsuit over data usage continues.
This week, The Times filed a request for 20 million ChatGPT conversations, despite not being narrowed down in any way for relevance for the case.
OpenAI is obviously fighting this, saying “courts do not allow plaintiffs suing Google to dig through the private emails of tens of millions of Gmail users irrespective of their relevance”.
Hopefully the judge sees this request as the ridiculous overstep of privacy that it is and denies the claim.
GPU Hyperscalers are in trouble
There has been a lot of talk recently on Twitter about GPU hyperscalers and the economics around them. Usually the commentary is from analysts and outsiders who are not directly involved in the space.
The main question is the economics, with 4 year depreciation cycles for the hardware, GPU hyperscaler’s margins are looking very thin, even with massive growth in AI and the future.
This week, one of the GPU providers, HotAisle, weighed in on the conversation, painting a grim picture of the economics for themselves and the rest of the industry.
Frontend Claude Skill
Anthropic has released a Claude skill that is made to prevent your frontends from looking like the usual AI UIs that we are used to seeing (purple gradients are everywhere now). Just drop this file into your Claude Skills folder and your frontends will get a free quality boost.

Finish
I hope you enjoyed the news this week. If you want to get the news every week, be sure to join our mailing list below.
From taha on Pintrest Nota: Este artigo foi traduzido automaticamente com Claude Sonnet 4.5; a qualidade pode estar reduzida, especialmente na terminologia técnica.
Notícias
Esta semana a Anthropic anunciou que interrompeu um ciberataque de IA em larga escala, o primeiro do tipo.
Os atacantes, que a Anthropic acredita com “alta certeza” serem um grupo patrocinado pelo estado chinês, usaram uma versão desbloqueada do Claude Code para atacar 30 entidades ao redor do mundo, incluindo grandes empresas de tecnologia, instituições financeiras, empresas de manufatura química e agências governamentais.
Desbloquear um LLM significa contornar as medidas de segurança e restrições que estão integradas no modelo, permitindo que ele execute ações que normalmente não seriam permitidas. Isso pode incluir acessar informações sensíveis, realizar ações não autorizadas ou contornar diretrizes éticas. Isso geralmente é feito com engenharia de prompt sofisticada.
O ataque, que ocorreu em meados de setembro, utilizou Claude Code com servidores MCP personalizados e ferramentas como orquestrador de um sistema maior, permitindo fazer reconhecimento, acesso inicial, persistência e fases de extração de dados, tudo com interação humana mínima. Segundo a Anthropic, Claude foi capaz de realizar 80-90% das tarefas de forma totalmente autônoma, com humanos sendo usados principalmente em um papel de supervisão.
A Anthropic divulgou um relatório completo de treze páginas sobre o incidente, que detalha como Claude foi usado para orquestrar esses ataques.
A Anthropic diz que trabalhará em seus classificadores nos bastidores para detectar esse tipo de comportamento mais cedo, para que ataques futuros possam ser prevenidos.
Mesmo com a Anthropic reforçando suas proteções, veremos apenas mais desses ataques no futuro, à medida que outros provedores de modelos lançam modelos de força igual ou superior.
Esta eu vejo como a principal razão para ser contra IA de código aberto. Por exemplo, se esses atores forem usar uma versão auto-hospedada do GLM 4.6, um modelo de código aberto que tem qualidade aproximadamente igual ao Sonnet 4, que esses hackers usaram (Sonnet 4.5 foi lançado no final de setembro), então os ataques não poderiam ser “desligados” por ninguém.
Ainda sou totalmente a favor de IA de código aberto e acho que é um benefício líquido positivo, mas dizer que é totalmente isenta de falhas está incorreto.
Lançamentos
GPT 5.1
A OpenAI lançou uma atualização para o GPT 5, o GPT 5.1.
Esta atualização não está focada em inteligência bruta e escalonamento de benchmarks, mas sim nos intangíveis e qualidades mais do dia a dia do modelo.
O primeiro destaque são as capacidades de raciocínio dinâmico, algo que herdou dos modelos GPT-5-Codex.
Isso significa que o modelo pensará menos para consultas fáceis e mais para consultas complexas.
O 10º percentil são as perguntas mais fáceis, o 90º as mais difíceis. O eixo Y são os tokens.
Os próximos têm a ver com a personalidade do modelo, que agora supostamente é mais amigável.
Eles também lançaram vários novos tipos de personalidade que você pode escolher.
Falando em saídas do modelo, o modelo deve ser mais conciso e claro com suas respostas, e é mais direcionável com prompts de sistema. Por exemplo, você pode dizer para não usar travessões mais e ele realmente ouvirá. Isso se deve principalmente às capacidades de seguir instruções do modelo terem sido melhoradas.
Eles também lançaram variantes Mini e Codex do modelo que parecem ter características semelhantes.
Eu havia dito anteriormente que o GPT-5 era o modelo mais forte disponível agora, e esta atualização fornece um aumento pequeno mas substancial nas capacidades do modelo.
Destaques Rápidos
OpenAI Luta Pelos Dados dos Usuários
A OpenAI continua a lutar contra o New York Times no tribunal, enquanto seu processo sobre uso de dados continua.
Esta semana, o Times apresentou uma solicitação de 20 milhões de conversas do ChatGPT, apesar de não serem reduzidas de forma alguma por relevância para o caso.
A OpenAI está obviamente lutando contra isso, dizendo que “os tribunais não permitem que os demandantes processando o Google vasculhem os e-mails privados de dezenas de milhões de usuários do Gmail independentemente de sua relevância”.
Esperançosamente, o juiz verá esta solicitação como o ridículo exagero de privacidade que é e negará a reivindicação.
Hyperscalers de GPU estão em apuros
Tem havido muita conversa recentemente no Twitter sobre hyperscalers de GPU e a economia em torno deles. Geralmente o comentário vem de analistas e pessoas de fora que não estão diretamente envolvidas no espaço.
A principal questão é a economia, com ciclos de depreciação de 4 anos para o hardware, as margens dos hyperscalers de GPU estão parecendo muito finas, mesmo com crescimento massivo em IA e no futuro.
Esta semana, um dos provedores de GPU, HotAisle, opinou sobre a conversa, pintando um quadro sombrio da economia para si mesmos e para o resto da indústria.
Skill Claude para Frontend
A Anthropic lançou uma skill Claude que foi feita para evitar que seus frontends pareçam com as UIs de IA usuais que estamos acostumados a ver (gradientes roxos estão em todo lugar agora). Apenas coloque este arquivo em sua pasta Claude Skills e seus frontends receberão um impulso gratuito de qualidade.

Conclusão
Espero que você tenha gostado das notícias desta semana. Se você quiser receber as notícias toda semana, certifique-se de se juntar à nossa lista de e-mails abaixo.
De taha no Pintrest Nota: Este artículo fue traducido automáticamente con Claude Sonnet 4.5; la calidad puede verse degradada, especialmente en la terminología técnica.
En resumen
- Claude Code se utiliza en una operación masiva de hackeo
- Se lanza GPT 5.1
- OpenAI pelea con el NYT por el uso de datos
- Los hiperscalers de GPU están en problemas
Noticias
Anthropic Detiene Espionaje con IA
Esta semana Anthropic anunció que han interrumpido un ciberataque a gran escala con IA, el primero de su tipo.
Los atacantes, quienes Anthropic cree con “alta certeza” que fueron un grupo patrocinado por el estado chino, utilizaron una versión crackeada de Claude Code para atacar 30 entidades alrededor del mundo, incluyendo grandes empresas tecnológicas, instituciones financieras, empresas de manufactura química y agencias gubernamentales.
Crackear un LLM significa eludir las medidas de seguridad y restricciones que están integradas en el modelo, permitiéndole realizar acciones que normalmente no estaría autorizado a hacer. Esto puede incluir acceder a información sensible, realizar acciones no autorizadas o eludir directrices éticas. Esto generalmente se hace con ingeniería de prompts sofisticada.
El ataque, que ocurrió a mediados de septiembre, utilizó Claude Code con servidores MCP personalizados y herramientas como el orquestador de un sistema más grande, permitiéndole hacer reconocimiento, acceso inicial, persistencia y fases de extracción de datos, todo con mínima interacción humana. Según Anthropic, Claude fue capaz de hacer el 80-90% de las tareas de forma completamente autónoma, con humanos siendo utilizados principalmente en un rol supervisor.
Anthropic publicó un informe completo de trece páginas sobre el incidente, que detalla cómo Claude fue utilizado para orquestar estos ataques.
Anthropic dice que trabajarán en sus clasificadores detrás de escena para detectar este tipo de comportamiento más temprano, de modo que futuros ataques puedan ser prevenidos.
Incluso con Anthropic reforzando sus protecciones, solo veremos más de estos ataques en el futuro, a medida que otros proveedores de modelos lancen modelos de igual o mayor potencia.
Esta veo que es la razón principal para estar en contra de la IA de código abierto. Por ejemplo, si estos actores van y usan una versión auto-hospedada de GLM 4.6, un modelo de código abierto que es de aproximadamente igual calidad que Sonnet 4, que estos hackers usaron (Sonnet 4.5 fue lanzado a finales de septiembre), entonces los ataques no podrían ser “apagados” por nadie.
Yo sigo estando totalmente a favor de la IA de código abierto y creo que es un positivo neto, pero decir que es completamente libre de fallas es incorrecto.
Lanzamientos
GPT 5.1
OpenAI ha lanzado una actualización a GPT 5, GPT 5.1.
Esta actualización no se enfoca en inteligencia bruta y escalamiento de benchmarks, sino más bien en los intangibles y cualidades más cotidianas del modelo.
El primer punto destacado son las capacidades de razonamiento dinámico, algo que heredó de los modelos GPT-5-Codex.
Esto significa que el modelo pensará menos para consultas fáciles y más para las complejas.
El percentil 10 son las preguntas más fáciles, el 90 las más difíciles. El eje Y son los tokens.
Los siguientes tienen que ver con la personalidad del modelo, que ahora supuestamente es más amigable.
También han lanzado múltiples nuevos tipos de personalidad que puedes elegir.
Hablando de salidas del modelo, el modelo debería ser más conciso y claro con sus respuestas, y es más dirigible con prompts del sistema. Por ejemplo, puedes decirle que no use rayas largas más y realmente escuchará. Esto se debe principalmente a que las capacidades de seguimiento de instrucciones del modelo han mejorado.
También lanzaron variantes Mini y Codex del modelo que parecen tener características similares.
Yo había dicho anteriormente que GPT-5 era el modelo más potente disponible ahora mismo, y esta actualización proporciona un pequeño pero sustancial impulso a las capacidades del modelo.
Breves
OpenAI Pelea Por los Datos de los Usuarios
OpenAI continúa peleando con el New York Times en los tribunales, mientras su demanda sobre el uso de datos continúa.
Esta semana, el Times presentó una solicitud de 20 millones de conversaciones de ChatGPT, a pesar de no estar limitadas de ninguna manera por relevancia para el caso.
OpenAI obviamente está peleando esto, diciendo que “los tribunales no permiten a los demandantes que demandan a Google escarbar en los correos electrónicos privados de decenas de millones de usuarios de Gmail independientemente de su relevancia”.
Esperemos que el juez vea esta solicitud como el ridículo exceso de privacidad que es y niegue la demanda.
Los Hiperscalers de GPU están en problemas
Ha habido mucha discusión recientemente en Twitter sobre los hiperscalers de GPU y la economía alrededor de ellos. Usualmente el comentario es de analistas y personas externas que no están directamente involucradas en el espacio.
La pregunta principal son los aspectos económicos, con ciclos de depreciación de 4 años para el hardware, los márgenes de los hiperscalers de GPU se ven muy delgados, incluso con un crecimiento masivo en IA y el futuro.
Esta semana, uno de los proveedores de GPU, HotAisle, opinó sobre la conversación, pintando un panorama sombrío de los aspectos económicos para ellos mismos y el resto de la industria.
Skill de Frontend de Claude
Anthropic ha lanzado un skill de Claude que está hecho para prevenir que tus frontends se vean como las interfaces de IA usuales a las que estamos acostumbrados a ver (los gradientes morados están por todos lados ahora). Solo suelta este archivo en tu carpeta de Claude Skills y tus frontends obtendrán un impulso de calidad gratis.

Conclusión
Espero que hayas disfrutado las noticias de esta semana. Si quieres recibir las noticias cada semana, asegúrate de unirte a nuestra lista de correo abajo.
De taha en Pintrest