Especialistas em segurança discutem o lançamento de Claude Fable 5

2026-06-12 00:00

← Voltar

Resumo Executivo

A Anthropic lançou o Claude Fable 5, um modelo da “classe Mythos” e “seguro para uso geral”. No entanto, a empresa reconhece que o modelo não é isento de riscos. Portanto, foi lançado com salvaguardas, o que significa que dúvidas específicas podem ser respondidas por Claude Opus 4.8. Além disso, a empresa está lançando Claude Mythos 5 para defensores da segurança cibernética e fornecedores de infraestrutura, que possui o mesmo modelo subjacente do Fable 5, mas com certas salvaguardas removidas. Abaixo, especialistas em segurança compartilham suas perspectivas sobre este lançamento. Margaret Cunningham, vice-presidente de segurança e estratégia de IA da Darktrace: Modelos de fronteira como Claude Fable 5 da Anthropic estão se tornando mais poderosos e mais amplamente acessíveis, enquanto os mecanismos destinados a controlá-los permanecem imperfeitos. Neste cenário, os defensores devem assumir a violação, assumir o acesso não aprovado e assumir que qualquer capacidade útil o suficiente para ser relevante acabará por ser utilizada pelos adversários. Embora seja importante prestar atenção às afirmações sobre as capacidades destes novos modelos, também vale a pena reconhecer que o quadro completo muitas vezes leva tempo a emergir.

Detalhes

Algumas capacidades podem revelar-se mais impactantes do que o inicialmente esperado, enquanto outras podem não corresponder às expectativas iniciais. Para as equipas de segurança, o desafio é avaliar estes desenvolvimentos em tempo real, muitas vezes antes de haver um amplo consenso sobre quais são as implicações práticas. Isso pode ser especialmente difícil num ambiente em rápida evolução, onde os benchmarks, as avaliações de capacidade e as comparações de modelos evoluem juntamente com o intenso interesse e concorrência da indústria. A mesma lógica se aplica aos guarda-corpos. As grades de proteção podem reduzir o uso indevido oportunista, mas não são uma defesa completa. Pessoas que são boas em jailbreaks já usam inundação de contexto, metáforas, enquadramentos literários e soluções alternativas iterativas para testar esses sistemas. Embora muito foco esteja no impacto ofensivo, a carga defensiva é mais preocupante. A defesa avançada ainda é maioritariamente humana e não automatizamos este nível de especialização em grande escala.

O gerenciamento de vulnerabilidades já estava atrasado antes da descoberta acelerada pela IA. O trabalho árduo não é apenas encontrar uma vulnerabilidade. É descobrir se isso é importante em um ambiente específico, se é um caso extremo apenas de laboratório, se a aplicação de patches prejudicará alguma outra coisa e como remediar sem interromper os negócios. A conclusão clara para as equipes de segurança é que não existe mais um “normal” universal para defender. Cada organização, dispositivo, usuário e agente se comporta de maneira diferente, o que significa que as equipes de segurança precisam entender o que é normal em seu ambiente específico e detectar quando algo muda. À medida que a IA acelera a descoberta e a exploração, a detecção comportamental, a análise baseada em anomalias e a contenção autônoma tornam-se essenciais. Os defensores precisam de estabelecer prioridades com base no contexto, conter as ameaças rapidamente quando a prevenção falha e construir defesas em torno da realidade do seu próprio ambiente, em vez de um modelo genérico de risco. Dana Simberkoff, Diretora de Risco, Privacidade e Segurança da Informação da AvePoint: O lançamento de Claude Fable é um grande marco, mas reforça uma verdade fundamental para as empresas: você não deve terceirizar sua segurança para o fornecedor de IA.

A verdadeira confiança na IA é construída na camada de dados, não no próprio modelo. Embora fornecedores como a Anthropic se concentrem em classificadores de segurança para diferenciar entre Mythos e Fable, os líderes empresariais devem se concentrar nos limites dos dados. Se uma organização carece de governança de dados rigorosa e visibilidade do ciclo de vida, a introdução de IA avançada e agente simplesmente expande o raio de alcance de seus dados internos supercompartilhados, obsoletos ou não classificados. Não é possível ter confiança na IA sem governança e proteção de dados rigorosas. Shane Barney, Diretor de Segurança da Informação da Keeper Security: Modelos avançados de IA agora são capazes de escanear sistemas, redes e códigos para identificar vulnerabilidades em velocidade e escala sem zumbido um analista pode igualar, e essa capacidade funciona nos dois sentidos. Nas mãos de um defensor, é um multiplicador de força para detecção e resposta a ameaças, mas nas mãos de um ator de ameaça, acelera o caminho do reconhecimento à exploração mais rápido do que a maioria das equipes de segurança consegue detectar e muito menos responder. Esses sistemas de IA contornam facilmente as defesas tradicionais “baseadas em atrito”, automatizando cadeias de ataque complexas e de várias etapas em escala, criando um influxo maciço de bugs de software que os mantenedores humanos não conseguem fazer a triagem com rapidez suficiente. Isso resulta em um gargalo operacional perigoso, deixando uma ampla janela de exposição para que os adversários explorem falhas conhecidas antes que uma correção possa ser implementada.

As equipas de segurança devem operar num tempo muito mais curto, assumindo que as vulnerabilidades públicas serão transformadas em armas dentro de horas, em vez de semanas. Os defensores devem implementar imediatamente caminhos de atualização automatizados para sistemas voltados para a Internet, tratar os patches de segurança de dependência como prioridades imediatas, em vez de itens de backlog, e manter registros robustos e autenticação multifator (MFA) para evitar movimentos laterais da rede se ocorrer uma violação. O Privileged Access Management (PAM) atua como um disjuntor interno, transferindo a defesa do perímetro para uma contenção interna estrita. Ao substituir contas administrativas vulneráveis e sempre ativas por acesso Just-in-Time (JIT) e armazenamento automatizado de credenciais, o PAM garante que um invasor automatizado não encontre direitos ou tokens persistentes para coletar. Em última análise, ao isolar sessões privilegiadas e usar análises comportamentais para encerrar instantaneamente anomalias de alta velocidade, o PAM neutraliza a velocidade e a autonomia da IA, prendendo a exploração em seu ponto de entrada antes que ela possa se espalhar pela rede da organização. As empresas que têm adiado o trabalho básico de segurança estão ficando sem pista. A superfície de ataque não mudou, mas as ferramentas disponíveis para explorá-la tornaram-se significativamente mais poderosas. Vulnerabilidades não corrigidas, permissões de acesso excessivas e lacunas na supervisão de contas privilegiadas são exatamente as condições que os ataques assistidos por IA são criados para encontrar e transformar em armas.