Físicos usam técnica quântica para comprimir e decensurar o DeepSeek R1

O que acontece quando físicos quânticos decidem aplicar suas ferramentas matemáticas mais sofisticadas a um dos modelos de IA mais influentes da atualidade, criado sob rígida censura estatal? É exatamente isso que está em jogo no trabalho recente da Multiverse Computing com o DeepSeek R1.

Neste artigo, você vai entender como um grupo de cientistas afirma ter removido camadas de censura de um poderoso modelo de raciocínio, ao mesmo tempo em que o torna muito menor e mais eficiente. E, sobretudo, o que isso significa para a governança de IA, para o ecossistema Open Source e para o controle de informação em escala global.

ilustração

O experimento da Multiverse com o DeepSeek R1

Um grupo de físicos quânticos da Multiverse Computing, empresa espanhola especializada em técnicas de IA de inspiração quântica, afirma ter criado uma nova versão do modelo de raciocínio DeepSeek R1 sem a censura embutida pelos seus desenvolvedores chineses.

Esse modelo modificado foi batizado de DeepSeek R1 Slim. Segundo os pesquisadores, ele é cerca de 55% menor que o original e mantém um desempenho de raciocínio quase equivalente, ao menos nas avaliações que eles realizaram. O ponto mais sensível da proposta, porém, não é apenas a compressão: é a alegação de que a equipe conseguiu remover a censura oficial chinesa do modelo.

Para entender a relevância disso, é necessário olhar para o contexto regulatório em que o DeepSeek foi treinado e lançado na China, especialmente no que diz respeito a controle de conteúdo e alinhamento político.

Censura em modelos de IA na China

Empresas de IA baseadas na China operam sob um conjunto de regras e regulamentos específicos que exigem que o conteúdo gerado esteja alinhado com as leis nacionais e com os chamados “valores socialistas”. Na prática, isso significa que:

Como resultado, os desenvolvedores incorporam camadas de censura ao longo do processo de treinamento. Quando usuários perguntam sobre temas classificados como sensíveis, os modelos:

Esse comportamento já foi observado repetidas vezes em modelos chineses, sobretudo em prompts em língua chinesa, e vem sendo sistematicamente analisado por acadêmicos e por empresas internacionais que comparam a atuação de modelos treinados em diferentes ambientes regulatórios.

Como funciona a compressão quântica com redes de tensores

Para reduzir o tamanho do DeepSeek R1 e, ao mesmo tempo, ganhar controle granular sobre seu comportamento, a Multiverse Computing recorreu a uma abordagem matematicamente complexa, inspirada em técnicas da física quântica.

Redes de tensores como representação compacta

A base do método é o uso de redes de tensores (tensor networks). Na física, esse tipo de estrutura matemática é utilizado para representar sistemas quânticos com um número gigantesco de variáveis, de forma compacta. Trazendo para o contexto de IA, a ideia é semelhante:

Ao usar redes de tensores, a Multiverse afirma ter conseguido reduzir significativamente o tamanho do modelo, mantendo suas capacidades essenciais de raciocínio. Em outras palavras, um sistema de IA complexo passa a ser expresso de forma mais eficiente, consumindo menos memória e menos recursos computacionais.

Um mapa das correlações internas do modelo

Um componente central dessa abordagem é que, segundo os pesquisadores, as redes de tensores fornecem um tipo de “mapa” de todas as correlações presentes no modelo.

Com esse mapa, torna-se possível:

A promessa é de um grau de controle fino sobre o que o modelo faz, indo além de simples ajustes superficiais. Após o processo de compressão e edição, a Multiverse realiza um fine-tuning para que a saída do modelo comprimido fique o mais próxima possível da saída do modelo original, exceto nos aspectos intencionalmente modificados, como a censura.

Testando a remoção de censura no DeepSeek R1 Slim

Para avaliar se a técnica funcionava na prática, os pesquisadores da Multiverse criaram um conjunto de dados de teste focado em temas sensíveis. Esse conjunto incluía cerca de 25 perguntas sobre tópicos conhecidos por serem restritos em modelos chineses.

Entre os exemplos citados estão:

Essas perguntas são típicas de cenários em que a censura costuma se manifestar de forma clara. Nos modelos alinhados às diretrizes chinesas, é comum receber respostas evasivas ou diretamente bloqueadas nesses casos.

Comparação com o modelo original e uso do GPT 5 como juiz

O time da Multiverse testou as respostas do DeepSeek R1 Slim contra as respostas do DeepSeek R1 original. Para avaliar o nível de censura em cada resposta, eles recorreram ao GPT 5 da OpenAI como uma espécie de árbitro imparcial.

O GPT 5 foi usado para:

De acordo com a Multiverse, o modelo modificado sem censura foi capaz de fornecer respostas factuais em nível comparável ao de modelos ocidentais, em contraste com o comportamento do DeepSeek R1 original nesses mesmos prompts sensíveis.

Compressão de modelos de IA além do DeepSeek

Esse trabalho com o DeepSeek R1 se insere em um esforço mais amplo da Multiverse para desenvolver tecnologias de compressão e manipulação de modelos existentes de IA, especialmente LLMs.

A maioria dos grandes modelos de linguagem atuais exige:

Segundo Roman Orús, cofundador e diretor científico da Multiverse, esses modelos são ineficientes do ponto de vista de representação. Um modelo comprimido poderia:

Esse tipo de otimização é particularmente relevante em um cenário em que o uso comercial de LLMs cresce rapidamente, ao mesmo tempo em que há limitação de oferta de hardware de ponta e preocupação crescente com o consumo energético de IA em larga escala.

Outras abordagens de compressão em modelos de linguagem

A indústria de IA já vinha se movendo em direção a modelos menores e mais eficientes antes da iniciativa da Multiverse. Há um conjunto de técnicas consolidadas para isso, cada uma com diferentes vantagens e trade-offs.

Modelos destilados e variantes como R1 Distill

Uma das estratégias mais conhecidas é a destilação de modelos. Nesse processo, um modelo grande e mais capaz serve como um professor que ensina um modelo menor, o aluno, a replicar seu comportamento:

No ecossistema do DeepSeek, há variantes como as séries R1 Distill que seguem justamente esse princípio. Porém, na prática, esses modelos destilados frequentemente:

Quantização e pruning

Outras formas de compressão bastante usadas são:

Essas técnicas podem gerar ganhos significativos de eficiência, mas, como observa Maxwell Venetos, engenheiro de pesquisa em IA na Citrine Informatics, é muito desafiador comprimir grandes modelos sem perda de desempenho perceptível.

Na visão de Venetos, a maioria das estratégias tradicionais precisa equilibrar de forma tensa tamanho versus capacidade. O que torna a abordagem de inspiração quântica interessante é justamente o uso de uma matemática mais abstrata para reduzir redundâncias com maior precisão, potencialmente evitando parte das perdas usuais.

Remoção seletiva de vieses e controle granular em LLMs

Os pesquisadores da Multiverse afirmam que sua abordagem baseada em redes de tensores não serve apenas para compressão. Ela também abriria caminho para manipular modelos em nível granular, o que inclui:

No caso do DeepSeek R1 Slim, a aplicação mais evidente foi a tentativa de remover a censura imposta pelas autoridades chinesas ao modelo original. Porém, a mesma lógica poderia ser usada para:

A Multiverse projeta que, no futuro, poderá comprimir e editar todos os modelos Open Source mainstream, criando versões mais leves com comportamentos customizados, inclusive com perfis distintos de alinhamento e moderação.

Impacto da censura chinesa no ecossistema global de IA

Thomas Cao, professor assistente de política tecnológica na Fletcher School da Tufts University, chama atenção para o papel que a censura chinesa já desempenha no ecossistema global de informação mediado por IA.

Segundo ele, as autoridades chinesas não apenas exigem que modelos incorporem mecanismos de censura, como essa exigência passa a moldar o ambiente global, uma vez que muitos dos modelos de IA Open Source mais influentes hoje são desenvolvidos na China.

Em outras palavras:

Acadêmicos vêm investigando esse fenômeno com mais rigor. Jennifer Pan, professora em Stanford, e Xu Xu, professor em Princeton, conduziram um estudo que examinou a censura imposta pelo governo em grandes modelos de linguagem. Eles observaram que modelos criados na China exibem taxas de censura significativamente mais altas, especialmente quando recebem prompts em chinês.

Perplexity e outras iniciativas de decensurar modelos chineses

O interesse em remover censura de modelos chineses não se limita à Multiverse. Há um movimento crescente de empresas tentando criar variantes mais abertas e menos restritas desses sistemas.

No início deste ano, a empresa de busca por IA Perplexity lançou sua própria variante sem censura do DeepSeek R1, chamada R1 1776. A abordagem adotada por eles foi bem diferente da de inspiração quântica.

Fine tuning tradicional com prompts censurados

No caso do R1 1776, a Perplexity utilizou uma estratégia de fine tuning tradicional:

Essa abordagem foca na camada de comportamento final do modelo, sem necessariamente tentar reescrever as estruturas internas em nível de correlação matemática. Já a Multiverse afirma atuar mais profundamente, alterando a própria representação interna por meio de sua ferramenta de compressão.

Limites e incertezas na remoção completa de censura

Apesar das alegações fortes em torno da remoção de censura, especialistas chamam atenção para os limites dessa ideia. Thomas Cao aponta que o governo chinês controla rigidamente a informação online desde os primórdios da internet no país, o que torna a censura:

Nesse cenário, dizer que um modelo foi completamente “decensurado” pode ser um exagero. Parte da censura está:

Cao ressalta que é muito difícil reverter esse processo integralmente usando apenas as respostas a um conjunto relativamente pequeno de perguntas como sinal. Mesmo com uma abordagem sofisticada como a de redes de tensores, há elementos da formação do modelo que podem permanecer opacos.

Essa crítica também serve como alerta para o mercado: claims de ter removido por completo qualquer tipo de censura, viés ou alinhamento precisam ser examinados com cuidado, tanto sob o ponto de vista técnico quanto regulatório.

O que a abordagem quântica sinaliza para o futuro dos LLMs

A experiência da Multiverse com o DeepSeek R1 Slim reúne três tendências importantes no ecossistema de IA:

Ao mesmo tempo em que abre possibilidades interessantes, essa linha de trabalho também traz desafios de governança:

Para profissionais que trabalham com LLMs, Machine Learning aplicado ou produtos de IA, acompanhar essas experiências é essencial. Elas indicam que o debate sobre censura, alinhamento e controle de conteúdo não ficará restrito às etapas de treinamento inicial, mas também passará por camadas avançadas de engenharia de modelos já treinados.

Conclusão: compressão, censura e o controle sobre modelos de IA

O caso do DeepSeek R1 Slim mostra como técnicas de inspiração quântica podem ser usadas para comprimir modelos de linguagem de forma agressiva e, ao mesmo tempo, oferecer novas ferramentas para intervir em seu comportamento interno.

De um lado, a Multiverse afirma ter criado uma versão do DeepSeek R1 cerca de 55% menor, com desempenho de raciocínio próximo ao original, e com a censura oficial chinesa removida. De outro, especialistas lembram que a censura em modelos chineses é um fenômeno multifacetado, embutido em dados, processos e alinhamento, o que torna qualquer promessa de remoção completa necessariamente limitada.

Enquanto outras empresas, como a Perplexity, exploram caminhos mais tradicionais de fine tuning para decensurar modelos, a abordagem baseada em redes de tensores sugere uma nova geração de ferramentas para comprimir, inspecionar e editar LLMs em profundidade. Se essas técnicas se consolidarem, veremos um cenário em que modelos de IA não serão apenas consumidos como caixas-pretas, mas também reescritos e reconfigurados com alto grau de precisão.

Para quem desenvolve, regula ou integra IA em produtos, a mensagem é clara: a fronteira entre modelagem, política de conteúdo e infraestrutura está ficando cada vez mais fluida. Entender como essas camadas interagem será fundamental para tomar decisões técnicas e estratégicas mais informadas nos próximos anos.

Lara Segatto

Leve essa tecnologia para sua empresa

A Zimo é especialista em implementar Agentes de IA que transformam operações. Se é isso que você precisa, peça um orçamento.

Solicitar Orçamento