DeepSeek Pode ter Usado o Gemini Para Treinar seu Modelo

No momento, você está visualizando DeepSeek Pode ter Usado o Gemini Para Treinar seu Modelo

A empresa chinesa de inteligência artificial DeepSeek está novamente no centro de controvérsias, desta vez por alegações de que seu mais recente modelo, o R1-0528, foi treinado utilizando dados provenientes da família de modelos Gemini, da Google. Especialistas e desenvolvedores identificaram semelhanças linguísticas e estruturais entre as saídas do R1-0528 e as respostas geradas pelo Gemini 2.5 Pro, sugerindo a possibilidade de uso de distilação — técnica que envolve o treinamento de um modelo menor com base nas saídas de um modelo maior e mais avançado.

Organização de TI

Sam Paech, desenvolvedor baseado em Melbourne, compartilhou evidências indicando que o R1-0528 utiliza expressões e construções linguísticas semelhantes às do Gemini 2.5 Pro. Além disso, outro desenvolvedor, conhecido pelo pseudônimo SpeechMap, observou que os “raciocínios” internos do modelo da DeepSeek se assemelham aos traços gerados pelo Gemini, fortalecendo as suspeitas de distilação.

Essa não é a primeira vez que a DeepSeek enfrenta acusações desse tipo. Em dezembro de 2024, desenvolvedores notaram que o modelo V3 da empresa frequentemente se identificava como ChatGPT, levantando suspeitas de que tenha sido treinado com logs de conversas do chatbot da OpenAI. Posteriormente, a OpenAI afirmou ter encontrado evidências de que a DeepSeek utilizou distilação para treinar seus modelos, violando os termos de serviço da empresa.

A distilação, embora comum no desenvolvimento de IA, é proibida pelos termos de uso da OpenAI quando aplicada a saídas de seus modelos para treinar sistemas concorrentes. A prática levanta questões éticas e legais, especialmente quando envolve a utilização de dados proprietários sem autorização.

Em resposta às suspeitas de uso indevido de seus modelos, empresas como OpenAI e Google têm implementado medidas de segurança adicionais. A OpenAI, por exemplo, passou a exigir verificação de identidade para acesso a determinados modelos avançados, enquanto a Google começou a resumir os traços gerados por seus modelos na plataforma AI Studio, dificultando a replicação por terceiros.

A DeepSeek, por sua vez, lançou o modelo R1-0528 sob licença MIT, destacando melhorias em matemática, programação e raciocínio lógico, além de uma redução nas alucinações — erros nas informações geradas. A empresa posiciona o R1-0528 como um concorrente direto dos modelos o3 da OpenAI e Gemini 2.5 Pro da Google, reforçando a crescente competição no campo da inteligência artificial.

Enquanto as alegações não são confirmadas oficialmente, o caso ressalta os desafios enfrentados pela indústria de IA em relação à propriedade intelectual, ética no treinamento de modelos e a necessidade de regulamentações claras para práticas como a distilação.

Gemini

Deixe um comentário