OpenAI investiga se DeepSeek usou destilação ilegal de seus modelos GPT, em meio a acusações de roubo de dados e violação de propriedade intelectual. Desde que a startup chinesa de inteligência artificial (IA) DeepSeek causou impacto no Vale do Silício e em Wall Street com seus modelos de baixo custo, a empresa tem sido acusada de roubo de dados por meio de uma prática comum no setor.

Redação O Cafezinho
ocafezinho.com
3–4 minutos

A 'destilação' de IA da DeepSeek é roubo? OpenAI busca respostas sobre o avanço da China / SCMP
A 'destilação' de IA da DeepSeek é roubo? OpenAI busca respostas sobre o avanço da China / SCMP

OpenAI investiga se DeepSeek usou destilação ilegal de seus modelos GPT, em meio a acusações de roubo de dados e violação de propriedade intelectual


Desde que a startup chinesa de inteligência artificial (IA) DeepSeek causou impacto no Vale do Silício e em Wall Street com seus modelos de baixo custo, a empresa tem sido acusada de roubo de dados por meio de uma prática comum no setor.

A OpenAI afirmou ter evidências de que a DeepSeek usou “destilação” de seus modelos GPT para treinar os modelos de código aberto V3 e R1 a uma fração do custo que gigantes tecnológicos ocidentais gastam em seus próprios modelos, segundo reportagem do Financial Times na quarta-feira.

A OpenAI e a Microsoft, principal investidora da criadora do ChatGPT, começaram a investigar se um grupo ligado à DeepSeek extraiu grandes quantidades de dados por meio de uma interface de programação de aplicativos (API) no outono, informou a Bloomberg, citando fontes familiarizadas com o assunto.

A destilação é um método de treinar modelos menores para imitar o comportamento de modelos maiores e mais sofisticados. A prática é comum internamente em muitas empresas que buscam reduzir o tamanho de seus modelos enquanto oferecem desempenho semelhante aos usuários.

Isso, combinado com o fato de que o treinamento de modelos geralmente depende de muitos dados de origem questionável, levou alguns especialistas a questionar a sinceridade da OpenAI em suas acusações de violação de propriedade intelectual.

“A destilação viola a maioria dos termos de serviço, mas é irônico – ou até hipócrita – que as grandes empresas de tecnologia estejam denunciando isso. Treinar o ChatGPT com conteúdo da Forbes ou do New York Times também violou seus termos de serviço”, disse Lutz Finger, professor visitante sênior da Universidade Cornell e ex-funcionário de empresas de tecnologia como Google e LinkedIn, em um comunicado por e-mail. “O conhecimento é livre e difícil de proteger.”

O cofundador e CEO da OpenAI, Sam Altman (à direita), está ao lado (da direita para a esquerda) do presidente e CEO do SoftBank Group, Masayoshi Son, e do presidente executivo da Oracle, Larry Ellison, enquanto o presidente dos EUA, Donald Trump, anuncia uma nova iniciativa de IA chamada Stargate em 21 de janeiro / Foto: AFP
O cofundador e CEO da OpenAI, Sam Altman (à direita), está ao lado (da direita para a esquerda) do presidente e CEO do SoftBank Group, Masayoshi Son, e do presidente executivo da Oracle, Larry Ellison, enquanto o presidente dos EUA, Donald Trump, anuncia uma nova iniciativa de IA chamada Stargate em 21 de janeiro / Foto: AFP

A DeepSeek tem seus próprios modelos destilados que utilizam outros modelos de código aberto, como o Llama, da Meta Platforms, e o Qwen, do Alibaba Group Holding. O Alibaba é proprietário do South China Morning Post.

No entanto, a OpenAI alega que a DeepSeek usou o acesso à API dos modelos GPT de código fechado para destilá-los de forma não autorizada. A DeepSeek não admitiu o uso de destilação no treinamento de seus principais modelos, V3 e R1.

Com informações de South China Morning Post*



Comentário(s)

-Os comentários reproduzidos não refletem necessariamente a linha editorial do blog
-São impublicáveis acusações de carácter criminal, insultos, linguagem grosseira ou difamatória, violações da vida privada, incitações ao ódio ou à violência, ou que preconizem violações dos direitos humanos;
-São intoleráveis comentários racistas, xenófobos, sexistas, obscenos, homofóbicos, assim como comentários de tom extremista, violento ou de qualquer forma ofensivo em questões de etnia, nacionalidade, identidade, religião, filiação política ou partidária, clube, idade, género, preferências sexuais, incapacidade ou doença;
-É inaceitável conteúdo comercial, publicitário (Compre Bicicletas ZZZ), partidário ou propagandístico (Vota Partido XXX!);
-Os comentários não podem incluir moradas, endereços de e-mail ou números de telefone;
-Não são permitidos comentários repetidos, quer estes sejam escritos no mesmo artigo ou em artigos diferentes;
-Os comentários devem visar o tema do artigo em que são submetidos. Os comentários “fora de tópico” não serão publicados;

Postagem Anterior Próxima Postagem

ads

ads