A NVIDIA treinou IA com milhões de vídeos retirados do YouTube e Netflix para o site

A NVIDIA supostamente forneceu um design de IA generativa com 80 anos de vídeo gravado por dia, de acordo com descobertas da página online 404 Media. Para fazer isso, os funcionários da empresa removeram massivamente arquivos de plataformas como YouTube e Netflix, mesmo diante de possíveis preocupações com violação de direitos autorais.

Dados recebidos de violações de dados internos do Slack (plataforma de comunicação empresarial), e-mails corporativos e depoimentos de ex-funcionários. Todo o conhecimento seria usado para exercitar um estilo de IA ainda a ser publicado, como parte de uma tarefa chamada Cosmos.

Os funcionários supostamente usaram uma ferramenta de código aberto para fazer upload de vídeos do YouTube e conhecimento carregado em massa com 20 a 30 máquinas virtuais hospedadas na Amazon Web Services. O resultado é a extração de 80 anos de vídeos por dia, além do acúmulo de 30 milhões de URLs em apenas um mês.

Algumas das bases de conhecimento em vídeo usadas na tarefa deixam claro que elas estão disponíveis apenas para fins educacionais e não são licenciadas para publicidade. Embora a empresa tenha seus próprios pesquisadores, há mensagens de que o conteúdo seria seguido com motivações publicitárias. na estrutura da nova versão. O vice-presidente de pesquisa da NVIDIA, Ming-Yu Liu, um dos profissionais mais ativos em pesquisa de dados.

Um porta-voz da NVIDIA, contatado para o relatório original, disse que a empresa “respeita os direitos de todos os criadores de conteúdo e acredita que os modelos e nossos esforços são completamente consistentes com a letra e o espírito da lei de direitos autorais”.

A empresa também justifica o “uso justo” dos vídeos, dizendo que eles permitem que as pinturas sejam usadas para fins transformadores, como modelos educacionais, e afirma que “todos são livres para conhecer os fatos, ideias, conhecimentos e dados da fonte”. e use-os para criar suas próprias expressões.

O relatório original entrou em contato com o YouTube e a Netflix para obter sua posição sobre o caso. A empresa relacionada ao Google subsidiou os comentários do CEO Neal Mohan feitos em abril deste ano, quando ele perguntou sobre o uso de vídeos pela plataforma para o treinamento Sora da OpenAI. Na época, Mohan disse que isso seria uma “violação flagrante dos termos de serviço do YouTube”.

Um porta-voz da Netflix respondeu que a empresa de streaming não tinha acordo com a Nvidia para mover conteúdo e que os termos de serviço não permitiam a extração de dados em massa.

Mais uma vez, a reclamação questiona a transparência das grandes corporações de tecnologia nos modelos educacionais de IA, especificamente quando se trata de materiais protegidos por direitos autorais. Vale lembrar que a Nvidia e outras grandes corporações de tecnologia, como Apple e Salesforce, foram acusadas no passado de usar vídeos do YouTube na educação de IA.

Fonte: 404 Mídia

Deixe um comentário Cancelar resposta