Descobrindo a Descobribilidade de Dados Gerados por IA nas Empresas em 2026

Litigation Minute: O Conteúdo Gerado por IA é Descoberto? O que as Empresas Precisam Saber em 2026

Ferramentas de inteligência artificial estão rapidamente transformando a maneira como o ESI (Informação Eletrônica Descoberta) é criado e armazenado, especialmente em relação ao conteúdo gerado por grandes modelos de linguagem. À medida que as empresas adotam ferramentas de IA generativa (GenAI) para redação, resumo, análise e outros usos comerciais, os tribunais estão lidando com a questão de se os dados da GenAI, como prompts (o que um usuário digita), saídas (o que a ferramenta de IA gera) e logs de atividade (dados sobre quando e como as ferramentas foram usadas) se enquadram nas obrigações tradicionais de descoberta.

Regras Tradicionais de Descoberta Ainda Governam Dados Não Convencionais

De acordo com a FRCP 26(b)(1), as partes podem obter descoberta de material não privilegiado que seja relevante e proporcional às necessidades do caso. Os tribunais deixaram claro que novas formas de ESI não são isentas apenas porque são novas. Os princípios tradicionais de descoberta se aplicam igualmente a fontes emergentes de ESI, incluindo dados da GenAI.

Decisões Iniciais sobre a Descoberta de Dados da GenAI

A decisão mais decisiva até agora sobre a descobribilidade dos dados da GenAI é In re OpenAI, Inc., Litigation por Violação de Direitos Autorais, onde o juiz magistrado compeliiu a produção de milhões de logs da GenAI, incluindo prompts de usuários e respostas do modelo, com a condição de que as referências de usuários fossem anonimizadas. O tribunal concluiu que esses logs eram relevantes e proporcionais às alegações dos autores de que os sistemas de IA do réu reproduziram obras protegidas por direitos autorais em suas saídas. A decisão enfatizou que preocupações com a privacidade podem ser mitigadas por meio de anonimização e ordens de proteção, e não barram categoricamente a produção de saídas de IA.

Em uma decisão separada no mesmo litígio, o juiz magistrado Wang negou um pedido para que o New York Times produzisse conteúdo de suas ferramentas internas de IA, considerando o pedido irrelevante e desproporcional. O New York Times argumentou que revisar aproximadamente 80.000 entradas levaria mais de 1.300 horas — um ônus substancial, dada a conexão limitada dos dados com as questões.

Relevância e Proporcionalidade Ainda Prevalecem

Essas decisões ressaltam dois conceitos-chave de descoberta:

  • 1) Relevância: Dados da GenAI são descobertos quando estão vinculados a uma reivindicação ou defesa.
  • 2) Proporcionalidade: Mesmo grandes volumes de dados da GenAI podem ser descobertos quando justificados pelas necessidades do caso, mas a proporcionalidade continua a ser uma consideração altamente relevante.

GenAI e E-Discovery na Prática

Dada a função rapidamente evolutiva da GenAI em todos os aspectos da vida cotidiana, as partes devem estar bem preparadas para abordá-la diretamente na descoberta. Como raramente é razoável ou proporcional preservar todos os dados da GenAI, é crítico desenvolver uma abordagem defensável que seja direcionada, razoada e bem documentada nas fases iniciais do engajamento.

Identificar Dados Relevantes da GenAI

Determine se quaisquer custodians de dados potencialmente relevantes usam ferramentas de GenAI, como as ferramentas são utilizadas e onde prompts e saídas são armazenados. Lembre-se de que logs de atividade relevantes podem existir separadamente, incluindo em plataformas de terceiros.

Preservar o que é Potencialmente Relevante

Quando o litígio é antecipado, preserve dados da GenAI que se relacionem a reivindicações ou defesas, especialmente onde os dados da GenAI possam conter afirmações factuais ou conteúdo substancial. As etapas variam por plataforma, mas podem incluir desativar configurações de exclusão automática, exportar históricos de chat, salvar trocas-chave em repositórios de documentos e coordenar com a TI para entender a retenção de logs e metadados. Os custodians não devem editar ou copiar seletivamente os dados da GenAI de maneiras que alterem o contexto e devem divulgar o uso de ferramentas pessoais ou baseadas em navegador para que essas fontes possam ser avaliadas. Medidas específicas de preservação dependerão do assunto e dos sistemas em uso; os litigantes devem estar preparados para supervisionar os esforços de preservação e fornecer instruções aos custodians e à TI do cliente durante o processo de retenção legal.

Negociar o Escopo Cedo

Se os dados da GenAI estiverem implicados, aborde relevância e proporcionalidade nos protocolos de ESI e nas discussões iniciais. Definições claras e limites direcionados podem prevenir investigações excessivas e reduzir custos e ônus.

Abordar a Confidencialidade

Leve a sério as preocupações com a privacidade. Sempre que possível, use ordens de proteção e protocolos de anonimização para gerenciar informações sensíveis enquanto atende às obrigações de descoberta.

Atualizar a Governança da Informação

Incorpore dados da GenAI nos inventários de ESI, procedimentos de retenção legal e políticas de retenção para melhorar a prontidão para descoberta. Políticas específicas sobre aceitação de uso da IA e confidencialidade dos dados também devem ser consideradas.

Conclusão

A descobribilidade dos dados da GenAI está rapidamente se tornando uma questão central na e-discovery. Os tribunais não estão criando isenções para os dados da GenAI; os princípios tradicionais de descoberta ainda se aplicam. Quando os dados da GenAI vão ao cerne de uma disputa, provavelmente serão descobertos, mas a proporcionalidade continua a ser um limite significativo. As empresas e suas equipes de litígios devem abordar os dados da GenAI cedo no planejamento de descoberta, trabalhar em estreita colaboração com especialistas em e-discovery para minimizar ônus e gerenciar proativamente as preocupações de privacidade.

Fique atento para um próximo Litigation Minute sobre a interseção dos dados da GenAI com o privilégio advogado-cliente e a doutrina do trabalho produzido.

More Insights

A Importância da IA Responsável: Riscos e Soluções

As empresas estão cientes da necessidade de uma IA responsável, mas muitas a tratam como um pensamento secundário ou um fluxo de trabalho separado. Isso pode levar a riscos legais, financeiros e de...

Modelo de Governança de IA que Combate o Shadow IT

As ferramentas de inteligência artificial (IA) estão se espalhando rapidamente pelos locais de trabalho, mudando a forma como as tarefas diárias são realizadas. A adoção da IA está ocorrendo de forma...

Acelerando Inovação com IA Ética

As empresas estão correndo para inovar com inteligência artificial, mas muitas vezes sem as diretrizes adequadas. A conformidade pode se tornar um acelerador da inovação, permitindo que as empresas se...

Riscos Ocultos da IA na Contratação

A inteligência artificial está transformando a forma como os empregadores recrutam e avaliam talentos, mas também introduz riscos legais significativos sob as leis federais de anti-discriminação. A...