Revisão de Documentos com IA: Transformando o eDiscovery

Revisão do Livro: “O Livro sobre Revisão de Documentos com IA”

A tese do livro é que “os computadores são capazes de revisar e classificar documentos melhor do que os humanos. E isso é um grande feito em eDiscovery.” O livro foca na revisão de documentos com IA, contrastando-a com a Revisão Assistida por Tecnologia e a codificação preditiva.

Revisão Assistida por Tecnologia vs. IA

Enquanto a Revisão Assistida por Tecnologia utiliza humanos para treinar a máquina, a IA é treinada e utiliza prompts para indicar o que deve ser procurado. Não utiliza “exemplos de treinamento.” Um exemplo de instrução fornecido é: “Todos os documentos onde um funcionário sugere que o preço dos produtos deve ser modificado.” Essas instruções funcionam como um Pedido de Produção.

Eficiência da Revisão com IA

O autor afirma que “a revisão impulsionada por IA pode encontrar facilmente mais de 95% dos documentos relevantes.” Os capítulos sobre como fazer isso são particularmente interessantes, pois o livro descreve um processo de revisão de relevância, passo a passo, utilizando amostragem aleatória para controle de qualidade.

Validação e Métricas

Para validação, o autor segue o caminho tradicional de classificar verdadeiros positivos, verdadeiros negativos, falsos positivos e falsos negativos, criando métricas como recall e precisão. Essas técnicas são frequentemente usadas em buscas por palavras-chave e aqui são aplicadas à IA. As fórmulas simples apresentadas são:

Recall = TP / (TP + FN)

Precisão = TP / (TP + FP)

O autor descreve a preparação de uma “chave de resposta” por um especialista no assunto, utilizando um termo chamado “matriz de confusão” para calcular as métricas. O processo aplica técnicas padrão, como amostrar a “pilha descartada”, para melhorar as consultas iterativas.

Importância da Validação

Em relação à defensabilidade, o autor enfatiza que “a única coisa que importa é como você valida os resultados e demonstra uma saída de alta qualidade.” A validação é fundamental, e o autor explica o que uma Revisão de IA defensável deve incluir, que é semelhante a qualquer revisão de Codificação Preditiva.

Processo Geral de Codificação Preditiva

  1. Identificar o conjunto de revisão.
  2. Treinar a máquina.
  3. Executar os documentos através do classificador.
  4. Avaliar os resultados.

Este processo é semelhante ao utilizado na IA.

Exemplos Práticos

O livro está repleto de exemplos concretos. Para o passo 1, sugere a remoção de documentos redundantes, obsoletos ou triviais, documentos sem texto extraído, arquivos de áudio, imagens e arquivos grandes, além da deduplicação. Essa abordagem é clássica na revisão de documentos.

Pré-Validação e Refinamento de Prompts

O autor também sugere uma “pré-validação,” que consiste em rodar prompts contra uma amostra aleatória antes de aplicá-los ao conjunto completo de dados. Um especialista revisa os “resultados” para determinar recall e precisão, oferecendo um benchmark comparável ao que é chamado de “riqueza.” A pré-validação também é apresentada como uma medida de economia de custos.

Os prompts podem ser refinados por critérios de inclusão ou exclusão. Exemplo de critério de inclusão: “qualquer discussão sobre qualificações na contratação deve ser considerada relevante.” Critério de exclusão: “qualquer discussão sobre a contratação de pessoas que não sejam treinadores ou gerentes deve ser considerada não relevante.”

Opções de Revisão com IA

O autor discute a revisão total com IA, mas também apresenta opções como “Revisão Linear Impulsionada por IA,” na qual lotes são selecionados usando IA, e Revisão Híbrida IA/CAL, onde documentos-semente são revisados por IA.

Confidencialidade e Segurança

Um ponto importante destacado é que, se você não está pagando por um produto, você é o produto. O autor oferece perguntas a serem feitas ao fornecedor de IA para garantir a segurança.

More Insights

A Importância da IA Responsável: Riscos e Soluções

As empresas estão cientes da necessidade de uma IA responsável, mas muitas a tratam como um pensamento secundário ou um fluxo de trabalho separado. Isso pode levar a riscos legais, financeiros e de...

Modelo de Governança de IA que Combate o Shadow IT

As ferramentas de inteligência artificial (IA) estão se espalhando rapidamente pelos locais de trabalho, mudando a forma como as tarefas diárias são realizadas. A adoção da IA está ocorrendo de forma...

Acelerando Inovação com IA Ética

As empresas estão correndo para inovar com inteligência artificial, mas muitas vezes sem as diretrizes adequadas. A conformidade pode se tornar um acelerador da inovação, permitindo que as empresas se...

Riscos Ocultos da IA na Contratação

A inteligência artificial está transformando a forma como os empregadores recrutam e avaliam talentos, mas também introduz riscos legais significativos sob as leis federais de anti-discriminação. A...