Perspectivas

Shift Market Forces: IA generativa a serviço das seguradoras

Written by Solomon Philip | 15/ago/2023 22:00:00

Solomon Philip é diretor de inteligência de mercado da Shift Technology

O ChatGPT tomou de assalto o mundo da inteligência artificial. De repente, parecia que todos estavam experimentando essa nova e empolgante tecnologia, colocando-a à prova e tentando descobrir exatamente do que se tratava. Durante esse tempo, o ChatGPT se tornou quase sinônimo da categoria mais ampla de IA generativa e dos modelos de linguagem ampla (LLMs) que a impulsionam. Alguns especialistas chegaram a apontar a introdução do ChatGPT como um dos maiores pontos de inflexão tecnológica desde a descoberta da Internet. 

No entanto, apesar de todo o entusiasmo, é fundamental lembrar que, embora o ChatGPT seja muito promissor e tenha aplicações abrangentes, ele é apenas uma entrada no cenário muito maior da IA generativa. Tão importante quanto isso é o fato de que o uso da IA generativa, especialmente em um ambiente corporativo, ainda é relativamente novo. As seguradoras que buscam incorporar a IA generativa em sua lista de tecnologias devem ser aconselhadas a não fazer isso sozinhas. Essas organizações se beneficiarão do foco e do conhecimento especializado fornecidos por provedores de IA com experiência não apenas na criação de produtos de IA em escala, mas também com conhecimento sobre LLMs e como tirar o máximo proveito deles.

Então, como o setor de seguros pode aproveitar ao máximo os benefícios da IA generativa e, ao mesmo tempo, evitar as armadilhas?    

Tudo começa com os dados
Uma das coisas que torna os LLMs tão interessantes (e poderosos) é que eles já foram treinados em grandes quantidades de dados provenientes, em sua maioria, de fontes públicas, como Wikipedia, periódicos on-line, livros didáticos públicos, fóruns da Internet, como o Reddit, e muitos outros. Esses conjuntos de dados de bilhões de palavras dão a esses grandes modelos de linguagem a capacidade de executar muitas tarefas - com as instruções certas - imediatamente. Ao mesmo tempo, esse super poder pode ser um ponto fraco quando se trata de aplicar a IA generativa a casos específicos de uso comercial, especialmente seguros. 

Como esses LLMs foram treinados em fontes de dados genéricas e publicamente disponíveis, os dados específicos de seguros e caso a caso necessários para lidar com as nuances e a complexidade do setor, e muito menos com a sua empresa, simplesmente não existem. E é altamente improvável que um LLM pronto para uso tenha sido treinado em suas apólices de seguro e sinistros. Os modelos de LLM não treinados em dados específicos de seguros precisarão ter acesso a diversos conjuntos de dados de sinistros, apólices e operacionais com modelos de dados bem desenvolvidos para serem realmente eficazes nesse ambiente.

Além disso, muitos de seus dados internos estão em formatos diferentes dos usados para treinar esses modelos. Já descrevemos anteriormente como os LLMs foram treinados principalmente em textos de linguagem natural, como livros, enciclopédias e fóruns da Internet. Isso contrasta fortemente com os dados da seguradora, que geralmente são dados estruturados do sistema de gerenciamento de sinistros ou dados semi estruturados na forma de documentos, como relatórios, faturas ou estimativas, para citar apenas alguns. Embora essas fontes também contenham muita linguagem natural, seu significado é enriquecido pela forma como são estruturadas. Por exemplo, as informações geralmente estão dispostas em estruturas bidimensionais, como tabelas em faturas. Como esses grandes modelos de linguagem só funcionam em dados unidimensionais, algumas adaptações devem ser feitas para que essas fontes de dados sejam ingeridas com sucesso. As seguradoras precisam encontrar uma maneira de transformar os dados específicos da seguradora em um formato de linguagem mais natural no qual esses LLMs tenham sido treinados. Por exemplo, tabelas de documentos devem ser convertidas em um formato CSV antes de serem entregues ao modelo. Os provedores de IA avançados e especializados em alavancar a Inteligência Artificial terão essas técnicas já desenvolvidas e prontas para serem implantadas, pois muitas delas também eram necessárias para os tipos anteriores de modelos de linguagem. 

Fornecimento de contexto do setor de seguros
As seguradoras que adotam a IA generativa também precisam lidar com as limitações relacionadas ao comprimento do contexto do modelo. Embora os LLMs tenham sido treinados em bilhões de palavras para um único problema, eles normalmente têm apenas algumas milhares de palavras de “memória perfeita”, após o que seu desempenho cai substancialmente. Como essa memória é especificada na arquitetura quando os LLMs são treinados, ela não pode ser simplesmente ampliada conforme a conveniência do usuário. Embora algumas milhares de palavras possam parecer substanciais, devemos nos lembrar de que um documento típico de apólice de seguro, geralmente escrito em fonte de tamanho oito ou menor, já pode conter de 1 a 2 mil palavras por página. Suponhamos que também precisemos incluir todo o texto de outros documentos relacionados (faturas, atestados médicos, anotações médicas, cartas, correspondências etc.). Nesse caso, rapidamente preencheremos toda a memória do modelo. O que aumenta a complexidade é o fato de que o comprimento do contexto também deve ser usado não apenas para o prompt, mas também para a resposta. Em muitos casos, esses dois combinados podem se acumular rapidamente em vários milhares de tokens.

Uma maneira de superar essa limitação é escolher de forma mais inteligente o que incluir e o que não incluir na entrada do modelo. Para isso, é necessário um profundo conhecimento do processo de seguro e de tratamento de sinistros para garantir que as informações corretas para ajudar a resolver o problema sejam incluídas. Uma vez identificados, os dados incluídos também devem ser processados de uma forma facilmente digerível pelo modelo. Assim como no esforço inicial para criar o melhor conjunto de dados, a criação do contexto de seguro correto para o modelo exige uma combinação de conhecimento do setor e de IA. 

Os fornecedores de tecnologia que desenvolvem sistemas baseados em IA já resolveram esse problema por meio de várias soluções interativas, como aquelas capazes de resumir documentos jurídicos complexos, artefatos médicos, faturas e instrumentos financeiros de vários formatos e tamanhos. Os LLMs combinados com modelos que podem indexar grandes volumes de documentação podem servir como uma solução alternativa para os problemas de memória, pelo menos no curto prazo, até que os LLMs possam processar volumes maiores de dados sem comprometer o desempenho e a precisão. 

Conclusão
Embora a IA generativa e os modelos de linguagem de grande porte tenham demonstrado grande potencial e promessa para o setor de seguros, evitar as principais armadilhas é fundamental para que a tecnologia seja bem-sucedida quando aplicada a casos de uso no mundo real. Superar essas limitações requer uma combinação de conhecimento do setor e experiência em IA que aborde os problemas de dados e contexto da IA generativa específica do setor, bem como a capacidade de aplicar técnicas específicas para adaptar esses modelos para uso específico em seguros. Com a abordagem correta e o suporte de provedores especializados no treinamento de modelos de IA com conjuntos de dados de seguros, acesso a esses dados em volume e escala e a infraestrutura correta, as operadoras podem esperar maximizar essa nova inovação tecnológica que agora está ao nosso alcance.

Agradecimentos especiais a Arthur Hemmer por suas inestimáveis contribuições para esta postagem.

Para obter mais informações sobre como a Shift pode ajudá-lo a adotar a IA generativa para enfrentar os desafios exclusivos do setor de seguros, entre em contato conosco hoje mesmo.