Perspectives

Mettre l'IA générative au service des compagnies d'assurance

Rédigé par Solomon Philip | 16 août 2023 14:18:00

Solomon Philip, Head of Market Intelligence chez Shift Technology

Au début de l'année, ChatGPT a pris d'assaut le monde de l'intelligence artificielle. Soudain, tout le monde a eu l'impression d'expérimenter cette nouvelle technologie passionnante, de la mettre à l'épreuve et d'essayer de comprendre exactement de quoi il s'agissait. Pendant ce temps, ChatGPT est devenu presque synonyme de la catégorie plus large de l'IA générative et des grands modèles de langage (LLM) qui l'alimentent. Certains experts ont même présenté l'introduction de ChatGPT comme l'un des plus grands points d'inflexion technologique depuis la découverte de l'internet.

Cependant, malgré tout le battage médiatique, il est essentiel de se rappeler que si ChatGPT est très prometteur et a des applications très variées, il n'est qu'une entrée dans le paysage beaucoup plus vaste de l'IA générative. En outre, l'utilisation de l'IA générative, en particulier dans le cadre d'une entreprise, est encore relativement nouvelle. Les assureurs qui cherchent à intégrer l'IA générative dans leur pile technologique seraient bien avisés de ne pas faire cavalier seul. Ces organisations bénéficieront de l'attention et de l'expertise des fournisseurs d'IA expérimentés non seulement dans la création de produits d'IA à grande échelle, mais aussi dans la connaissance des LLM et de la manière d'en tirer le meilleur parti.

Alors, comment le secteur de l'assurance peut-il tirer pleinement parti des avantages de l'IA générative tout en évitant les écueils ?

Tout commence par les données
L'un des aspects qui rend les LLM si intéressants (et si puissants) est qu'ils ont déjà été entraînés sur des quantités massives de données provenant de sources essentiellement publiques telles que Wikipedia, les journaux en ligne, les manuels scolaires publics, les forums Internet tels que Reddit, et bien d'autres encore. Ces ensembles de données de milliards de mots donnent à ces grands modèles de langage la capacité d'effectuer de nombreuses tâches dès leur sortie de la boîte. En même temps, cette superpuissance peut être une faiblesse lorsqu'il s'agit d'appliquer l'IA générative à des cas d'utilisation spécifiques, en particulier dans le domaine de l'assurance.

Parce que ces LLM ont été formés sur des sources de données génériques accessibles au public, les données spécifiques à l'assurance et au cas par cas nécessaires pour aborder les nuances et la complexité du secteur, sans parler de votre entreprise, n'existent tout simplement pas. Et il est très peu probable qu'un modèle LLM prêt à l'emploi ait été formé à vos polices d'assurance et à vos demandes d'indemnisation. Les modèles LLM qui n'ont pas été formés aux données spécifiques à l'assurance devront avoir accès à divers sinistres, polices et ensembles de données opérationnelles avec des modèles de données bien développés pour être vraiment efficaces dans cet environnement.

En outre, la plupart de vos données internes se présentent sous des formats différents de ceux utilisés pour la formation de ces modèles. Nous avons souligné précédemment comment les LLM ont été principalement formés sur des textes en langage naturel tels que des livres, des encyclopédies et des forums Internet. Cela contraste fortement avec les données des assureurs qui sont souvent des données structurées provenant du système de gestion des sinistres ou des données semi-structurées sous la forme de documents tels que des rapports, des factures ou des devis, pour n'en citer que quelques-uns. Bien que ces sources contiennent également beaucoup de langage naturel, leur signification est enrichie par la façon dont elles sont structurées. Par exemple, les informations sont souvent présentées dans des structures bidimensionnelles telles que les tableaux dans les factures. Étant donné que ces grands modèles de langage ne fonctionnent que sur des données unidimensionnelles, il faut procéder à certaines adaptations pour ingérer ces sources de données avec succès. Les assureurs devraient trouver un moyen de rendre les données spécifiques à l'assureur dans un format de langage plus naturel sur lequel ces LLM ont été formés. Par exemple, les tableaux des documents doivent être convertis au format CSV avant d'être transmis au modèle. Les fournisseurs de services d'IA avancés qui savent tirer parti de l'intelligence artificielle disposent de ces techniques déjà développées et prêtes à être déployées, car nombre d'entre elles étaient également nécessaires pour les types précédents de modèles de langage.

Fournir le contexte du secteur de l'assurance
Les assureurs qui adoptent l'IA générative doivent également faire face aux limitations liées à la longueur du contexte du modèle. Alors que les LLM ont été formés sur des milliards de mots pour un seul problème, ils n'ont généralement que quelques milliers de mots de "mémoire parfaite", après quoi leurs performances chutent considérablement. Étant donné que cette mémoire est spécifiée dans l'architecture lorsque les LLM sont formés, elle ne peut pas être simplement étendue à la convenance de l'utilisateur. Si quelques milliers de mots peuvent sembler importants, il ne faut pas oublier qu'un document de police d'assurance typique, souvent écrit dans une police de taille huit ou plus petite, peut déjà contenir 1 à 2 000 mots par page. Supposons que nous devions également inclure tout le texte d'autres documents connexes (factures, certificats médicaux, notes du médecin, lettres, correspondance, etc.) Dans ce cas, nous remplissons rapidement la mémoire du modèle. La complexité est d'autant plus grande que la longueur du contexte doit également être utilisée non seulement pour le message, mais aussi pour la réponse. Dans de nombreux cas, ces deux éléments combinés peuvent rapidement atteindre plusieurs milliers de signaux.

L'un des moyens de surmonter cette limitation consiste à choisir plus intelligemment ce qu'il faut ou ne faut pas inclure dans les données d'entrée du modèle. Pour ce faire, il faut une connaissance approfondie du processus d'assurance et de gestion des sinistres afin de s'assurer que les informations correctes permettant de résoudre le problème sont incluses. Une fois identifiées, les données incluses doivent également être traitées de manière à être facilement assimilables par le modèle. Comme pour l'effort initial visant à créer le meilleur ensemble de données, la création du bon contexte d'assurance pour le modèle nécessite une combinaison de connaissances du secteur et de l'IA.

Les fournisseurs de technologie qui développent des systèmes basés sur l'IA ont déjà résolu ce problème grâce à diverses solutions interactives, telles que celles capables de résumer des documents juridiques complexes, des artefacts médicaux, des factures et des instruments financiers de formes et de tailles diverses. Les LLM combinés à des modèles capables d'indexer de vastes volumes de documentation peuvent servir de solution de contournement aux problèmes de mémoire, du moins à court terme, jusqu'à ce que les LLM puissent traiter des volumes de données plus importants sans compromettre les performances et la précision.

Conclusion
Bien que l'IA générative et les grands modèles de langage aient montré un grand potentiel et une grande promesse pour le secteur de l'assurance, il est essentiel d'éviter les principaux écueils pour que la technologie soit couronnée de succès lorsqu'elle est appliquée à des cas d'utilisation réels. Pour surmonter ces limites, il faut une combinaison de connaissances sectorielles et d'expertise en IA qui aborde les problèmes de données et de contexte de l'IA générative spécifique au secteur, ainsi que la capacité d'appliquer des techniques spécifiques pour adapter ces modèles à une utilisation dans l'assurance. Avec la bonne approche et le soutien de fournisseurs capables de former des modèles d'IA avec des ensembles de données d'assurance, l'accès à ces données en volume et à l'échelle, et la bonne infrastructure en place, les transporteurs peuvent espérer maximiser cette nouvelle innovation technologique qui est maintenant à notre portée.

Nous remercions tout particulièrement Arthur Hemmer pour sa précieuse contribution à cet article.

Pour plus d'informations sur la façon dont Shift peut vous aider à adopter l'IA générative pour relever les défis uniques auxquels est confronté le secteur de l'assurance, contactez-nous dès aujourd'hui.