Solomon Philip es Jefe de Inteligencia de Mercado de Shift Technology
ChatGPT revolucionó el mundo de la inteligencia artificial. De repente, parecía que todo el mundo estaba experimentando con esta nueva y emocionante tecnología, poniéndola a prueba y tratando de averiguar exactamente de qué se trataba. Durante este tiempo, ChatGPT se ha convertido casi en sinónimo de la categoría más amplia de IA generativa y de los grandes modelos lingüísticos (LLM) que la impulsan. Algunos expertos incluso han calificado la introducción de ChatGPT como uno de los mayores puntos de inflexión tecnológica desde el descubrimiento de Internet.
Sin embargo, a pesar de todo el bombo y platillo, es crucial recordar que, aunque ChatGPT es muy prometedor y tiene aplicaciones de gran alcance, es sólo una entrada en el panorama de la IA generativa, que es mucho más amplio. Y lo que es más importante, el uso de la IA generativa, especialmente en el ámbito empresarial, es todavía relativamente nuevo. Se recomienda a las aseguradoras que deseen incorporar la IA generativa a su cola tecnológica que no lo hagan solas. Estas organizaciones se beneficiarán del enfoque y la experiencia que aportan los proveedores de IA con experiencia no sólo en la creación de productos de IA a escala, sino también los conocedores de los LLM y de cómo sacarles el máximo provecho.
Entonces, ¿cómo puede el sector de los seguros aprovechar al máximo las ventajas de la IA generativa y evitar al mismo tiempo los problemas?
Todo empieza con los datos
Una de las cosas que hace que los LLM sean tan interesantes (y potentes) es que ya han sido entrenados con cantidades masivas de datos procedentes de fuentes públicas como Wikipedia, revistas en línea, libros de texto públicos, foros de Internet como Reddit y muchos otros. Estos conjuntos de datos de miles de millones de palabras proporcionan a estos grandes modelos lingüísticos la capacidad de realizar muchas tareas -con las indicaciones adecuadas- inmediatamente al lanzarlos a producción. Al mismo tiempo, esta superpotencia puede ser un punto débil cuando se habla de aplicar la IA generativa a casos de uso empresarial específicos, especialmente los seguros.
Debido a que estos LLM han sido entrenados en fuentes de datos genéricas y disponibles públicamente, los datos específicos de seguros y caso por caso necesarios para abordar los matices y la complejidad de la industria, por no hablar de su negocio, simplemente no están ahí. Y es altamente improbable que un LLM «out-of-the-box» haya sido entrenado en sus pólizas de seguros y siniestros. Los modelos LLM no formados en datos específicos de seguros necesitarán acceder a diversos conjuntos de datos de siniestros, pólizas y operaciones con modelos de datos bien desarrollados para ser realmente eficaces en este entorno.
Además, muchos de sus datos internos están en formatos diferentes de los utilizados para entrenar estos modelos. Anteriormente hemos descrito cómo los LLM se han entrenado principalmente en textos de lenguaje natural como libros, enciclopedias y foros de Internet. Esto contrasta claramente con los datos de las aseguradoras, que suelen ser datos estructurados procedentes del sistema de gestión de siniestros o datos semiestructurados en forma de documentos como informes, facturas o presupuestos, por nombrar sólo algunos. Aunque estas fuentes también contienen mucho lenguaje natural, su significado se ve enriquecido por la forma en que están estructuradas. Por ejemplo, la información suele presentarse en estructuras bidimensionales, como las tablas de las facturas. Como estos grandes modelos lingüísticos sólo funcionan con datos unidimensionales, hay que hacer algunas adaptaciones para ingerir con éxito estas fuentes de datos. Las aseguradoras tendrían que encontrar la manera de convertir los datos específicos de la aseguradora en un formato de lenguaje más natural en el que se hayan entrenado estos LLM. Por ejemplo, las tablas de los documentos deben convertirse a un formato CSV antes de entregárselas al modelo. Los proveedores de IA avanzada expertos en aprovechar la Inteligencia Artificial tendrán estas técnicas ya desarrolladas y listas para su despliegue, ya que muchas de ellas también eran necesarias para los tipos anteriores de modelos lingüísticos.
Contexto del sector asegurador
Las aseguradoras que adoptan la IA generativa también deben enfrentarse a limitaciones relacionadas con la longitud del contexto del modelo. Aunque los LLM se han entrenado con miles de millones de palabras para cualquier problema, normalmente sólo disponen de unos pocos miles de palabras de «memoria perfecta», tras lo cual su rendimiento disminuye considerablemente. Dado que esta memoria se especifica en la arquitectura cuando se entrenan los LLM, no puede ampliarse simplemente a conveniencia del usuario. Aunque unos pocos miles de palabras puedan parecer sustanciales, debemos recordar que un documento típico de una póliza de seguros, a menudo escrito en tamaño de fuente ocho o más pequeño, ya puede contener 1-2k palabras por página. Supongamos que además necesitamos incluir todo el texto de otros documentos relacionados (facturas, certificados médicos, notas del médico, cartas, correspondencia, etc.). En ese caso, llenamos rápidamente toda la memoria del modelo. Además, la longitud del contexto debe utilizarse no sólo para la pregunta, sino también para la respuesta. En muchos casos, estos dos elementos combinados pueden acumular rápidamente varios miles de tokens.
Una forma de superar esta limitación es elegir de forma más inteligente qué incluir y qué no en la entrada del modelo. Para ello es necesario conocer a fondo el proceso de tramitación de seguros y siniestros, a fin de garantizar que se incluye la información correcta para ayudar a resolver el problema. Una vez identificados, los datos incluidos también deben procesarse de forma que el modelo pueda digerirlos fácilmente. Al igual que ocurre con el esfuerzo inicial para crear el mejor conjunto de datos, crear el contexto de seguros adecuado para el modelo requiere una combinación de conocimientos del sector y de IA.
Los proveedores de tecnología que desarrollan sistemas basados en IA ya han resuelto este problema mediante diversas soluciones interactivas, como las capaces de resumir documentos jurídicos complejos, artefactos médicos, facturas e instrumentos financieros de diversas formas y tamaños. Los LLM combinados con modelos que pueden indexar grandes volúmenes de documentación pueden servir como solución a los problemas de memoria, al menos a corto plazo, hasta que los LLM puedan procesar mayores volúmenes de datos sin comprometer el rendimiento y la precisión.
Conclusión
Aunque la IA generativa y los grandes modelos lingüísticos han demostrado tener un gran potencial y ser prometedores para el sector de los seguros, es crucial evitar los principales problemas para que la tecnología tenga éxito cuando se aplique a casos de uso en el mundo real. Superar estas limitaciones requiere una combinación de conocimiento del sector y experiencia en IA que aborde los problemas de datos y contexto de la IA generativa específica del sector, así como ser capaz de aplicar técnicas específicas para adaptar estos modelos al uso específico de los seguros. Con el enfoque adecuado y el apoyo de proveedores expertos en el entrenamiento de modelos de IA con conjuntos de datos de seguros, el acceso a los mismos en volumen y escala, y la infraestructura adecuada en su lugar, las aseguradoras pueden esperar maximizar esta nueva innovación tecnológica ahora a nuestro alcance.
Un agradecimiento especial a Arthur Hemmer por su inestimable contribución a este artículo.
Para obtener más información sobre cómo Shift puede ayudarle a adoptar la IA generativa para hacer frente a los retos específicos a los que se enfrenta el sector de los seguros, póngase en contacto con nosotros hoy mismo.