A explosão dos Grandes Modelos de Linguagem (LLMs) impulsionou aplicativos transformadores em vários setores, principalmente para alimentar chatbots inteligentes e permitir a “conversação” com dados e documentos. Por trás desses casos de uso amplamente discutidos estão os recursos mais profundos dos LLMs. Propriedades como seleção de recursos, aprendizado com zero e poucos disparos e extração de relacionamentos com raciocínio semântico tornam os LLMs inestimáveis para o desenvolvimento de aplicativos analíticos e preditivos avançados, especialmente em P&D farmacêutico e pesquisa de evidências do mundo real (RWE). Essas propriedades subjacentes fazem com que os LLMs sejam mais do que simples modelos que preveem a probabilidade da próxima palavra possível em uma sequência; eles permitem que descubram padrões, inferem relacionamentos e apoiem processos complexos de tomada de decisão, possibilitando, em última análise, o desenvolvimento de ferramentas analíticas e de raciocínio.
Vamos nos aprofundar nesses recursos, explicando o que significam, por que são importantes e como estes podem ser aproveitados para solucionar desafios críticos na indústria farmacêutica.
Seleção de recursos: priorizando as variáveis certas
A seleção de recursos refere-se à identificação das variáveis (ou recursos) mais relevantes em um conjunto de dados para a criação de modelos preditivos. Os LLMs são excelentes na análise de vastos conjuntos de dados, aproveitando sua capacidade de detectar padrões e associações em dados textuais ou estruturados para destacar as variáveis mais importantes para análise.
Ela é crucial na criação de modelos de previsão de doenças. Considere, por exemplo, a detecção de doenças raras em populações subdiagnosticadas ou mal diagnosticadas. Os modelos preditivos tradicionais geralmente exigem uma curadoria manual trabalhosa de possíveis preditores de conjuntos de dados estruturados, como registros eletrônicos de saúde (EHRs). Ao aplicar os LLMs a anotações clínicas não estruturadas, os pesquisadores podem automaticamente revelar recursos como padrões de sintomas, biomarcadores, comorbidades, etc., para criar modelos mais precisos e interpretáveis para a previsão de doenças.
Da mesma forma, os LLMs podem analisar conjuntos de dados ômicos, como genômica e proteômica, para identificar os principais marcadores moleculares relacionados com a progressão da doença, simplificando o processo de identificação de alvos terapêuticos. Além disso, os LLMs podem ajudar na estratificação de pacientes, analisando conjuntos de dados multidimensionais para identificar subpopulações com base em fatores genéticos, clínicos ou demográficos, possibilitando estudos clínicos mais direcionados e eficazes.
Um estudo recente que sugere que o desempenho dos LLMs está no mesmo nível das técnicas tradicionais de seleção de recursos indica que a seleção de recursos com LLM é uma solução viável para acelerar a geração de hipóteses, reduzir o esforço manual e melhorar o desempenho dos algoritmos preditivos.
Aprendizagem Zero-Shot e Few-Shot: Fazendo mais com menos dados
A aprendizagem zero-shot permite que os LLMs executem tarefas para as quais não foram explicitamente treinados, enquanto a aprendizagem few-shot permite que os modelos generalizem tarefas com o mínimo de exemplos de treinamento. Esses recursos resultam do pré-treinamento dos modelos em grandes quantidades de texto, equipando-os com uma ampla compreensão contextual.
Os estudos de viabilidade de protocolos são um exemplo convincente de aprendizado zero-shot. O raciocínio zero-shot permite que os LLMs avaliem a viabilidade do protocolo a nível local, analisando dados históricos do local em relação aos requisitos do estudo, fornecendo percepções acionáveis mesmo sem treinamento prévio específico da tarefa.
O aprendizado few-shot pode ser fundamental na geração de documentos regulamentados, como protocolos de ensaios clínicos ou folhetos para pesquisadores. Tradicionalmente, a elaboração desses documentos exige um esforço significativo de redatores médicos e especialistas no assunto, seguido de revisões iterativas. Com alguns exemplos de projetos e requisitos de estudos, um LLM pode gerar rascunhos de protocolos, preenchendo previamente as seções com conteúdo contextualizado e, ao mesmo tempo, aderindo às normas regulamentares.
Da mesma forma, no contexto de relatórios de eventos adversos, os LLMs podem analisar um pequeno conjunto de casos de eventos adversos rotulados para gerar modelos de relatórios, garantindo a conformidade com as estruturas regulatórias e, ao mesmo tempo, capturando detalhes essenciais com eficiência. Os pesquisadores podem então refinar esses resultados, reduzindo significativamente o tempo de finalização.
Os LLMs podem acelerar a criação de documentos, reduzir os gargalos operacionais e economizar o tempo dos especialistas para atividades de maior valor. Muitas empresas farmacêuticas têm implementado LLMs para a criação de protocolos de estudo, com alguns relatórios indicando uma economia significativa de tempo e custo. Quando integrados a sistemas de registros compatíveis, como o Salesforce Life Sciences Cloud, os LLMs tornam-se colaboradores essenciais para possibilitar a criação de recursos como um construtor de protocolos de estudo digital e um projeto de estudo inteligente.
Extração de relações com raciocínio semântico: Mapeamento de conhecimento complexo
A extração de relacionamentos envolve a identificação e o mapeamento de conexões entre entidades, enquanto o raciocínio semântico permite que os LLMs deduzam o significado e os relacionamentos com base no contexto. Juntos, esses recursos permitem a extração de informações de dados organizados em gráficos de conhecimento (mapas estruturados de conceitos interconectados e seus relacionamentos) e a construção dos próprios gráficos de conhecimento.
A combinação de LLMs com gráficos de conhecimento apresenta o potencial de promover a integração e a análise de dados em ciências biológicas, dando suporte a aplicativos como descoberta de medicamentos e pesquisa de RWE. Os LLMs podem automatizar a construção de gráficos de conhecimento extraindo e organizando entidades e relacionamentos de fontes de dados estruturadas e não estruturadas, como publicações científicas, bancos de dados de ensaios clínicos ou sistemas EHR, garantindo um mapeamento abrangente de conceitos biomédicos. Um gráfico de conhecimento que capta as relações entre genes, caminhos, doenças e tratamentos pode ser uma fonte de dados para um LLM descobrir novas oportunidades de reaproveitamento de medicamentos, identificando conexões sutis entre o mecanismo de ação de um medicamento existente e dados emergentes sobre diferentes doenças.
Outro exemplo de aplicação da combinação de LLMs com gráficos de conhecimento é a geração de percepções a partir de fontes de dados heterogêneas, como perfis de toxicidade de moléculas, dados pré-clínicos, resultados de testes clínicos e literatura científica, para prever a probabilidade de sucesso de um ativo em desenvolvimento clínico. Esses recursos capacitam as empresas farmacêuticas a tomar decisões mais informadas e oportunas, impulsionando a inovação e a eficiência.
Construindo um futuro além dos chatbots
Embora o fascínio da IA conversacional domine o discurso convencional, as propriedades menos anunciadas dos LLMs oferecem um potencial transformador para P&D farmacêutico e RWE. Ao aproveitar a seleção de recursos, o aprendizado zero-shot e few-shot, e a extração de relacionamentos, esses modelos podem redefinir a forma como os dados são analisados, as decisões são tomadas e as terapias são desenvolvidas.
Para aproveitar totalmente esse potencial, as organizações devem:
- Investir em infraestrutura: A computação de alto desempenho e a governança de dados são essenciais para a implementação de soluções baseadas em LLM.
- Promover a colaboração interdisciplinar: Unir ciência de dados, experiência clínica e conhecimento regulatório é essencial para uma inovação significativa.
- Adotar uma abordagem iterativa: O aprendizado e a validação contínuos garantem que os modelos atendem aos rigorosos requisitos dos aplicativos farmacêuticos.
Ao adotar essas estratégias, as organizações farmacêuticas podem ir além dos aplicativos baseados em bate-papo para aproveitar o verdadeiro poder analítico e preditivo dos LLMs, impulsionando a inovação e melhores resultados para os pacientes. Saiba mais sobre o futuro da Healthcare & Life Sciences aqui.