Explicabilidade em ciência de dados. O que você sabe sobre o assunto?

A ciência de dados está presente em diversas tarefas no dia a- ia corporativo e até mesmo em âmbito pessoal. A explicabilidade é a qualidade daquilo que é explicável. Modelos estatísticos e/ou computacionais estão presentes por todas as partes, e mostram comportamentos e tendências com alta precisão. Mas como eles chegam a esses resultados? É o que a explicabilidade pode esclarecer.

Cada vez mais empresários e gestores de empresas recorrem à ciência de dados para otimizar as suas tomadas de decisão em função do seu poder preditivo. Mas não basta obter respostas para problemas. É preciso compreender os indicadores da análise feita e quais razões levaram às conclusões mostradas.

Neste artigo você vai entender o conceito de explicabilidade, os métodos que podem ser utilizados para realizá-la e a maneira como ela ajuda a compreender os resultados obtidos por meio das ciências de dados. Continue lendo para ficar por dentro do assunto.

O que é explicabilidade?

Segundo a definição do dicionário da Língua Portuguesa, a explicabilidade é a qualidade daquilo que é explicável. Trazendo para o contexto da ciência de dados, trata-se de uma área extensa e pouco explorada que ajuda a entender o processo de decisão dos métodos aplicados, como um complemento à própria decisão.

De forma resumida, a explicabilidade ajuda a entender por que o modelo realizou uma determinada análise e como ele chegou ao resultado entregue. A ciência de dados abrange diversos métodos computacionais, desde uma simples regressão linear aos mais complexos modelos de aprendizagem de máquina. A explicabilidade pode ser aplicada em todos eles.

Os métodos avançados de análise de dados são utilizados e vendidos com pouco ou nenhum controle sobre os processos internos que ocorrem. Mas podemos buscar a explicabilidade de maneira interna ou externamente para obter essa compreensão.

A explicabilidade interna

A explicabilidade interna consiste em abrir os métodos analíticos para observar sua funcionalidade e componentes internos. Dessa forma, é possível analisar e compreender os parâmetros utilizados pelo modelo. Assim, usamos esses mesmos parâmetros para analisar o próprio modelo e entender as razões pelas quais ele obtém a resposta apresentada.

A explicabilidade externa

A explicabilidade externa mantém o modelo utilizado fechado, sem acesso à parte interna dele. A técnica aqui consiste em comparar as entradas e saídas do modelo. Assim, localizamos as variáveis de entrada mais significativas para o resultado. Podemos aplicar as fórmulas de usando bibliotecas de estatística específicas.

Qual é o melhor método de explicabilidade?

Tanto a explicabilidade interna quanto a externa permitem conhecer melhor os dados gerados, porém, cada qual tem as suas especificidades. Assim, não há uma melhor do que a outra, mas sim, mais adequada para cada demanda.

A explicabilidade interna consegue mostrar mais detalhes sobre como as informações fluem e sua relação dentro dos métodos. Já a externa mantém um nível maior de abstração. Ela foca no aspecto funcional do método.

Em outro comparativo, a interna requer um grande conhecimento do funcionamento e dos parâmetros dos modelos utilizados. A externa exige grande domínio de métodos estatísticos e das suas nuances.

Quando a explicabilidade deve ser aplicada?

Como a explicabilidade é um processo de obtenção de informações adicionais sobre os resultados obtidos, ela é uma etapa final da fase de inteligência. Portanto, deve ser aplicada depois de aplicarmos os métodos de dados.

A etapa de explicabilidade deve ocorrer antes ou com a etapa de visualização do projeto. Isso porque fortalece o argumento com as justificativas das decisões tomadas pela inteligência computacional.

Com suporte da explicabilidade, fica mais fácil apresentar a lógica por trás da ciência de dados para diferentes departamentos dentro da empresa. Assim, é possível reforçar as justificativas para determinadas tomadas de decisão, ou então apresentar os argumentos que mostram por que é preciso fazer adequações, mudanças ou adotar determinadas estratégias.

Mas antes de utilizar a explicabilidade é preciso ponderar se ela é realmente necessária. Nem sempre a lógica por trás de um determinado modelo de análise de dados é de fato complexa. Em outras situações, trabalhamos com uma baixa quantidade de informações que, por si só, são autoexplicativas e não precisam de maiores detalhes.

Quando temos processos bem definidos de transformação das informações, não há necessidade de trazer justificativa para os resultados. É o que acontece, por exemplo, em processos ETL, modelos simples de previsão (como regressão linear) ou de clusterização (como por regras de negócio). Afinal, os resultados são muito intuitivos.

Assim, podemos reservar a explicabilidade para os métodos mais complexos. Ela é uma grande aliada, por exemplo, na análise de dados volumosos e na hora de explicar sobre a Inteligência Artificial e o machine learning. Isso porque ajuda a traduzir a matemática envolvida no processo de treinamento das máquinas, facilitando a compreensão da dinâmica e os resultados possíveis.

Como os métodos de explicabilidade são utilizados?

Em certas situações, uma análise visual dos dados pode ser suficiente para chegar à conclusão dos motivos do resultado entregue por um modelo. Entretanto, em casos com mais variáveis ou com um grande volume de informação, a análise visual seria impossível, o que leva à necessidade de uso da explicabilidade.

Ela pode ser aplicada por meio de métodos como K-Means, utilizando a biblioteca SciKit-Learn para Phyton. Contudo, a forma de utilização dos métodos de explicabilidade é muito vasta e depende de cada situação.

Problemas que envolvem métodos avançados e diversas etapas de inteligência precisam de estudos mais aprofundados de explicabilidade. Em todas as situações é possível obter o conhecimento tanto pelo método externo quanto o interno.

Perceba que em ambas as situações é preciso conhecimento técnico para aplicar a explicabilidade em ciência de dados. Afinal, conforme você viu, cada um dos dois métodos exige o domínio de determinados saberes para que possa ser aplicado de forma eficiente.

A explicabilidade facilita a compreensão dos modelos computacionais e estatísticos e dos resultados que eles entregam. Tudo isso também favorece a aplicação estratégica deles dentro das empresas, para solucionar problemas, atender demandas e trazer mais precisão e firmeza para as tomadas de decisão.

Mas não se esqueça de que nem sempre há necessidade de usar a explicabilidade para fazer análises. Portanto, cabe identificar essa necessidade de acordo com a complexidade do processo e conforme as demandas por justificativas para resultados, seja dentro da própria empresa ou para clientes.

Já que estamos falando sobre ciências de dados e predição, confira neste outro artigo como utilizar a análise de dados para a previsão de demanda e modelagem do futuro.

Continue navegando pelas categorias de conteúdos