Modelos Preditivos – O Futuro é Nosso

Modelos Preditivos – O Futuro é Nosso - modelos preditivos 1 - para-desenvolvedores, organizacao, inteligencia-artificial, digital-business, consumo, banner, aplicacoes -

Costumo brincar com alguns amigos que quanto mais ciência nós desenvolvemos, menos oráculos são necessários na vida. O achismo, como ferramenta do processo decisório moderno tem seu valor, mas cada vez mais perde espaço para o universo enorme de algoritmos que conseguem traçar e orientar as ações futuras do dia a dia corporativo. O leque de ferramentas começa a parecer com o cinto do Batman, aquele do seriado da infância dos meus pais, eu só vi reprise. A tentativa de prever o resultado de acontecimentos não ocorridos ainda é, para muitos, arte delegada ao universo místico.

Mas, vamos ver o que a Inteligência Artificial pode fazer por nós nesse meio. E falando de técnicas, um dos algoritmos amplamente usado é o SVM (Support Vector Machines), embora nem todos estejam familiarizados ou saibam exatamente como ele funciona.

Vamos lá, deixa eu tentar explicar um pouco…

O SVM é um método de aprendizado de máquina supervisionado, utilizado para realizarmos cálculos que envolvem regressão e classificação de dados. Seu conceito está baseado na teoria do aprendizado estatístico, também chamado de teoria VC (Vapnik-Chervonenkis). Ela é considerada uma das melhores teorias para estimação de parâmetros de amostras finitas, estudo de dependência funcional e de aprendizado preditivo.

A teoria de VC abrange quatro partes importantes na sua implementação:

  1. Teoria da Consistência dos processos de aprendizagem;
  2. Teoria da Taxa de convergência dos processos de aprendizagem;
  3. Teoria da Minimização do Risco Estrutural;
  4. Teoria da Otimização.

Modelos SVM têm a mesma forma funcional de uma rede neural. A flexibilidade, escalabilidade e velocidade do SVM são melhores do que de outros métodos tradicionais, o que fez com que caísse no gosto dos desenvolvedores de IA.

Em diversos casos, o SVM mostrou um bom desempenho utilizando um conjunto de dados que possuem diversos atributos, ainda que com uma amostra reduzida. Não existe um limite para o número de atributos que se pode usar no algoritmo e as únicas restrições que podemos encontrar são as de hardware.

Objetivo Final

O objetivo final do SVM é encontrar condições matemáticas para a escolha de uma função que separe os dados a serem aprendidos em problemas de categorização. Esta separação deve considerar o menor erro de treinamento, ao mesmo tempo em que deve maximizar a capacidade de generalização de um classificador, para o processo de aprendizagem supervisionada.

Vejamos: a abordagem tradicional para separar os dados é usar uma função, como um polinômio, e então ajustar seus parâmetros para separar os dados de treinamento, agrupando-os em uma das classes.

Durante a fase de treinamento, ao aumentar o grau do polinômio é possível reduzir o erro nos dados, o que levaria a um melhor aprendizado. No entanto, esta estratégia pode levar ao overfitting, resultando em uma capacidade reduzida de generalização nos dados futuros. Uma alternativa nos modelos tradicionais é a redução significativa do grau do polinômio, porém isto pode gerar um erro nos dados de treinamento, chamado underfitting.

O risco empírico pode ser reduzido à zero ao custo de uma função de decisão extremamente complexa. A distribuição dos dados de treinamento pode não ser complexa de ser classificada, porém, características como “ruídos” podem fazer com que o processo de aprendizado seja muito mais complexo que a realidade.

Na teoria de aprendizado estatístico existem condições matemáticas para a escolha de um classificador com desempenho desejado para dados de treinamento, minimizando o erro estrutural do processo, ou seja, evitando um overfitting ou um underfitting. A teoria da Minimização do Risco Estrutural formaliza o conceito de controle de complexidade e minimização do risco empírico.

Desta forma, se o objetivo é minimizar o erro da classificação, a máquina deve conseguir minimizar tanto o risco empírico quanto o termo de complexidade, o que nos permite chegar ao well-trained. Ou seja, o modelo ajustado para o conjunto de dados que será analisado.

Neste site, você pode encontrar um simulador de uma SVM para visualizar como funciona a criação e identificação das classes, fica bem mais fácil entender o que o algoritmo faz: https://cs.stanford.edu/~karpathy/svmjs/demo/

Com esse conceito da captura comportamental dos dados e da identificação precisa das características que compõem determinando grupo é possível traçar a linha que prevê as ações futuras de cada grupo de dados analisado. Em outros termos, transformamos a Inteligência Artificial na Mãe Dinah.

Forte Abraço e até a próxima!

  • facebook
  • googleplus
  • twitter
  • linkedin
  • linkedin
Previous «
Next »

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Destaque