considerado como a próxima grande coisa, uma análise preditiva é tudo definido para dominar a paisagem de análise avançada nos próximos anos. Analytics India Salary Study 2017 conducted by the AnalytixLabs & Analytics India Magazine (AIM) reveals that Advanced analytics / Predictive modeling professionals are better paid as compared to their peers.,
Salário Anual em Lacs
Fonte: AnalytixLabs & OBJETIVO
Então, vamos entender em detalhes como construir um modelo de previsão e saber mais importantes algoritmos para ser aprendido em análise Preditiva.
a análise preditiva é um ramo da análise avançada de dados que envolve o uso de várias técnicas como a aprendizagem de máquinas, algoritmos estatísticos e outras técnicas de mineração de dados para prever eventos futuros com base em dados históricos.,
O modelo é então aplicado aos dados atuais para prever qual seria o próximo curso de ação ou sugestão para o resultado.
existem vários algoritmos disponíveis nas categorias de mineração de dados, aprendizagem de máquinas e estatísticas quando você monta seu modelo de análise preditiva. Ao explorar os dados, torna-se mais fácil tomar mais decisões.como construir um modelo preditivo?,
a Construção de um modelo preditivo é simples:
- Obter dados a partir de fontes diferentes a partir de qualquer ferramenta de ETL
Exemplo: consulte íris de dados – https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data
- Dividir o conjunto de dados em duas partes (amostra e verificação de dados)
Criar Dados de Exemplo:
Construir um modelo a partir da amostra de dados que fornece a informação sobre as espécies de flores e suas medidas.,ariable estamos tentando prever)
em Geral, existem muitos preditivo de modelos de análise e elas podem ser classificadas em 2 tipos:
- Classificação – a previsão de um valor que é discreto através da categoria e finita sem fim
- Regressão prever um valor que é contínuo através numérico quantidade e infinito com o pedido:
O amplamente utilizados algoritmos de análise de dados são de regressão linear e redes neurais
de regressão Linear: O modelo de regressão simples pressupõe que a relação linear existente entre a entrada e as variáveis de saída.,rede Neural: uma rede neural inspirada no cérebro humano, uma rede de neurônios interconectados ou seja, é um conjunto de unidades computacionais, que leva um conjunto de Entradas e transfere o resultado para uma saída predefinida. As unidades computacionais são ordenadas dispostas em camadas para que as características de um vetor de entrada possam ser conectadas com a característica de um vetor de saída.
A ideia por trás disso é muitas vezes treinar redes neurais para modelar as relações dentro dos dados fornecidos.,
- crie um modelo baseado nas regras estabelecidas pelo algoritmo durante a fase de treinamento.
- Test the model on the verification data set – the data is fed to the model and the predicted values are compared to the real values. Assim, o modelo é testado para a precisão.
- Use o modelo em novos dados recebidos e tome medidas com base na saída do modelo.
outros algoritmos importantes:
modelos preditivos vêm em várias formas. Existem diferentes métodos que podem ser usados para criar um modelo, e a maioria deles estão sendo desenvolvidos o tempo todo.,
os modelos preditivos mais comuns são:
modelos lineares: é um algoritmo estatístico muito usado para construir um modelo de relação entre duas variáveis. Uma variável é chamada variável predictor cujo valor é coletado através de experimentos, enquanto a outra variável é chamada variável resposta cujo valor é derivado da variável predictor.árvores de decisão (também conhecidas como árvores de classificação e regressão ou CART): é um gráfico usado para representar possibilidades e seu resultado na forma de uma árvore., Os nós no grafo representam um evento ou escolha e as arestas do grafo representam as regras ou condições de decisão.
Support Vector Machines (SVMs) In Machine Learning: The support vector machine searchs the closest points and is known as “support vectors” ” the name is as a result of the real fact that points are like vectors which the simplest line “depends on” or is “supported by” the nearest points.
Uma vez que detecta os pontos mais próximos, desenha uma linha ligando – os fazendo subtração vetorial (Ponto a-ponto B)., A máquina de suporte vetorial então declara que a melhor linha de separação é a linha que bissecta-e é perpendicular à-linha de conexão.
ingênuo Bayes: é um algoritmo de aprendizagem de máquina Usado principalmente para problemas de classificação. É baseado no teorema de probabilidade de Bayes ou alternativamente conhecido como regra de Bayes ou lei de Bayes. Ele é usado para a classificação de texto que envolve conjuntos de dados de treinamento dimensional de alta.
é um algoritmo simples e conhecido por sua eficácia para construir rapidamente modelos e fazer previsões usando este algoritmo., Naive Bayes algorithm is primarily considered for solving text classification problem. Portanto, recomendo aprender o algoritmo completamente.,
Exemplos: spam, filtragem, classificação de artigos de notícias e sentimental análise
Bayes’ Teorema representado pela seguinte equação:
- : Probabilidade (probabilidade condicional) de ocorrência de um evento a dado que o evento é true
- e: Probabilidades de ocorrência de um evento e, respectivamente,
- : Probabilidade de ocorrência do evento a dado que o evento é true
Conclusão
Em um futuro próximo, o aumento da demanda para a análise Preditiva pode ver profissionais de outros fluxos de ingressar na onda., Se você quiser obter uma vantagem sobre seus pares e fazer parte desta nova avenida de crescimento, você pode explorar o nosso curso de Análise de negócios certificado NSE, bem como PGD em Ciência de dados.