Sobre mim

Meu nome é Davi de Paulo

Sou formado em Gestão de Tecnologia e Pós graduado em Ciência de Dados.

Atualmente trabalho como consultor de Tecnologia de forma remota.

Estou buscando uma oportunidade de trabalhar profissionalmente como Cientista de Dados para melhorar a tomada de decisão da empresa, através da construção de soluções usando dados.

Habilidades

Linguagens de Programação e Banco de Dados

  • Python com foco em análise de dados
  • Web scraping com Python
  • SQL para extração de dados
  • SQlite, Postgres, MySQL, MongoDB
  • R para modelagem estatística

Estatística e Machine Learning

  • Estatistica descritva ( localização, dispersão, assimetria, kurtosis, densidade
  • Algorítmos de Regressão, classificação, clusterização e “learn to rank
  • Técnicas de balanceamento dos dados, seleção de atributos e redução de dimensionalidade
  • Métricas de performance dos algorítmos ( RMSE, MAE, MAPE, Confusion Matrix, Precisão, Recall, Curva ROC, Curva Lift, AUC, Silhouette Score, DB-Index )
  • Pacotes de Machine Learning: Sklearn e Scipy

Visualização de Dados

  • MatplotLib, Seaborn, Plotly e Bokeh
  • PowerBi, Tableau, Metabase e Looker

Engenharia de Software

  • Git, Github, Gitlab, Cookiecutter, Virtual Enviroment e Docker
  • Streamlit, Flask, Python API's
  • Cloud Heroku, AWS, Amazon Google Cloud e Azure

Projetos em Ciência de Dados

Análise descritiva do sistema de compartilhamento de bicicletas de Chicago

Neste projeto, foi executado uma análise exploratória do sistema compartilhado de bicicletas na cidade de Chicago. Através de linhas de código, respondi perguntas interessantes ao computar estatísticas descritivas.

Através de scripts de Python, onze perguntas foram respondidas e tabelas geradas usando funções do MatplotLib.

As ferramentas utilizadas

  • Git, Gitlab e Github
  • Python, Pandas, Matplotlib e Seaborn

Projeto de Machine Learning para a previsão de vendas de uma rede de farmácias

Neste projeto, foram executadas análises descritivas em um conjunto de dados referentes as vendas de uma rede de farmácia. Aplicando algorítimos de Machine Learning, podemos ter uma previsão do valor das vendas nos meses subsequentes.

Análises de gráficos, que demonstram novas hipóteses e mudanças de paradigmas em relação o que se espera de um conjunto de dados desta natureza.

As ferramentas utilizadas

  • Git, Gitlab e Github
  • Python, Pandas, Matplotlib, Scipy, Logistic Regression, Random Forest, XGBoost e Seaborn

Formação de preços - House Flipping

Neste projeto, foram executadas análises descritivas em um conjunto de dados referentes aos valores de imoveis na cidade de Seattle. Aplicando análises descriptivas, nosso objeetivo é ajudar ao CEO encontrar oportunidades de negócio no setor imobiliário.

Análises de gráficos, que demonstram novas hipóteses e mudanças de paradigmas em relação o que se espera de um conjunto de dados desta natureza.

As ferramentas utilizadas

  • Git, Gitlab e Github
  • Python, Pandas, Matplotlib, Streamlit, Heroku

Entrar em contato

Sociais