Sobre mim

Meu nome é Matheus Guerreiro

Sou formado em Tecnologia em Análise e Desenvolvimento de Sistemas na Faculdade de Tecnologia do Estado de São Paulo, e trabalho como Cientista de Dados na área da Saúde.

Atualmente trabalho na área de P&D e Saúde Digital, na construção e apresentação de resultados dos projetos de forma clara e compreensível para todas as áreas da saúde envolvidas. Além disso, utilizo métodos de Data Science para desenvolver indicadores e soluções que aprimorem os produtos e serviços da empresa. Colaboro ativamente com as equipes para garantir que os projetos de ciência de dados estejam alinhados com as metas e objetivos de negócios e crio soluções inovadoras que fornecem resultados tangíveis no campo da ciência de dados.

Trabalho com projetos pessoais e profissionais sobre Ciência de Dados, para adquirir experiência na solução de problemas de negócio e domínio sobre as ferramentas de análise de dados.

Estou buscando oportunidades de trabalhar profissionalmente como Cientista de Dados para melhorar a tomada de decisão da empresa, através da construção de soluções usando dados.

Habilidades

Linguagem de Programação e Banco de Dados

  • Python com foco em análise de dados.
  • Web Scraping com Python.
  • SQL para extração de dados.
  • R para análise de dados e modelagem estatística.
  • Banco de Dados: SQLite, Postgree, MySQL, Oracle, MongoDB, BigQuery e Cassandra.

Estatística e Machine Learning

  • Estatística Descritiva (localização, dispersão, assimetria, kurtosis, densidade).
  • Algoritmos de Regressão, Classificação, clusterização e “learn to rank”.
  • Técnicas de balanceamento dos dados, seleção de atributos e redução de dimensionalidade.
  • Métricas de performance dos algoritmos (RMSE, MAE, MAP, Confusion Matrix, Precisão, Recall, Curva ROC, Curva Lift, AUC, Silhouette Score, DB-Index).
  • Pacotes de Machine Learning: Sklearn e Scipy.
  • Engenharia de Software

  • Git, Github, Gitlab, Cookiecutter, Virtual Environment e Docker.
  • Streamlit, Flask, Python APIs.
  • Cloud Render, AWS Amazon, Google Cloud Platform (GCP) e Microsoft Azure.
  • Visualização de Dados

  • Matplotlib, Seaborn, Plotly, Folium e Bokeh.
  • Power BI, Tableau, Metabase, MicrosTrategy, QlikSense e Looker.
  • Experiências Profissionais

    5+ Projetos completos de Ciência de Dados

    Construção de soluções de dados para problemas de negócio, próximos dos desafios reais das empresas, utilizando dados públicos de competições de Ciência de Dados, onde abordei o problema desde a concepção do desafio do negócio até a publicação do algoritmo treinado em produção, utilizando ferramentas de Cloud Computing.

    +4 anos como Analista de Dados e +1 ano como Cientista de Dados

    Construção de soluções de dados para tomada de decisões estratégicas, que envolvem a coleta, extração, compilação, processamento, validação e interpretação dos dados para análise, criação de relatórios e indicadores para liderança.

    Meu trabalho em ciência de dados proporciona insights valiosos e soluções fundamentais para impulsionar os resultados para o time de negócios. Com habilidades especializadas em engenharia e manipulação de dados, aliadas ao poder do machine learning, estou capacitado a potencializar a tomada de decisão estratégica. Meu objetivo é gerar impacto real por meio de análises inteligentes e impulsionar o sucesso dos negócios com resultados concretos.

    Projetos em Ciência de Dados

    Rossmann Sales Prediction

    Projeto de previsão de vendas de todas as unidades da Rossmann, para investimento de reforma para as próximas 6 semanas.

    As ferramentas utilizadas foram:

    • Python, Pandas, Numpy, Seaborn, Scikit-Learning, Scipy e Boruta.
    • Anaconda e Jupyter Notebooks.
    • Machine Learning com XGBoost Regressor.
    • Render Cloud.
    • Flask API
    • Telegram Bot API

    Construção de um Programa de Fidelidade com Clusterização de Clientes

    Foi utilizado neste projeto: Python, Estatística e técnicas não-supervisionadas de Machine Learning, para segmentar um grupo de clientes com base em suas características de performance de compra, a fim de selecionar grupos de clientes para formar um programa de Fidelidade com o objetivo de aumentar a receita da empresa. E o resultado dessa solução, caso fosse implementada, seria de US$ 15MM de dólares de receita anual.

    As ferramentas utilizadas foram:

    • Git, Gitlab e Github.
    • Jupyter Notebooks.
    • K-means, Hierarquical Clustering, DBScan.
    • AWS Cloud (EC2, S3, Postgree, SQLite)
    • Metabase Visualization

    Identificação de Imóveis para compra e revenda a fim de maximizar o lucro

    Identificação de imóveis abaixo do preço médio de venda e definição do preço ideal de revenda, a partir de uma análise exploratória de dados em Python.

    As ferramentas utilizadas foram:

    • Python, Pandas, Numpy e Seaborn.
    • Anaconda e Jupyter Notebooks.
    • Mapas interativos com Plotly e Folium.
    • Render Cloud.
    • Streamlit Python framework web

    Análise estatística de MaxDiff para Pesquisa de Mercado

    Criação de projeto de análise estatística avançada de MaxDiff, para a área de Consumer Insights, garantindo que o trabalho fosse feito internamente e trazendo uma economia de $900,00 USD por projeto para a empresa Nielsen, no ramo de Pesquisa de Mercado.

    As ferramentas utilizadas foram:

    • R/RStudio.
    • Microsoft Excel.

    Projeto de roteirização de pontos de venda

    Liderança na criação e condução do projeto de roteirização dos pontos de venda, utilizando métodos de manipulação de dados, geolocalização, e visualização de dados para a empresa Grupo Card.

    As ferramentas utilizadas foram:

    • Python, Pandas,e Geopandas.
    • Geopy, GoogleV3 e Bing Maps.
    • Mapas interativos com Folium.

    Contato

    Sinta-se à vontade para entrar em contato.