Sobre mim

Marcus Vinícius Ferreira Ramos Moraes

Meu nome é Marcus Vinícius (Vinícius), tenho 33 anos e trabalho como agente comercial no Banco do Brasil. Atualmente trabalho comercializando produtos bancários como créditos pessoa física e jurídica, seguridade, consórcio, investimentos, etc. para clientes da carteira do banco, de acordo com seu perfil.

Sou graduado em Análise e Desenvolvimento de Sistemas (término em Jan/2020) e pós-graduado em Estatística Aplicada (término em Dez/2021). Estudo Ciência de Dados desde 2019 através de vários cursos presentes na Data Science Academy, na Alura e Comunidade DS. Nesses cursos, aprendo a resolver problemas de negócio atráves dos conceitos fornecidos pela Ciência de dados, além do método cíclico de um projeto, desde a definição do problema até o deploy do modelo de Machine Learning.

Busco uma oportunidade de trabalhar profissionalmente como Cientista de Dados para auxiliar na melhoria nas tomadas de decisão de empresas através dos conhecimentos extraídos de dados.

Habilidades

Linguagens de programação e bancos de dados

  • Python com foco em análise de dados e Machine Learning
  • Web scraping com Python
  • SQL para extração de dados
  • R para modelagem estatística
  • Banco de dados SQLite, Postgres, MySQL

Estatística e Machine Learning

  • Estatística descritiva (localização, dispersão, assimetria, kurtosis, densidade)
  • Algoritmos Regressão, classificação, clusterização
  • Técnicas de balanceamento dos dados, seleção de atributos e redução de dimensionalidade
  • Pacotes de Machine Learning (Sklearn e Scipy)

Visualização de dados

  • Matplotlib, Seaborn, Plotly e Bokeh
  • Power BI, Tableau

Engenharia de Software

  • Git, Github, Docker
  • Streamlit

Experiências

7 projetos de Ciência de Dados: soluções de problemas próximos dos reais enfrentados pelas empresas no dia a dia, utilizando dados públicos do Kaggle ou fornecidos pelas próprias empresas.

  • 4 projetos de EDA (Exploratory Data Analysis)
  • 3 projetos de EDA + Machine Learning

6+ anos como agente comercial no Banco do Brasil (atual)

  • Comercialização de produtos bancários
  • Acompanhamento de métricas, visando atingir objetivos negociais semestrais e anuais
  • acompanhamento de processos técnicos internos

Trabalhos anteriores com manutenção de microcomputadores e de redes de computadores

Trabalhos executados em empresas como Estrela H Motos (revendas Honda) e UNIP (Universidade Paulista).

Projetos em Ciência de dados

Predição da necessidade de leitos de UTI para COVID-19 no hospital Sírio Libanês.

Utilizei algoritmos de classificação para melhor predizer se um paciente, de acordo com os dados de entrada, precisaria ser internado em UTI ou não em decorrência de COVID-19, utilizando validação cruzada e métricas para comparação entre as performances dos modelos. Executei análise exploratória e visualização para melhor entender os dados e tentar extrair conhecimento deles.

Algumas ferramentas utilizadas foram:

  • Python
  • Jupyter Notebook
  • Pandas, Numpy
  • Matplotlib, Seaborn
  • Modelos de Machine Learning: LogisticRegression, DecisionTreeClassifier, SVC, RandomForestClassifier, KNeighborsClassifier
  • Git e Github

Predição de vendas utilizando o dataset disponibilizado pelo grupo de farmácias Rossman.

Nesse projeto foi feita uma análise exploratória mais detalhada para melhor entendimento dos dados, além de formulações de hipóteses a serem verificadas sobre o negócio. Usei modelos de regressão para fazer a predição, além de validação cruzada e comparação de métricas para avaliar o modelo com melhor performance.

Algumas ferramentas utilizadas foram:

  • Python
  • Jupyter Notebook
  • Pandas, Numpy
  • Matplotlib, Seaborn
  • Boruta (pré-processamento)
  • Modelos de Machine Learning: LinearRegression, Lasso, RandomForestRegressor, XGBRegressor
  • Git e Github

Análise de dados da COVID-19 no Brasil e predição de novos casos.

A análise será feita sobre os dados da Covid-19 no Brasil extraídos diretamente do site https://covid.saude.gov.br/, administrado pelo Ministério da saúde. Esses dados foram coletados em 14/01/2021. Com eles, foi feita uma pequena análise dos números de casos e de mortes (Brasil e alguns estados) e a predição de séries temporais de novos casos.

Algumas ferramentas utilizadas foram:

  • Python
  • Jupyter Notebook
  • Pandas, Numpy
  • Matplotlib, Seaborn, Plotly
  • Modelos de Machine Learning: auto_arima, Prophet
  • Git e Github

EDA sobre os dados da pesquisa PENSE 2015.

A base de dados estudada nesse módulo é do IBGE, chamada Pense (Pesquisa Nacional da Saúde do Escolar). Podemos entender, através dela, a relação entre saúde e educação e como o ambiente de vivência do estudante pode influenciar na qualidade de seu desenvolvimento escolar e vice-versa.

Algumas ferramentas utilizadas foram:

  • Python
  • Jupyter Notebook
  • Pandas, Numpy
  • Matplotlib, Seaborn, Plotly
  • Scipy
  • Git e Github

Onde me encontrar

Sinta-se à vontade para entrar em contato.

  • LinkedIn
  • vinifrm@gmail.com
  • Medium