1. O Despertar do Cientista de Dados

Imagine acordar com o aroma do café recém-preparado e a perspectiva de resolver enigmas de dados. Sim, isso é o que um Cientista de Dados faz! O dia geralmente começa com uma reunião de equipe, uma “daily”, onde todos compartilham seus avanços e entendem se há algum bloqueio ou validação pela frente. Pode seguir de um refinamento mais técnico, com outras pessoas do time de tecnologia onde se discutem os desafios, as vitórias e, claro, as melhores maneiras de superar os obstáculos que estão por vir. O começo do dia é sempre importante para quem trabalha com Dados, pois sem foco e organização a produtividade pode ser bem baixa.

2. A Aventura Diária

Depois de se abastecer com uma boa dose de cafeína e inspiração, é hora de mergulhar no mundo dos dados. Cada projeto é uma nova aventura, uma chance de descobrir padrões ocultos, de contar uma história com números. Eles criam, testam, falham, aprendem e repetem. É um ciclo contínuo de aprendizado. E a melhor parte? Dificilmente há dois dias iguais. Cada dia traz um novo desafio, um novo problema a ser resolvido. É como um quebra-cabeça infinito que mantém a mente sempre ativa. Os códigos são instrumentos, a estatística, a segurança e o entendimento de negócio a motivação para saber que está no caminho certo. Durante o dia há colaboração constante com outras pessoas técnicas, analistas de dados, engenheiros de dados ou engenheiros de machine learning e nao técnicas como product managers, líderes de projetos ou stakeholders.

3. O Poder da Comunicação

Mas não se engane, ser um Cientista de Dados não é apenas sobre números e códigos. É também sobre pessoas. Cientistas passam uma boa parte do dia construindo pontes entre departamentos, traduzindo o jargão técnico em linguagem comum e garantindo que todos estejam na mesma página. São os embaixadores dos dados, evangelizadores do método científico e os contadores de histórias que transformam complexidade em simplicidade, dados em decisões. Sempre há um check com alguém de negócios, para testar hipóteses e viabilidades, para entender se o caminho está alinhado com as expectativas e, principalmente, colocar alguém para testar as ações sugeridas pelos algoritmos.

4. Desafios e Aprendizados

A vida de um Cientista de Dados não é apenas sobre resolver problemas complexos, mas também sobre lidar com desafios diários. Um deles é a qualidade dos dados. Sim, eles passam uma quantidade surpreendente de tempo limpando e preparando os dados antes de poderem realmente começar a trabalhar com eles. É como ser um detetive, procurando pistas e eliminando ruídos para encontrar a verdade escondida nos dados. Eu gosto de ver o cientista de dados como o Batman e os problemas de dados como desafios do Charada.

Além disso, eles precisam ser camaleões, capazes de se adaptar a diferentes contextos e projetos. Um dia, eles podem estar trabalhando em previsões de séries temporais para sensores, e pouco tempo depois, podem estar mergulhando no mundo do marketing ou de vendas. É um trabalho que exige uma mente aberta e uma paixão por aprender

5. O Fim do Dia: Reflexão e Aprendizado

E quando o dia chega ao fim, eles não apenas desligam seus computadores e vão para casa ou às vezes apenas desligam o computador dentro de seu quarto ou escritório. Eles refletem sobre o dia, sobre o que aprenderam, sobre o que podem fazer melhor, alguns têm lousas em casa, outros gostam de cadernos e lápis. Eles leem as últimas notícias do mundo dos dados, sempre buscando aprender e crescer, eventualmente discutem alguns conteúdos sobre ciência ou tecnologia nas redes sociais. E, claro, eles também se permitem um momento de diversão - afinal, Cientista de Dados ainda não são máquinas, precisam relaxar! Bora jogar um joguinho?"

A área de Ciência de Dados é um mercado constituído por uma equipe multidisciplinar,  que envolve coleta de dados, análise, interpretação e consequentemente tomada de decisões estratégicas. Com o avanço da tecnologia e a crescente geração de dados, empresas e instituições têm buscado profissionais preparados para transformar dados caóticos em conhecimento e informações úteis para gerar produtos e serviços personalizados. Abordaremos aqui, os diferentes cargos na área de Ciência de Dados, suas atribuições, características e pré -requisitos para se tornar um bom profissional. 

Cientista de Dados (Data Scientist): responsável por aplicar modelos estatísticos e desenvolver algoritmos para analisar grandes volumes de dados e informações. Ele busca resolver problemas complexos e identificar padrões e tendências relevantes. Além disso, o cientista de dados é responsável por comunicar os resultados dessas análises de forma clara e compreensível para o público não técnico.

Características: Criatividade, habilidades em resolução de problemas, capacidade de comunicação e pensamento inovador.

Conhecimentos: Estatística avançada, aprendizado de máquina (machine learning) , aprendizado profundo (deep learning), algoritmos, e também ferramentas de Big Data.

Analista de Dados (Data Analyst): O analista de dados tem como foco a interpretação dos dados, criação de relatórios e facilidade na interpretação das informações para gerar insights relevantes ao negócio. Ele realiza análises exploratórias, cria painéis de controle que auxiliam na tomada de decisões estratégicas. Embora não esteja diretamente envolvido no desenvolvimento de modelos, o analista de dados é essencial para transformar dados brutos em informações úteis.

Características: Curiosidade aguçada, habilidades analíticas, capacidade de comunicação persuasiva e espírito investigativo.

Conhecimentos: Linguagens de consulta de dados (SQL), ferramentas de BI (Power BI, Tableau), modelagem de dados e análise estatística.

Engenheiro de Dados (Data Engineer): O engenheiro de dados é responsável por projetar, construir e manter a infraestrutura necessária para armazenar, processar, atualizar e disponibilizar os dados de forma eficiente. Ele desenvolve pipelines de dados, cria bancos de dados e implementa soluções de Big Data, garantindo que os dados estejam acessíveis e prontos para serem utilizados por cientistas de dados e outros profissionais da empresa.

Características: Curiosidade e vontade de aprender, e se atualizar de maneira constante. Estar disposto a explorar novas ideias e tecnologias, boa comunicação e habilidade de enfrentar desafios complexos.

Conhecimentos: Habilidade em Big Data, programação, ter familiaridade com banco de dados, computação em nuvem e segurança de dados.

Engenheiro de Machine Learning: é o mestre em desenvolver algoritmos e modelos avançados para dar vida a máquinas inteligentes. Normalmente seu trabalho é fazer o deploy dos projetos de um cientista de dados, trabalhando próximo a ele, sua missão é, nesse processo,  treinar os algoritmos com dados e aprimorar o aprendizado das máquinas.

Características: Criatividade, resolução de problemas, habilidades em matemática e desejo de aprender constantemente.

Conhecimentos: Linguagens de programação (Python, R), frameworks de Machine Learning (Tensor Flow, Scikit-Learn), estatística e teoria dos algoritmos.

Product Manager: responsável por traçar uma estratégia e guiar o desenvolvimento de produtos de Ciência de Dados. Ele entende as necessidades dos clientes e define a visão do produto, unindo a tecnologia com as expectativas do mercado. 

Características: Habilidades de liderança, visão estratégica, empatia com os clientes e comunicação eficaz.

Conhecimentos: Compreensão do mercado, conhecimento em tecnologias de Ciência de Dados e habilidades em gerenciamento de projetos.

Líder de Projeto/Stakeholders: são mediadores entre as equipes técnicas de Ciência de Dados e os stakeholders. Sua missão é garantir que os projetos estejam cumprindo com as necessidades e expectativas dos envolvidos. Esse profissional é essencial para o sucesso de cada projeto, pois assegura a compreensão mútua e a fluidez das operações.

Características: Habilidades em comunicação, empatia, resiliência e capacidade de negociação.

Conhecimentos: conhecimento em ciência de dados, visão estratégicas, conhecimento do mercado, comunicação eficiente, liderança, empatia e habilidade de comunicação.

Como vocês puderam perceber, independentemente da posição, cada profissional desempenha um papel essencial no processo de transformação de dados, interpretação e também em conhecimentos  para o sucesso das empresas no mundo.

Então, vamos juntos embarcar nessa aventura e desvendar os segredos dos dados para criar um futuro repleto de inovação e sucesso!

A Revolução dos Dados nos Negócios

Em um mundo onde os dados são considerados o "novo petróleo", muitas empresas estão se reinventando através da análise de dados. Essa transformação não é apenas uma tendência, mas uma necessidade para se manter relevante e competitivo no mercado. Empresas de todos os tamanhos e setores estão descobrindo o poder dos dados para otimizar operações, entender melhor seus clientes e tomar decisões mais informadas.

Netflix: Mais do que Entretenimento, uma Experiência

Um dos exemplos mais emblemáticos do uso eficaz de dados é a Netflix. A gigante do streaming utiliza algoritmos avançados para analisar o comportamento de seus usuários, desde o que eles assistem até por quanto tempo e em que dispositivo. Com essas informações, a Netflix não apenas recomenda conteúdo personalizado, mas também toma decisões sobre quais programas produzir. O resultado? Uma experiência de usuário altamente personalizada, séries originais aclamadas pela crítica e um modelo de negócios que revolucionou a indústria do entretenimento.

Amazon: O Cliente no Centro de Tudo

A Amazon, desde seus primórdios, têm usado dados para colocar o cliente no centro de sua estratégia. Através da análise de padrões de compra, históricos de busca e avaliações de produtos, a empresa oferece recomendações personalizadas, otimiza sua logística e até prevê quais produtos terão maior demanda em determinadas regiões. Esse uso intensivo de dados não só transformou a Amazon no gigante do e-commerce que conhecemos hoje, mas também a levou a expandir para outras áreas, como a computação em nuvem com a AWS.

Spotify: Conectando Artistas e Ouvintes

O Spotify revolucionou a forma como consumimos música, e muito disso se deve à sua habilidade em usar dados. Analisando as preferências musicais de seus usuários, o Spotify cria playlists personalizadas, descobre novos talentos e até prevê tendências musicais. Para os ouvintes, isso se traduz em descobrir novas músicas e artistas com facilidade. Para os artistas, significa uma plataforma que realmente entende e atende às suas necessidades, oferecendo dados sobre seus ouvintes e ajudando-os a alcançar novos públicos.

Conclusão: A Era dos Dados

Estes são apenas alguns exemplos de como os dados estão moldando o futuro dos negócios. Mas a revolução dos dados não se limita a grandes empresas. Startups, pequenas empresas e até profissionais autônomos estão usando dados para melhorar seus serviços, entender seus clientes e tomar decisões mais informadas. Em um mundo cada vez mais digital, os dados são a chave para entender os desejos e necessidades dos clientes, otimizar operações e inovar. As possibilidades são infinitas, e as empresas que abraçam essa revolução estão não só destinadas ao sucesso, mas também a liderar o futuro de seus respectivos setores.

A Era da Informação e a Tomada de Decisão

Em um mundo cada vez mais digitalizado, as empresas estão inundadas de dados. Desde o comportamento do consumidor até as operações internas, há uma riqueza de informações esperando para ser explorada. Mas, como transformar essa avalanche de números em ações concretas? É aí que entra o Cientista de Dados.

O Papel Central do Cientista de Dados

O Cientista de Dados não apenas coleta e analisa esses dados, mas os transforma em insights valiosos que podem direcionar decisões estratégicas, otimizar processos e impulsionar o crescimento. Eles são os detetives do mundo digital, desvendando mistérios e encontrando respostas nas vastas quantidades de informação disponíveis.

A Conexão entre Dados e Estratégia

Não basta apenas ter acesso a grandes volumes de dados; é crucial saber o que fazer com eles. O Cientista de Dados atua como uma ponte entre o mundo técnico e o mundo dos negócios. Ele entende as nuances dos dados e, ao mesmo tempo, compreende as necessidades e objetivos da empresa. Com essa combinação única de habilidades, ele pode identificar oportunidades, prever tendências e fornecer recomendações baseadas em evidências que alinham os dados à estratégia de negócios.

Inovação e Competitividade no Mercado

Em um mercado competitivo, estar um passo à frente pode ser o diferencial entre o sucesso e o fracasso. Os Cientistas de Dados, com sua capacidade de identificar padrões e prever comportamentos, podem proporcionar essa vantagem. Eles permitem que as empresas inovem, personalizem ofertas para seus clientes e otimizem suas operações, tornando-as mais eficientes e rentáveis. Em resumo, eles transformam dados em uma ferramenta poderosa de vantagem competitiva.

Desmistificando os Dados para Todos

Embora a ciência de dados possa parecer complexa para muitos, o papel do Cientista de Dados não se limita apenas à análise técnica. Eles também são comunicadores eficazes, capazes de traduzir análises complexas em informações compreensíveis para todos na organização. Isso facilita a democratização dos dados, permitindo que todos, desde o CEO até o gerente de linha de frente, compreendam e utilizem os insights derivados dos dados em suas respectivas funções.

Investimento no Futuro

Investir em ciência de dados é investir no futuro. À medida que a tecnologia avança e o mundo se torna ainda mais interconectado, a importância dos dados só aumentará. Ter um Cientista de Dados na equipe não é mais um luxo, mas uma necessidade. Eles não apenas ajudam a navegar no presente, mas também a preparar as empresas para os desafios e oportunidades do futuro. Em um mundo orientado por dados, eles são os navegadores que guiam as empresas em direção ao sucesso.

Conclusão

A era da informação trouxe consigo uma revolução na forma como as empresas operam e tomam decisões. No centro dessa revolução está o Cientista de Dados, uma peça-chave para transformar informações em ações e garantir que as empresas não apenas sobrevivam, mas prosperem neste novo cenário. Investir em ciência de dados é, sem dúvida, investir no futuro do seu negócio.

O texto da Mônica Scaramuzzo no Estadão fala sobre o que as empresas tradicionais estão fazendo em sua busca por evolução nos dias atuais e é muito interessante. Traz a visão do Gustavo Werneck, CEO da empresa, sobre o assunto que mais se fala dentro das indústrias: a visão 4.0 e data-driven, tomar ações baseadas em dados, automatizar processos e sinergia de pessoas com máquinas.

Ler sobre isso me lembrou bastante o trabalho que faço, construir uma área de ciência de dados numa grande empresa, respeitando seus novos personagens e entendendo os reais ganhos.

Os pilares de ciência de dados são ciência - matemática, estatística e machine learningtecnologia - engenharia de software,  startups, devops e inovação - e pessoas - tudo que você pode extrair do negócio - sendo a última o maior desafio. Um bom cientista de dados explica o que faz muito bem e, percebendo a validade do que desenvolve, cria oportunidades, cativa, conquista pessoas e divulga sua ciência como um negócio. E o que é ciência senão um aprofundamento num assunto específico?

 

Image by Dariusz Sankowski from Pixabay

O que faz um cientista de dados se destacar é todo aprendizado que ele extrai de pessoas de negócio e dos seus estudos, é criar uma formulação que faça sentido matemático e possa ser base para aplicativos, automatizações, sistemas, etc. Ele é parte de TI, como é parte de negócios, mas antes de tudo ele é um pensador.

O Itaú também tem investimentos nessa parceria com universidades e uma pós graduação bastante concorrida em parceria com o ITA e  USP. Esses caras já entenderam que formar dentro de casa é o melhor caminho, aliás no futuro imagino que essas escolas serão mais concorridas do que universidades públicas. Só "sofrendo" junto num aprendizado, que se cria uma cultura analítica produtiva de discussões, cooperações e alto desempenho.

Você pega uma pessoa com uma boa formação científica e deixa ela imersa nos conhecimentos da empresa.

Não há mais como negar que as empresas que não se preocuparem com a quarta revolução industrial estarão ultrapassadas e poderão perder muito  tempo e dinheiro, hoje em dia não há onde não renovar.

*Image by Larisa Koshkina from Pixabay

 

 

 


Um incrível trabalho de duas pesquisadoras, Derya Akkaynak e Tali Treibitz, da Universidade de Haifa em Israel resultou numa tecnologia chamada Sea-Thru que permite que seja removida toda água de uma foto.

O resultado é uma reconstrução da imagem que foi tirada debaixo d'água, sem a água e fisicamente acuradas, com cores reais, mantendo saturação e brilho. Algo assim pode ser utilizada largamente usado por biólogos que precisem ver cores verdadeiras sob a superfície.

Considerando os efeitos que governam as imagens debaixo d'água, as pesquisadoras criaram um modelo que reconhece o sinal que degrada a imagem proveniente da luz refletida em partículas suspensas na água. Utilizaram mais de 1100 imagem para entender o padrão de espalhamento e absorção da luz na água.

Uma das imagens do artigo publicado mostra a perfeição dessa tecnologia.

Fonte da foto

Leia mais no artigo da Scientific American.

 

A área de “Business Analytics” cresce exponencialmente nas empresas, ela possui espaço para diversas atividades e contempla pelo menos três ou quatro importantes cargos: engenheiro de dados, cientista de dados, analista de dados e "data strategy".

O intuito do acompanhamento através de consultorias ou aulas particulares é auxiliar você nesse universo caso tenha um curso que você esteja com dificuldades em acompanhar, ou problemas do seu trabalho que você gostaria de alguém para discutir e resolver junto.

APRESENTAÇÃO DO CONSULTOR E PROFESSOR

Sou bacharel em Física pela USP, MBA em Ciência de Dados. Trabalhei por seis anos no mercado financeiro em fundos locais (onshore) e fora do país (offshore) com estatística aplicada, backoffice e análise de Risco.

Empreendo com projetos em Big Data, sou consultor e cientista de dados no Grupo Boticário.

METODOLOGIA
A AULA PARTICULAR e a CONSULTORIA são encontros individuais de duração aproximada de 1 hora e meia  sob demanda.

Aulas online, com tela compartilhada, com material disponibilizado para você. Fica melhor se tiver duas telas e assim compartilhamos simultaneamente e podemos programarmos juntos.

Durante a aula ou consultoria discutimos soluções, acompanhamos um problema e auxilio você através de  exemplos reais. Você terá acesso à códigos, teoria matemática e um universo de conteúdo para entender seu uso e impacto em diferentes negócios.

Atendo pessoas de todas as áreas e auxilio empreendedores em MBAs,  plano de negócio e desenvolvimento de ideias com analytics.

A Mentoria em Python para Ciência de Dados é inspirada no Programa de cursos integrados Ciência de dados aplicada com Python da Universidade de Michigan da plataforma Coursera, complementado com estudos que realizei, processos seletivos que passei e os livros mais importantes da área.

 

APRESENTAÇÃO DO MENTOR

Sou bacharel em Física pela USP, MBA em Ciência de Dados. Trabalhei por seis anos no mercado financeiro em fundos locais (onshore) e fora do país (offshore) com estatística aplicada, backoffice e análise de Risco.

Empreendo com projetos em Big Data, sou consultor e cientista de dados no Grupo Boticário.

 

METODOLOGIA DE TRABALHO

A MENTORIA é um acompanhamento de 1 hora e meia por semana durante 4 meses com a participação de até 10 pessoas.

Online, em tempo real, com as aulas gravadas e disponibilizadas no lab.estudodedados.com.br . Você terá acesso à um conjunto enorme de códigos e modelos já prontos e eu vou ensinar do zero, como criar uma rotina de análise de dados e as melhores estratégias para construir modelos de machine learning.

Exemplifico com aplicações práticas em negócio e aplicativos que utilizam analytics como raiz do seu funcionamento.

Você também terá acesso à uma infinidade de recursos, códigos, artigos, canais no youtube e materiais de estudo para complementar o seu estudo.

Atendo pessoas e empresas de todas as áreas.

 

 

Árvores de Decisão Aumentada por Gradiente (GBDT) constrói uma série de pequenas árvores de decisão, com cada árvore tentando corrigir erros do estágio anterior. Aqui está um bom vídeo sobre isso, que descreve AdaBoost, mas dá uma boa visão geral da árvore impulsionando modelos.

Vocês devem estar se perguntando MAS E REDES NEURAIS!???????????
Teremos artigos específicos para ela 🙂

Ainda abordarei esse tema, falando sobre a matemática do Machine Learning, porém é interessante ver que há métodos de criar clusters e analisar estruturas internas dos dados. Podemos ter reduções de dimensionalidade lineares (PCA e MDS) ou não lineares (t-SNE) ou “manifold learning”.

Realizar reduções dimensionais pode ser muito interessante, porém é um daqueles caminhos onde optamos por menos explicabilidade para ter melhores resultados de modelos. Para estudar um pouco a origem dessas coisas recomendo fazer uma revisão de Álgebra Linear.

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram