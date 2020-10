“Para ser um cientista de dados, você não precisa ser o melhor aluno de matemática, precisa só ser curioso e gostar de olhar os dados para descobrir coisas novas a partir deles”, explica o vice-diretor do ICMC - Crédito: Reinaldo Mizutani

Curiosidade e capacidade de observação e de dedução apuradas, desenvolvidas ao longo de anos de estudo em múltiplas áreas do conhecimento e colocadas à prova diante dos mistérios do mundo real. Atenção aos detalhes, analisando todos os dados coletados e separando as informações importantes das que são irrelevantes para construir novos conhecimentos. Essas são as habilidades que um (ou uma) cientista de dados utiliza na vida profissional.

Qualquer semelhança com as habilidades do famoso Sherlock Holmes, não é mera coincidência, garante o professor André de Carvalho, vice-diretor do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos: “Para ser um cientista de dados, você não precisa ser o melhor aluno de matemática, precisa só ser curioso e gostar de olhar os dados para descobrir coisas novas a partir deles. Então, é mais ou menos como ser um Sherlock Holmes, porque você vai trabalhar com os dados usando ferramentas da ciência e tentará extrair informações importantes como, por exemplo: pistas sobre quem matou quem; sobre o que está por trás de uma doença; sobre como obter mais rendimento em uma aplicação financeira, entre tantas outras possibilidades.”

É como se um cientista de dados trabalhasse sempre carregando uma lupa nas mãos, debruçando-se nos detalhes dos dados, buscando encontrar padrões em meio ao caos, explica André. Assim, ao descobrir padrões, esse profissional descobrirá também informações valiosas e poderá produzir novos conhecimentos.



Para ajudar a visualizar esse trabalho, seguem alguns exemplos concretos: imagine um cientista de dados analisando os pedidos que você fez nos últimos anos em um aplicativo de entrega de comida. O que ele poderia descobrir? Com certeza, identificaria facilmente o tipo de culinária que mais agrada seu paladar. Poderia também encontrar um padrão em relação aos dias da semana e horários em que você costuma fazer suas solicitações e, a partir dessa análise, criar e enviar promoções para estimular seu estômago e agradar seu bolso.

Por outro lado, imagine esse mesmo cientista observando o histórico do consumo de energia, água e luz da sua residência. Com certeza, seria fácil prever quanto você irá consumir futuramente e quanto isso lhe custará. Analisando esses dados, poderia também oferecer percentuais de desconto, que aumentariam proporcionalmente conforme você alcançasse metas de redução do uso desses recursos, contribuindo com a sustentabilidade do planeta.

Outro exemplo: investigando uma série de dados que os médicos utilizam para tomar suas decisões, os cientistas podem localizar pistas relevantes que permitem chegar à conclusão sobre o tipo de enfermidade que acomete um paciente. Então, ao unir o conhecimento médico, desenvolvido ao longo de anos de experiência, com os dados disponíveis, é possível desenvolver sistemas para apoiar o diagnóstico médico, usando técnicas e ferramentas de inteligência artificial (clique aqui para ler mais sobre isso).

Enfim, pensando na infinidade de dados que temos disponíveis no mundo de hoje – estamos produzindo e fornecendo dados o tempo todo a partir do momento em que nos conectamos à web –, faltam profissionais capacitados para extrair informações úteis e valiosas desse incrível material bruto. A demanda por cientistas de dados é crescente em todos os países. Segundo André, em 2018, a estimativa do mercado era de que, apenas nos Estados Unidos, faltassem de 140 a 190 mil profissionais para atuar nessa área.

De acordo com quatro especialistas da empresa Bain & Company, a oferta global de talentos em ciência de dados está prestes a explodir, atingindo cerca de 1 milhão de pessoas este ano, contra meio milhão em 2018. Ainda assim, segundo eles, esse aumento na oferta não resolverá inteiramente a demanda: “A maioria desses talentos se formou recentemente, mas ainda há escassez de pessoas com mais experiência, necessárias para liderar e gerenciar equipes. Os Estados Unidos sofrerão com a escassez de engenheiros e arquitetos de dados, enquanto enfrentarão um possível excesso de oferta de cientistas de dados” (leia o texto original em inglês).

Em artigo publicado pela empresa de recrutamento remoto TECLA, especializada na área de tecnologia, afirma-se que as vagas para cientistas de dados aumentaram “incríveis 650%” desde 2012, ano em que esse trabalho foi considerado “o mais sexy do século 21”. Um gráfico apresentado no artigo mostra o crescimento acelerado no número de vagas em aberto para cientistas de dados nas maiores companhias do mundo (veja a imagem).

“Em termos de oportunidade de trabalho, de acordo com o site Infomoney, a área de ciência de dados no Brasil está entre as cinco mais procuradas pelo mercado desde 2019. Então, a quantidade de oportunidades e de emprego para cientistas de dados é imensa”, diz o professor Luis Gustavo Nonato, do ICMC. Ele é o coordenador do Bacharelado em Ciência de Dados da USP, que é o primeiro a ser ofertado por uma universidade pública brasileira nessa área, cujas aulas da primeira turma terão início no ano que vem.

ARQUEÓLOGOS DO FUTURO

O professor Francisco Rodrigues, do ICMC, destaca, assim como André, que um cientista de dados precisa desenvolver diversas habilidades adicionais, especialmente de comunicação, tendo em vista que sempre atuará apoiando especialistas em diferentes campos do conhecimento. “O profissional tem que ser um bom gerenciador de projetos e também um data storytelling, já que precisará construir narrativas toda vez que for explicar aos profissionais de outras áreas como, depois de analisar os dados, conseguiu chegar aos resultados”, explica Francisco. “O diferencial da área é o uso do método científico para estudar os dados disponíveis e, só então, formular hipóteses, fazer testes e tirar conclusões”, completa o professor.

André faz referência a outra metáfora para explicar como é o trabalho desse profissional: “O mundo todo se tornou um grande sítio arqueológico, repleto de tesouros para serem encontrados. Nós, os cientistas de dados, somos os arqueólogos em busca dos artefatos preciosos que nos ajudarão a resolver os problemas misteriosos do mundo.”

Tal como nas histórias de Sherlock Holmes, os mistérios só serão desvendados quando as evidências coletadas – nesse caso, os dados – permitirem formular teorias e compreender o fenômeno investigado. “É um erro grave formular teorias antes de se conhecerem os fatos. Sem querer, começamos a distorcer os fatos para se adaptarem às teorias, em vez de formular teorias que se ajustem aos fatos”, ensina Holmes durante um diálogo com seu melhor amigo, John Watson, no conto Escândalo na Boêmia, no livro As aventuras de Sherlock Holmes, de Arthur Conan Doyle.

NOVOS CURSOS, MAS A ÁREA NEM TANTO

André conta que a primeira vez que o termo “ciência de dados” apareceu na história da computação foi no livro Concise Survey of Computer Methods, publicado por Peter Naur em 1974. No prefácio, o autor menciona um curso que ministrou em 1968 intitulado Datalogy, the science of data and of data processes and its place in education, em tradução livre para o português, algo como Datalogia, a ciência dos dados e do processamento de dados e seu espaço na educação.

Mas, de fato, o termo só ascende à posição “sexy” que possui hoje no início do século XXI, em especial a partir de 2013, quando surgem os três primeiros cursos de graduação na área: na Northern Kentucky University, na University of San Francisco e no College of Charleston, todos nos Estados Unidos. Atualmente, já existem 300 curso de graduação em ciência de dados espalhados pelo mundo.

“Em 2016, eu recebi um convite para ser professor visitante na Universidade de Nova York. E cheguei lá no momento em que estava sendo criado o Centro de Ciência de Dados, então, vivenciei a montagem dos currículos dos cursos de graduação e de pós-graduação na área”, conta o professor Nonato, em vídeo disponível no canal do ICMC no Youtube. Ele acompanhou também a contratação do time de professores do novo Centro, que abarcava além de cientistas de computação e matemáticos, também profissionais de outras áreas do conhecimento como psicologia e biologia: “Eu me encantei com a multidisciplinaridade daquela área que estava surgindo e, desde então, o foco das minhas pesquisas se direcionou totalmente para a ciência de dados.”

Nonato foi um dos professores responsáveis por elaborar o projeto político-pedagógico e a grade curricular do curso de Ciências de Dados do ICMC. “Eu vejo a área como resultado de uma intersecção entre a matemática e a computação”, diz o professor. Por isso, as disciplinas oferecidas no curso refletem essa intersecção, contemplando conhecimentos básicos em computação, matemática (em especial da estatística), além de disciplinas específicas sobre técnicas e ferramentas de inteligência artificial que estão sendo amplamente utilizadas pelos cientistas de dados como redes neurais artificiais e aprendizado profundo. Para conferir a grade curricular e o projeto político-pedagógico, basta acessar o site do Bacharelado em Ciência de Dados: www.icmc.usp.br/graduacao/ciencia-de-dados-bacharelado.

“Se você pretende seguir na área de ciência de dados ou inteligência artificial, eu super recomendo que dê uma atenção especial para esse curso. Porque, além de ser oferecido pela USP, pelo ICMC, que é um Instituto muito forte nessa área em específico, você vai pegar um momento muito bom para aprender isso. Eu garanto que, com esse conhecimento, você não vai ficar obsoleto em, sei lá, questão de décadas. Porque essas tecnologias têm cada vez mais aplicações e a tendência é que o mercado e a academia as utilizem exaustivamente”, recomenda o divulgador científico Caio Dellaqua, em vídeo que fez sobre o novo curso do ICMC.

Estudante do Instituto de Física da USP (IFUSP), Caio identificou entre os seguidores de seu canal no Youtube, uma demanda por informações sobre a área de ciência de dados e resolveu, então, ler o projeto político-pedagógico do curso para explicar quais disciplinas serão oferecidas e o que o estudante aprenderá, de modo geral, em cada uma (clique aqui para assistir).

Além do Bacharelado em Ciência de Dados, o ICMC fez alterações em outro curso de graduação, que passou a abarcar conhecimentos de ciência de dados. Foi assim que o Bacharelado em Estatística passou a se chamar, a partir deste ano, Bacharelado em Estatística e Ciência de Dados. Basicamente, quem opta pelo curso de Ciência de Dados, tem à disposição mais disciplinas da área de computação, mas aprenderá também métodos estatísticos fundamentais para poder analisar dados. Já quem escolhe o caminho da Estatística e Ciência de Dados cursará mais disciplinas da área de estatística, sendo oficialmente reconhecido como estatístico ao final do curso, mas terá também conhecimentos de computação, suficientes para usar o computador como ferramenta para analisar dados. Para entender melhor as diferenças entre esses dois cursos, acesse este vídeo que o ICMC disponibilizou no Youtube: https://youtu.be/qMbSb7hHFMg.

