Para uma melhor experiência neste site, utilize um navegador mais moderno. Clique nas opções abaixo para ir à página de download
Indicamos essas 4 opções:

Ok, estou ciente e quero continuar usando um navegador inferior.

Blog

Buscamos conhecimento e compartilhamos!

Saiba mais

Interessado em data science? Veja a relação dessa área com o cloud computing

  • Publicado em: 4 de dezembro de 2018
  • Autor: Gabriel Goltz
Interessado em data science? Veja a relação dessa área com o cloud computing

data-science-relacao-com-cloud-computing-2cloud

Empresas que encontram oportunidades de negócio através da análise de dados ingressam no vasto universo do data science, a ciência dos dados. Acompanhando e analisando os dados de consumo, por exemplo, as empresas que atuam com a venda de produtos e serviços tomam suas decisões orientadas por essas informações.

Hoje, quase tudo pode ser medido. Essa grande quantidade de dados disponível no mercado exige que o data science seja aplicado nos negócios para que essas informações não se percam e possam trazer resultados para as companhias. Neste contexto, as organizações precisam acessar uma alta capacidade de processamento e recursos computacionais, em uma escala possível apenas pela computação em nuvem. Confira como o cloud computing oferece flexibilidade e capacidade de expansão para armazenar dados e, com isso, disponibiliza a base para o trabalho do data science.

Data science: como essa ciência funciona? Confira um exemplo prático

Para o data science, a qualidade dos dados e as percepções extraídas deles é que têm valor, e não a quantidade de dados propriamente dita. Porém, para que a qualidade seja extraída, é preciso reunir muitos dados, utilizar ferramentas de análise e buscar o conhecimento de especialistas nessa área. Profissionais como o engenheiro de dados e o cientista de dados atuam parar tirar o melhor de cada contexto e gerar informação relevante para as organizações.

Como exemplo de aplicação do data science podemos citar a iniciativa do Banco Santander, que implantou e expandiu o seu setor de data science. Dessa forma, a quantidade de dados armazenados pela instituição bancária aumentou em 80% entre o final de 2017 e setembro de 2018. Um dos dirigentes da organização tentou dimensionar esse novo volume de dados: mais de 100 vezes o tamanho da Wikipedia em inglês, onde, em 2015, somavam-se mais de 23 terabytes em arquivos.

Através desse investimento do Santander em data science, o sistema do banco é capaz de comportar, atualmente, os dados de investimentos gerados em tempo real no seu aplicativo conforme o histórico de cada conta, assim como a carteira de ofertas disponibilizada por cada cliente, os moldes de concessão de crédito e antifraudes, entre outros recursos que antes não poderiam ser disponibilizados.

Como as atividades em data science são desenvolvidas?

Novas tendências de mercado derivadas da tecnologia em rede despertam curiosidade e com o data science isso não é diferente. Em uma pirâmide de hierarquia das necessidades trazidas pelo crescimento da Inteligência Artificial, demonstrada pela consultora em data science Monica Rogati em um artigo no site Hackernoon, pode-se extrair um conjunto de práticas.

Essas práticas correspondem, principalmente, aos seguintes tópicos:

  • Coleta: registro, uso de sensores, captação de dados externos e conteúdos dos usuários;
  • Armazenamento: que siga os princípios de que os dados devem ser confiáveis, estruturados e não estruturados;
  • Exploração: que envolve todas as formas de Analytics, métricas, agregações e dados de treinamento;
  • Rótulo: por teste A/B e algoritmos simples de Machine Learning;
  • Aprendizado e Otimização: uso de Inteligência Artificial e Deep Learning.

Essas necessidades do mercado na gestão de informações refletem em atividades que precisam ser desenvolvidas em data science. Nesse cenário, é possível vislumbrar habilidades requeridas dos profissionais.

Em um conteúdo sobre o assunto, a Udacity descreve as principais habilidades que os profissionais precisam desenvolver para atuar com data science: programação, estatística, machine learning, cálculo multivariado e álgebra linear, data wrangling (ligada à capacidade de organização de dados), visualização e comunicação de dados, intuição relacionada a dados e engenharia de software.

Encontrar todas essas competências em um só profissional – o qual também deve conhecer bem o negócio de uma empresa – foge um pouco da realidade do mercado de trabalho. Todavia, dois profissionais, o engenheiro de dados e o cientista de dados, concentram as habilidades para implementar e atuar com base no data science.

Enquanto o engenheiro de dados estrutura o necessário para que os dados tenham a qualidade, o acesso fácil e a limpeza necessários ao data science, o cientista de dados usa a estatística para responder perguntas específicas e agregar valor a essas informações.

Ferramentas e oportunidade na nuvem relacionadas com o data science

Os recursos utilizados por empresas que baseiam parte do seu negócio em data science são diversos. Alguns destes envolvem os bancos de dados SQL, linguagem comum para banco de dados relacional, e NoSQL, bancos com bases de dados não relacionais para lidar com tabelas que podem não estar estruturadas e nem interligadas.

Também são requeridas tecnologias para lidar com Big Data, como Hadoop, e outras para modelar os bancos de dados, como Architect e Visio, ERWin e Enterprise. A organização dos repositórios para a tomada de decisões demanda soluções de data warehousing e modelos preditivos baseados em matemática e estatística para predizer futuros cenários e prever comportamentos e tendências a partir do histórico de dados da empresa.

Para o cenário de muitos dados não estruturados e imperfeitos ou inconsistentes tratados em data science, os servidores virtuais, sistemas avançados de backup e o potencial ilimitado de processamento em nuvem tanto viabilizam o custo-benefício das atividades quanto asseguram e abrem potencial às empresas para que elas façam o melhor uso desses recursos e possam usufruir dos benefícios da ciência de dados.

Se você se interessa pelas tendências na área de tecnologia e pelo mercado de cloud computing, confira outros conteúdos relacionados com esses temas nos conteúdos do nosso blog e na nossa página de materiais gratuitos.

E se você deseja investir em data science, entre em contato conosco para saber como as soluções de computação em nuvem da 2Cloud podem ajudar a sua empresa.