Análises

O que é R?

A cada minuto é criado uma quantidade gigantesca de dados. Mas apenas ter essa grande massa de dados não é o suficiente, é preciso transformá-los e organizá-los, para que possamos ter informações relevantes. Essa manipulação de dados é fundamental.

No meio dessas análises muitas vezes precisamos realizar procedimentos que acabam envolvendo matemática e estatística. Falando essas palavras pode até nos assustar um pouco, mas para nos ajudar temos uma linguagem que veio evoluindo e amadurecendo, tendo se popularizado muito neste meio, fazendo com que diversas empresas passem a utilizá-la para aprimorar suas análises, a linguagem R.

R - Fundamentos
Curso de R - Fundamentos
CONHEÇA O CURSO

R é uma linguagem e ambiente de desenvolvimento, sendo muito utilizada para a área matemática e estatística, sob a licença GNU. Quando dizemos que ele também é um ambiente de desenvolvimento, isso significa que o próprio programa funciona como ambiente que interpreta a linguagem, fazendo com que tudo aconteça em tempo real.

Falando um pouco sobre sua criação, o R é uma linguagem que foi derivada do S (linguagem de programação estatística), lançada em 1993. Os criadores tomaram a linguagem S como base para criar sua própria linguagem e ambiente, possuindo muito mais recursos. O nome “R” vem das iniciais de seus criadores, Ross Ihaka e Robert Gentleman. Sua utilização é totalmente gratuita, o que facilitou muito a adoção por quem a utiliza.

O que pode ser feito?

O R ajuda muito na análise de grandes conjuntos de dados, onde você pode aplicar modelos estatísticos e até importar/exportar para banco de dados relacionais.
Vimos que seu propósito principal é em análises estatísticas, mas com a utilização da linguagem R você pode instruí-lo a fazer algo que ele não faça naturalmente, como análises mais complexas, por exemplo. Essa é uma das grandes vantagens de também ser uma linguagem de programação, pois você pode programar (ensinar) a fazer coisas novas.

Além disso, a possibilidade da criação de gráficos faz do R uma forte ferramenta de visualização, o que auxilia muito na visualização de dados de forma muito amigável. Você pode inclusive criar visualizações customizadas ao que você necessita, através de uma lista de pacotes que ele possui, onde você pode instalar e criar os gráficos customizados.

R - Introdução ao Machine Learning
Curso de R - Introdução ao Machine Learning
CONHEÇA O CURSO

Por que aprender R?

Como pudemos ver, a linguagem R se popularizou muito neste meio. Se você se interessa pela área da ciência de dados, Big Data, Machine Learning, a linguagem R é uma das melhores ferramentas para isso, além de estar sendo uma das mais utilizadas.

É uma opção a mais para seu trabalho no dia a dia. Quanto mais ferramentas/linguagens você conhece e consegue utilizar, mais coisas você consegue resolver. Empresas gigantes como a Oracle e a Microsoft já integraram a linguagem R aos seus produtos de análise de dados, ou seja, se eles estão investindo nisso, é legal você começar a dar uma olhada também. Se você se interessou e não sabe por onde começar, temos um curso específico de R onde você pode conhecer um pouco mais e um outro mais focado no Machine Learning.

Até a próxima!

Big Data: o que é e qual a sua importância?

Big Data é uma ferramenta fundamental para que as empresas possam obter diversas vantagens competitivas, podendo ser utilizado em negócios de diversos segmentos. Um conjunto de dados “soltos” podem se tornar informações valiosas para tomadas de decisão.
Veja nesse artigo um pouco mais sobre o Big Data e como esse conceito é promissor.

O que vem a ser o Big Data?

O termo Big Data é um termo muito amplo, mas resumidamente se refere a um grande conjunto de dados estruturados ou não estruturados (explicados abaixo), que são gerados por empresas, pessoas e até mesmo por aparelhos. Cada vez mais geramos uma infinidade de dados, um exemplo simples disso é a utilização de mídias sociais onde são geradas informações o tempo todo.

A geração de valor do Big Data não se resume a quantidade de dados que é armazenado e sim o que você faz com eles, ou seja, o processamento e análise desses dados, para assim poder obter respostas que permitam que você reduza tempo, custos, dentre outros fatores.

Os dados estruturados são organizados e de fácil leitura, já os dados não estruturados são incompletos ou difíceis de serem mapeados, mas isso não quer dizer que não sejam dados relevantes de serem analisados.

O Big Data se baseia em cinco conceitos, chamado os 5 V’s, sendo eles:

  • Volume: Se refere a quantidade de informações que são armazenadas.
  • Variedade: Variedade dos dados gerados podendo ser dados estruturados, não estruturados, e-mails, áudios, vídeos…
  • Velocidade: Velocidade em que os dados devem ser tratados, fazendo com que seja praticamente em tempo real.
  • Veracidade: Se refere o quanto uma informação é verdadeira, por isso é necessário ficar atento a veracidade dos dados que chegam.
  • Valor: É preciso saber quais informações são úteis para seu negócio, a fim de gerar valor.

Esses são os seus pilares, mas toda a sua inteligência está na análise de dados.

Big Data X Insight Data

Os insights que surgem de uma análise são muito importantes. Um insight nada mais é que uma ação ou um momento que pode ser mensurado e analisado. Por exemplo, em uma compra pela internet podemos obter várias informações do usuário como nome, e-mail, endereço, telefone. Essas informações são nossos dados brutos, ou seja, fazem parte do Big Data.

Já com o Insight Data, podemos analisar várias ações desse usuário como o tipo de produto mais procurado por ele, qual produto ele comprou, se colocou algum produto no carrinho e depois desistiu, enfim… todas as informações que possam guiar o negócio, tendo como resultado quais foram as páginas mais visitadas, as menos visitadas, as estratégias de venda que mais funcionam, o porquê uma compra não foi concluída, dentre outras.

Resumindo, com o Big Data você armazena uma grande quantidade de dados para uma eventual análise dessas informações.

Concluindo

Aqui podemos ver um pouco sobre o Big Data e o que podemos ter como benefícios. Uma empresa que quer sair na frente de seus concorrentes e se inovar, pode utilizar com certeza. No próximo post abordaremos um pouco mais sobre o assunto. Até lá! =)

R - Introdução ao Machine Learning
Curso de R - Introdução ao Machine Learning
CONHEÇA O CURSO

O que vem a ser um cientista de dados?

No nosso último artigo sobre Big Data: “Vale a pena entrar no mercado de Big Data?” vimos que uma das profissões mais promissoras desse ramo é o Data Scientist, ou cientista de dados em português. Vamos conhecer mais sobre essa profissão e o que devemos fazer para iniciar nela.

O que é um cientista de dados?

Como as empresas agora estão pensando mais em Big Data, há a necessidade (agora e futura) de se ter profissionais especializados nesse ramo. Para fazer análise de Big Data é utilizar técnicas avançadas para tratamento de grandes volumes de dados e, analisar grandes volumes de dados não é uma tarefa fácil, por isso temos o cientista de dados.
O cientista de dados é o profissional que tem a habilidade de transformar números em dados e informações, para que seja possível a geração de insights (leia mais aqui) que realmente causem impacto no negócio. Um cientista de dados pode adquirir grandes massas de dados e deve separá-los, organizá-los e extrair o máximo desses dados.

Projeto de Banco de dados - Fundamentos
Curso de Projeto de Banco de dados - Fundamentos
CONHEÇA O CURSO

##Como obter qualificação?

No artigo anterior também vimos que no Brasil ainda não existe uma faculdade específica para seguir essas profissões relacionadas a Big Data, mas hoje temos no mercado cursos de pós-graduação e MBA’s específicos para essa área. Também é possível encontrar cursos online direcionados a esse assunto com facilidade na internet.
Podemos citar também algumas ferramentas que esse profissional precisa saber para te dar uma base de estudo. Para obtenção de dados, ferramentas como o Hadoop, MapReduce, Hive e Spark são importantes. Em relação as linguagens de programação se destacam as linguagens R, Python, SAS e o banco de dados SQL e NoSQL. Além dessas habilidades técnicas, o profissional também deve se atentar as habilidades pessoais, principalmente com a comunicação. Também é necessário ter bom raciocínio lógico e a capacidade de analisar um projeto sob vários aspectos.

Se você fizer uma busca pela internet verá que temos uma infinidade de vagas para cientista de dados e muito bem pagas. Se você se interessa pela área é interessante tentar colocar a mão na massa. Você pode tentar realizar algumas análises no seu próprio trabalho como meio de prática (claro que com a permissão de seu supervisor) e estudar algumas ferramentas e linguagens que irão fazer toda a diferença.

© 2004 - 2019 TreinaWeb Tecnologia LTDA - CNPJ: 06.156.637/0001-58 Av. Paulista, 1765, Conj 71 e 72 - Bela Vista - São Paulo - SP - 01311-200