{"id":982354,"date":"2024-09-17T07:43:41","date_gmt":"2024-09-17T14:43:41","guid":{"rendered":"https:\/\/www.questionpro.com\/blog\/?p=982354"},"modified":"2024-09-17T07:43:52","modified_gmt":"2024-09-17T14:43:52","slug":"analise-exploratoria-de-dados","status":"publish","type":"post","link":"https:\/\/www.questionpro.com\/blog\/pt-br\/analise-exploratoria-de-dados\/","title":{"rendered":"An\u00e1lise explorat\u00f3ria de dados: o que \u00e9, tipos e import\u00e2ncia"},"content":{"rendered":"\n

O matem\u00e1tico americano John Tukey desenvolveu originalmente a an\u00e1lise explorat\u00f3ria de dados na d\u00e9cada de 1970. Mesmo hoje, as t\u00e9cnicas de an\u00e1lise explorat\u00f3ria de dados continuam a ser amplamente utilizadas no processo de descoberta de dados.<\/p>\n\n\n\n

Al\u00e9m da modelagem formal ou do teste de hip\u00f3teses, a an\u00e1lise explorat\u00f3ria abre as portas para uma melhor compreens\u00e3o das vari\u00e1veis no conjunto de dados e suas rela\u00e7\u00f5es. Ela tamb\u00e9m ajuda a determinar se a t\u00e9cnica estat\u00edstica considerada para a an\u00e1lise de dados \u00e9 apropriada ou n\u00e3o.<\/p>\n\n\n\n\n\n

O que \u00e9 an\u00e1lise explorat\u00f3ria de dados?<\/strong><\/h2>\n\n\n\n

Cientistas de dados utilizam amplamente a an\u00e1lise explorat\u00f3ria ao investigar conjuntos de dados, resumindo suas principais caracter\u00edsticas por meio de visualiza\u00e7\u00f5es. Esse m\u00e9todo ajuda a descobrir padr\u00f5es nos dados, detectar anomalias, testar hip\u00f3teses <\/a>e\/ou suposi\u00e7\u00f5es.<\/p>\n\n\n\n

Resumidamente, a an\u00e1lise explorat\u00f3ria de dados pode ser definida como um m\u00e9todo que ajuda a determinar as melhores maneiras de manipular uma determinada fonte de dados para obter as respostas necess\u00e1rias.<\/p>\n\n\n\n

Import\u00e2ncia da an\u00e1lise explorat\u00f3ria de dados<\/strong><\/h2>\n\n\n\n

O principal objetivo da an\u00e1lise explorat\u00f3ria de dados \u00e9 permitir uma an\u00e1lise profunda do conjunto de dados antes de fazer suposi\u00e7\u00f5es. Ela ajuda a identificar erros evidentes, obter uma melhor compreens\u00e3o dos padr\u00f5es no conjunto de dados, descobrir valores discrepantes e eventos an\u00f4malos e, por fim, identificar as rela\u00e7\u00f5es entre as vari\u00e1veis.<\/p>\n\n\n\n

A an\u00e1lise explorat\u00f3ria de dados \u00e9 extremamente importante para a \u00e1rea de Data Science. Primeiro, ela \u00e9 utilizada para garantir que os resultados sejam v\u00e1lidos e aplic\u00e1veis a qualquer objetivo desejado.<\/p>\n\n\n\n

Em segundo lugar, a an\u00e1lise explorat\u00f3ria <\/a>ajuda as partes interessadas a garantir que est\u00e3o fazendo as perguntas corretas. Al\u00e9m disso, auxilia na resposta a quest\u00f5es sobre desvios padr\u00e3o, vari\u00e1veis categ\u00f3ricas e intervalos de confian\u00e7a.<\/p>\n\n\n\n

Finalmente, uma vez conclu\u00edda a an\u00e1lise explorat\u00f3ria e extra\u00eddos os insights, seus resultados podem ser usados para an\u00e1lises ou modelagens mais sofisticadas, incluindo aprendizado de m\u00e1quina.<\/p>\n\n\n\n

Tipos de an\u00e1lise explorat\u00f3ria de dados<\/strong><\/h2>\n\n\n\n

Existem principalmente quatro tipos de an\u00e1lise explorat\u00f3ria de dados:<\/p>\n\n\n\n

1. Univariada n\u00e3o gr\u00e1fica<\/strong><\/h3>\n\n\n\n

A an\u00e1lise univariada n\u00e3o gr\u00e1fica \u00e9 a forma mais simples de an\u00e1lise de dados e envolve apenas uma vari\u00e1vel. Como se trata de uma \u00fanica vari\u00e1vel, n\u00e3o se analisa causas ou rela\u00e7\u00f5es. O principal objetivo \u00e9 descrever os dados e identificar padr\u00f5es neles.<\/p>\n\n\n\n

2. Gr\u00e1fico univariado<\/strong><\/h3>\n\n\n\n

M\u00e9todos n\u00e3o gr\u00e1ficos podem n\u00e3o fornecer uma vis\u00e3o completa dos dados, por isso s\u00e3o necess\u00e1rios m\u00e9todos gr\u00e1ficos. Alguns tipos comuns de gr\u00e1ficos univariados s\u00e3o:<\/p>\n\n\n\n