A biblioteca Matplolib torna possível a apresentação de insights dentro de um projeto de ciência de dados programado com Python

O Python é uma linguagem de programação popular usada em uma ampla variedade de aplicativos.

É uma das melhores linguagens usadas na ciência de dados por fornecer recursos para lidar com matemática, estatística e funções científicas, que se torna mais acessível com o uso de ferramentas como o Matplotlib.

A visualização de dados é um componente essencial do conjunto de habilidades de um cientista de dados.

Ela torna possível apresentar os insights encontrados na análise dos dados na forma de belos gráficos estéticos. Nesse contexto, o Matplotlib se torna essencial para comunicar as descobertas de um projeto de análise de dados.

Navegue pelo índice

    O que é Python Matplotlib?

    O Matplotlib é uma biblioteca Python frequentemente utilizada para ciência de dados. A ferramenta de código aberto oferece recursos de plotagem para a criação de gráficos 2D e 3D com visualizações estáticas, animadas e interativas.

    Ele pode ser usado em scripts python, shell, servidores de aplicativos da web e outros kits de ferramentas de interface gráfica do usuário.

    Criado em 2003, o Matplotlib é uma extensão do NumPy, outra biblioteca de programação Python usada para concluir funções matemáticas.

    O Matplotlib é útil para transformar análises e operações estatísticas em descobertas visualmente interessantes, uma habilidade importante para quem tenta extrair e comunicar insights de dados.

    O Matplotlib pode criar diferentes tipos de relatórios de visualização, como:

    • histogramas;
    • gráficos de linhas;
    • gráficos de dispersão;
    • gráficos de barras;
    • gráficos de pizza;
    • diagrama de caixa.

    E muitas outras opções de vizualizações, com apenas algumas linhas de programação.

    Para isso, a ferramenta usa uma interface de programação de aplicações (API) para incorporar os gráficos nos aplicativos GUI.

    Características do Matplotlib

    Um dos recursos mais importantes do Matplotlib é sua capacidade de funcionar bem com muitos sistemas operacionais e back-ends gráficos.

    Os usuários têm controle total de estilos de linha, propriedades de fonte e propriedades de eixos, por meio de uma interface orientada a objetos.

    O código Matplotlib é conceitualmente dividido em três partes:

    • A interface pylab é o conjunto de funções fornecidas pelo matplotlib.pylab que permite ao usuário criar gráficos com código bastante semelhante ao código de geração de figura MATLAB.

    • O frontend Matplotlib ou API Matplotlib é o conjunto de classes que fazem o trabalho pesado, criando e gerenciando figuras, texto, linhas e gráficos.

    • Os back-ends são dispositivos de desenho dependentes de dispositivo, também conhecidos como renderizadores, que transformam a representação do front-end em uma cópia impressa ou em um dispositivo de exibição.

    Vantagens e desvantagens do Matplotlib

    O Matplotlib é útil na modelagem de aprendizado de máquina, um dos principais usos da linguagem de programação Python.

    Os programadores podem acessar essa biblioteca para integrar os resultados com todos os outros elementos e recursos de um programa de machine learning, uma rede neural ou outra máquina avançada.

    A utilidade do Matplotlib tem a ver com números e ferramentas de plotagem visual.

    Como esses recursos são mais analíticos do que geradores, a biblioteca funciona em conjunto para permitir que os programas de aprendizado de máquina produzam resultados úteis e de fácil visualização para manipuladores humanos.

    Por outro lado, o Matplotlib também é uma biblioteca enorme, com mais de 70 mil linhas de código no total.

    Conseguir um gráfico para ter a aparência certa geralmente é obtido por tentativa e erro. A documentação pública é ampla, mas pode estar desatualizada.

    Além disso, a biblioteca é complexa por abrigar várias interfaces e pode interagir com diversos back-ends.

    Como usar o Matplotlib

    O Matplotlib não faz parte das bibliotecas padrão que são instaladas junto com Python.

    Por isso é necessário instalar a biblioteca de visualização de dados que tem pacotes oficiais para macOS, Windows e Linux no Python Package Index (PyPI), podendo ser instalado pelo comando:

    python -m pip install matplotlib

    A biblioteca também pode ser importada, a partir da linha:

    import matplotlib.pyplot as plt

    Depois, é possível gerar gráficos básicos com apenas algumas linhas de comando. Confira alguns exemplos.

    Gráfico simples

    Exemplo de gráfico de linha que foi feito através da biblioteca Python Matplotlib.
    (Fonte: Edureka/Reprodução)

    Com duas linhas de código, é possível gerar um gráfico simples usando Python Matplotlib:

    plt.plot([1,2,3],[4,5,1])

    plt.show()

    Gráfico de barras

    Exemplo de gráfico de barras que foi feito através da biblioteca Python Matplotlib.
    (Fonte: Edureka/Reprodução)

    Um gráfico de barras é adequado para medir as mudanças durante um período de tempo. Pode ser representado na horizontal ou na vertical.

    plt.bar([0.25,1.25,2.25,3.25,4.25],[50,40,70,80,20],

    label=”BMW”,width=.5)

    plt.bar([.75,1.75,2.75,3.75,4.75],[80,20,20,50,60],

    label=”Audi”, color=’r’,width=.5)

    plt.legend()

    plt.xlabel(‘Days’)

    plt.ylabel(‘Distance (kms)’)

    plt.title(‘Information’)

    plt.show()

    Histograma

    Exemplo de histograma que foi feito através da biblioteca Python Matplotlib.
    (Fonte: Edureka/Reprodução)

    Os histogramas são úteis quando há matrizes ou uma lista muito longa que não cabe dentro de um gráfico de barras.

    population_age = [22,55,62,45,21,22,34,42,42,4,2,102,95,85,55,110,120,70,65,55,111,115,80,75,65,54,44,43,42,48]

    bins = [0,10,20,30,40,50,60,70,80,90,100]

    plt.hist(population_age, bins, histtype=’bar’, rwidth=0.8)

    plt.xlabel(‘age groups’)

    plt.ylabel(‘Number of people’)

    plt.title(‘Histogram’)

    plt.show()

    Gráfico de Dispersão

    Exemplo de gráfico de dispersão que foi feito através da biblioteca Python Matplotlib.
    (Fonte: Edureka/Reprodução)

    Os gráficos de dispersão exibem dados como uma coleção de pontos, cada um tendo o valor de uma variável que determina a posição no eixo horizontal e o valor de outra variável determina a posição no eixo vertical.

    x = [1,1.5,2,2.5,3,3.5,3.6]

    y = [7.5,8,8.5,9,9.5,10,10.5]

    x1=[8,8.5,9,9.5,10,10.5,11]

    y1=[3,3.5,3.7,4,4.5,5,5.2]

    plt.scatter(x,y, label=’high income low saving’,color=’r’)

    plt.scatter(x1,y1,label=’low income high savings’,color=’b’)

    plt.xlabel(‘saving*100’)

    plt.ylabel(‘income*1000’)

    plt.title(‘Scatter Plot’)

    plt.legend()

    plt.show()

    Gráfico de Área

    Exemplo de gráfico de área que foi feito através da biblioteca Python Matplotlib.
    (Fonte: Edureka/Reprodução)

    Os gráficos de área são usados para demonstrar mudanças ao longo do tempo para dois ou mais grupos relacionados que compõem uma categoria inteira.

    days = [1,2,3,4,5]

    sleeping =[7,8,6,11,7]

    eating = [2,3,4,3,2]

    working =[7,8,7,2,2]

    playing = [8,5,7,8,13]

    plt.plot([],[],color=’m’, label=’Sleeping’, linewidth=5)

    plt.plot([],[],color=’c’, label=’Eating’, linewidth=5)

    plt.plot([],[],color=’r’, label=’Working’, linewidth=5)

    plt.plot([],[],color=’k’, label=’Playing’, linewidth=5)

    plt.stackplot(days, sleeping,eating,working,playing, colors=[‘m’,’c’,’r’,’k’])

    plt.xlabel(‘x’)

    plt.ylabel(‘y’)

    plt.title(‘Stack Plot’)

    plt.legend()

    plt.show()

    Gráfico de pizza

    Exemplo de gráfico de pizza que foi feito através da biblioteca Python Matplotlib.
    (Fonte: Edureka/Reprodução)

    Um gráfico de pizza é um círculo dividido em segmentos, que representam dados percentuais ou proporcionais.

    days = [1,2,3,4,5]

    sleeping =[7,8,6,11,7]

    eating = [2,3,4,3,2]

    working =[7,8,7,2,2]

    playing = [8,5,7,8,13]

    slices = [7,2,2,13]

    activities = [‘sleeping’,’eating’,’working’,’playing’]

    cols = [‘c’,’m’,’r’,’b’]

    plt.pie(slices,

    labels=activities,

    colors=cols,

    startangle=90,

    shadow= True,

    explode=(0,0.1,0,0),

    autopct=’%1.1f%%’)

    plt.title(‘Pie Plot’)

    plt.show()

    Automatize seus servidores e suas rotinas API. Conheça o Servidor VPS da Locaweb.

    Clique aqui