Gráfico de violino

Exemplo de um gráfico de violino em uma publicação científica na PLOS Pathogens.

Um gráfico de violino é um método de representação de dados numéricos. É semelhante a um gráfico de caixa, com a adição de um gráfico de densidade do kernel girado em cada lado. [1]

Os gráficos de violino são semelhantes aos gráficos de caixa, exceto que eles também mostram a densidade de probabilidade dos dados em valores diferentes, geralmente suavizados por um estimador de densidade do kernel. Normalmente, um gráfico de violino incluirá todos os dados que estão em um gráfico de caixa: um marcador para a mediana dos dados, uma caixa ou marcador indicando o intervalo interquartil, e possivelmente todos os pontos amostrais, se o número de amostras não for muito alto.

Os gráficos de violino estão disponíveis como extensões para vários pacotes de software, como DataVisualization no CRAN [2] e o pacote md-plot no PyPI. [3]

Um gráfico de violino é mais informativo do que um gráfico de caixa simples. Enquanto um gráfico de caixa mostra apenas estatísticas resumidas, como média/mediana e intervalos interquartis, o gráfico de violino mostra a distribuição completa dos dados. A diferença é particularmente útil quando a distribuição de dados é multimodal (mais de um pico). Neste caso, um gráfico de violino mostra a presença de diferentes picos, sua posição e amplitude relativa.

Como os gráficos de caixa, os gráficos de violino são usados para representar a comparação de uma distribuição de uma variável (ou distribuição de amostra) em diferentes "categorias" (por exemplo, distribuição de temperatura comparada entre dia e noite ou distribuição de preços de carros comparados entre diferentes fabricantes de automóveis).

Os gráficos de violino estão disponíveis como extensões para vários pacotes de software, incluindo os pacotes R vioplot, wvioplot, caroline, UsingR, lattice e ggplot2, o comando add-on Stata vioplot, [4] e as bibliotecas Python matplotlib, [5] Plotly, [6] ROOT [7] e Seaborn, [8] um tipo de gráfico no Origin, [9] IGOR Pro, [10] Julia pacote de plotagem estatística StatsPlots.jl [11] e DistributionChart no Mathematica.

Referências

  1. «Violin Plot». NIST DataPlot. National Institute of Standards and Technology. 13 de outubro de 2015 
  2. «CRAN - Package DataVisualization». 12 de janeiro de 2021 
  3. «md-plot . PyPI» 
  4. Hintze, Jerry L.; Nelson, Ray D. (1998). «Violin Plots: A Box Plot-Density Trace Synergism». The American Statistician. 52 (2): 181–4. doi:10.1080/00031305.1998.10480559 
  5. «violin plots». What's new in matplotlib 
  6. «Violin Plots in Python». Plotly Python API Library Reference 
  7. «The Violin option». Consultado em 5 de maio de 2020 
  8. Waskom, Michael. «Violinplot from a wide-form dataset». Seaborn: statistical data visualization 
  9. «Violin Plot in Origin 2019». 10 de setembro de 2018. Consultado em 29 de outubro de 2018 
  10. «Igor Pro 8 Highlights». Wavemetrics. Consultado em 28 de julho de 2019 
  11. «boxplot, dotplot, and violin». Consultado em 15 de agosto de 2020