Визуализация данных в Python: Matplotlib & Seaborn

Библиотеки Python Matplotlib и Seaborn предназначены для визуализации данных. Рассмотрим их возможности и создание различных типов графиков.

Matplotlib и Seaborn: обзор

Matplotlib — популярная библиотека Python для создания статических и анимированных визуализаций. Она предлагает инструменты для построения различных графиков, легко интегрируемых в презентации и отчеты.

Seaborn — библиотека, основанная на Matplotlib, упрощающая создание сложных, стильных и информативных графиков. Она улучшает внешний вид результатов анализа данных.

Установка и подключение

Установка библиотек выполняется через терминал командой: pip install matplotlib seaborn

Подключение в коде:

import matplotlib.pyplot as plt
import seaborn as sns

Matplotlib: основные функции

Matplotlib предоставляет множество функций для построения графиков. Рассмотрим основные:

  • plot(): Создает линейный график. Принимает данные для осей X и Y, параметры цвета, стиля линии и маркеров. plt.show() отображает график.
  • figure(): Создает новое окно графика. Позволяет настроить размер (в дюймах), разрешение (точек на дюйм) и цвет фона.
  • scatter(): Создает точечный график. Принимает данные для осей X и Y, параметры цвета, размера и прозрачности точек.
  • bar(): Создает столбчатую диаграмму. Принимает метки категорий для оси X, высоты столбцов, их цвет и ширину.
  • hist(): Создает гистограмму распределения данных по интервалам. Принимает данные, количество интервалов, цвет и прозрачность.
  • boxplot(): Создает коробчатую диаграмму распределения данных с медианой, квартилями и выбросами. Основные параметры: данные, ориентация (вертикальная по умолчанию).
  • xlabel(), ylabel(), title(): Устанавливают подписи для осей X и Y и заголовок графика.
  • legend(): Добавляет легенду. Указывает её расположение (например, ‘best’, ‘upper right’, ‘lower left’).
  • grid(): Включает систему сеток. Параметры: тип сетки, цвет и стиль линий.
  • xlim(), ylim(): Устанавливают пределы для осей X и Y.
  • savefig(): Сохраняет график в файл, указав имя файла и разрешение изображения.

Пример Matplotlib

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [2, 4, 1, 3, 5]

plt.figure(figsize=(8, 6))
plt.plot(x, y, label='Линия', color='red', marker='o')
plt.xlabel('Ось X')
plt.ylabel('Ось Y')
plt.title('Пример графика')
plt.legend()
plt.grid(True)
plt.xlim(0, 6)
plt.ylim(0, 6)
plt.savefig('example_plot.png')
plt.show()

Seaborn: основные функции

Seaborn использует данные из набора iris для демонстрации возможностей:

  • sns.histplot(): Создает гистограмму с возможностью отображения сглаженной линии распределения (kde).
  • sns.scatterplot(): Создает точечный график.
  • sns.boxplot(): Создает коробчатую диаграмму.
  • sns.heatmap(): Создает тепловую карту для визуализации корреляционной матрицы.
  • sns.pairplot(): Создает матрицу графиков, показывающую распределение каждой переменной и взаимосвязь между парами переменных.

Пример Seaborn

import seaborn as sns
import matplotlib.pyplot as plt

iris = sns.load_dataset('iris')

sns.histplot(iris['sepal_length'], kde=True)
plt.title('Гистограмма длины чашелистика')
plt.show()

sns.scatterplot(x='sepal_length', y='sepal_width', data=iris)
plt.title('Точечный график')
plt.show()

sns.boxplot(x='species', y='sepal_length', data=iris)
plt.title('Коробчатая диаграмма')
plt.show()

corr = iris.corr()
sns.heatmap(corr, annot=True)
plt.title('Тепловая карта корреляции')
plt.show()

sns.pairplot(iris)
plt.show()

Применение в проекте

Пример: добавление графиков в проект с использованием Matplotlib и Seaborn для построения столбчатых диаграмм. Замена plt.bar() на sns.barplot() улучшает визуальное представление данных.

Рассмотрены основные возможности библиотек Matplotlib и Seaborn для визуализации данных в Python. Они позволяют создавать информативные и привлекательные графики, улучшая представление результатов анализа данных.

Что будем искать? Например,программа