Библиотеки Python Matplotlib и Seaborn предназначены для визуализации данных. Рассмотрим их возможности и создание различных типов графиков.
Matplotlib и Seaborn: обзор
Matplotlib — популярная библиотека Python для создания статических и анимированных визуализаций. Она предлагает инструменты для построения различных графиков, легко интегрируемых в презентации и отчеты.
Seaborn — библиотека, основанная на Matplotlib, упрощающая создание сложных, стильных и информативных графиков. Она улучшает внешний вид результатов анализа данных.
Установка и подключение
Установка библиотек выполняется через терминал командой: pip install matplotlib seaborn
Подключение в коде:
import matplotlib.pyplot as plt
import seaborn as sns
Matplotlib: основные функции
Matplotlib предоставляет множество функций для построения графиков. Рассмотрим основные:
- plot(): Создает линейный график. Принимает данные для осей X и Y, параметры цвета, стиля линии и маркеров. plt.show() отображает график.
- figure(): Создает новое окно графика. Позволяет настроить размер (в дюймах), разрешение (точек на дюйм) и цвет фона.
- scatter(): Создает точечный график. Принимает данные для осей X и Y, параметры цвета, размера и прозрачности точек.
- bar(): Создает столбчатую диаграмму. Принимает метки категорий для оси X, высоты столбцов, их цвет и ширину.
- hist(): Создает гистограмму распределения данных по интервалам. Принимает данные, количество интервалов, цвет и прозрачность.
- boxplot(): Создает коробчатую диаграмму распределения данных с медианой, квартилями и выбросами. Основные параметры: данные, ориентация (вертикальная по умолчанию).
- xlabel(), ylabel(), title(): Устанавливают подписи для осей X и Y и заголовок графика.
- legend(): Добавляет легенду. Указывает её расположение (например, ‘best’, ‘upper right’, ‘lower left’).
- grid(): Включает систему сеток. Параметры: тип сетки, цвет и стиль линий.
- xlim(), ylim(): Устанавливают пределы для осей X и Y.
- savefig(): Сохраняет график в файл, указав имя файла и разрешение изображения.
Пример Matplotlib
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [2, 4, 1, 3, 5]
plt.figure(figsize=(8, 6))
plt.plot(x, y, label='Линия', color='red', marker='o')
plt.xlabel('Ось X')
plt.ylabel('Ось Y')
plt.title('Пример графика')
plt.legend()
plt.grid(True)
plt.xlim(0, 6)
plt.ylim(0, 6)
plt.savefig('example_plot.png')
plt.show()
Seaborn: основные функции
Seaborn использует данные из набора iris для демонстрации возможностей:
- sns.histplot(): Создает гистограмму с возможностью отображения сглаженной линии распределения (kde).
- sns.scatterplot(): Создает точечный график.
- sns.boxplot(): Создает коробчатую диаграмму.
- sns.heatmap(): Создает тепловую карту для визуализации корреляционной матрицы.
- sns.pairplot(): Создает матрицу графиков, показывающую распределение каждой переменной и взаимосвязь между парами переменных.
Пример Seaborn
import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset('iris')
sns.histplot(iris['sepal_length'], kde=True)
plt.title('Гистограмма длины чашелистика')
plt.show()
sns.scatterplot(x='sepal_length', y='sepal_width', data=iris)
plt.title('Точечный график')
plt.show()
sns.boxplot(x='species', y='sepal_length', data=iris)
plt.title('Коробчатая диаграмма')
plt.show()
corr = iris.corr()
sns.heatmap(corr, annot=True)
plt.title('Тепловая карта корреляции')
plt.show()
sns.pairplot(iris)
plt.show()
Применение в проекте
Пример: добавление графиков в проект с использованием Matplotlib и Seaborn для построения столбчатых диаграмм. Замена plt.bar() на sns.barplot() улучшает визуальное представление данных.
Рассмотрены основные возможности библиотек Matplotlib и Seaborn для визуализации данных в Python. Они позволяют создавать информативные и привлекательные графики, улучшая представление результатов анализа данных.