Matplotlib — потужна бібліотека для побудови графіків, яка використовується в мові програмування Python. Він надає об’єктно-орієнтований API для вбудовування графіків у програми, які використовують набори інструментів GUI загального призначення, такі як Tkinter, wxPython або Qt. Одним із важливих інструментів, які надає Matplotlib, є можливість створення діаграми довірчого інтервалу.
Довірчий інтервал, як статистичний термін, відноситься до ступеня достовірності методу вибірки. Рівень впевненості показує, наскільки ви можете бути впевнені, виражений у відсотках. Наприклад, рівень достовірності 99% означає, що кожна з ваших оцінок ймовірності, швидше за все, буде точною в 99% випадків.
Створення діаграми довірчого інтервалу за допомогою Matplotlib
Створення діаграми довірчого інтервалу в Matplotlib включає кілька кроків. Давайте заглибимося в пояснення відповідного коду Python для виконання цих кроків:
Спочатку нам потрібно імпортувати необхідні бібліотеки:
import matplotlib.pyplot as plt import numpy as np from scipy.stats import sem, t from scipy import mean
Тепер ми можемо обчислити довірчий інтервал, виконавши ці дії.
1. Визначте випадковий набір даних, для якого будемо обчислювати довірчий інтервал.
2. Обчисліть середнє значення та стандартну помилку набору даних.
3. Визначити похибку для довірчого інтервалу.
4. Нарешті, обчисліть діапазон довірчого інтервалу.
Ось код Python, який відповідає цим крокам.
confidence = 0.95 data = np.random.rand(100) n = len(data) m = mean(data) std_err = sem(data) h = std_err * t.ppf((1 + confidence) / 2, n - 1) start = m - h end = m + h
Змінна 'confidence' — це рівень достовірності, виражений у відсотках, а 'data' містить випадковий набір даних. Середнє значення та стандартна помилка обчислюються за допомогою функції «середнє» та «sem» бібліотеки SciPy відповідно. Допустима похибка «h» визначається множенням стандартної похибки на t-показник, який ми отримуємо з t-розподілу за допомогою функції «ppf». Нарешті, ми обчислюємо діапазон довірчого інтервалу.
Побудова довірчого інтервалу в Matplotlib
У цьому останньому розділі коду ми використовуємо Matplotlib для візуалізації довірчого інтервалу.
plt.figure(figsize=(9,6)) plt.bar(np.arange(len(data)), data) plt.fill_between(np.arange(len(data)), start, end, color='b', alpha=0.1) plt.title('Confidence Interval') plt.show()
Він використовує стовпчасту діаграму для відображення даних і метод «fill_between» для представлення довірчого інтервалу. Функція 'figure' ініціалізує нову фігуру, а функція 'show' представляє графік.
Створення графіка довірчого інтервалу у Matplotlib — це зручний спосіб візуального аналізу ваших даних, особливо даних, які включають статистичний аналіз. Цей потужний інструмент пропонує простий та інтуїтивно зрозумілий спосіб представляти складні дані у формі, яку можна легко інтерпретувати, що робить його важливим набором інструментів для будь-якого аналітика даних Python або вченого. Розуміючи, як цим маніпулювати та використовувати, ми можемо зробити процес інтерпретації даних більш ефективним і точним.