Hist python matplotlib label

matplotlib.pyplot.hist

matplotlib.pyplot.hist( x , bins=None , range=None , Density=False , Weights=None , cumulative=False , bottom=None , histtype=’bar’ , align=’mid’ , Orientation=’vertical’ , rwidth=None , log=False , color=None , label=None , stacked=False , * , data=None , **kwargs ) [источник]

Вычислить и построить гистограмму.

Этот метод использует numpy.histogram для группировки данных по x и подсчета количества значений в каждой ячейке, а затем рисует распределение либо как BarContainer , либо как Polygon . Параметры ячеек , диапазона , плотности и веса передаются в numpy.histogram .

Если данные уже собраны и подсчитаны, используйте bar или stairs для построения графика распределения:

counts, bins = np.histogram(x) plt.stairs(bins, counts)

В качестве альтернативы можно построить предварительно вычисленные ячейки и подсчеты с помощью hist() , рассматривая каждую ячейку как одну точку с весом, равным ее количеству:

plt.hist(bins[:-1], bins, weights=counts) 

Входные данные x могут быть единичным массивом, списком наборов данных потенциально разной длины ([ x0 , x1 , . ]) или двумерным ndarray, в котором каждый столбец является набором данных. Обратите внимание, что форма ndarray транспонирована относительно формы списка. Если ввод представляет собой массив, то возвращаемое значение представляет собой кортеж ( n , bins , patches ); если вход представляет собой последовательность массивов, то возвращаемое значение представляет собой кортеж ([ n0 , n1 , . ], bins , [ patches0 , patches1 , . ]).

Маскированные массивы не поддерживаются.

Parameters: x (n,) массив или последовательность (n,) массивов

Входные значения,это занимает либо один массив,либо последовательность массивов,которые не должны быть одинаковой длины.

bins int или sequence или str, по умолчанию: rcParams[«hist.bins»] (по умолчанию: 10 )

Если интервал является целым числом, он определяет количество интервалов одинаковой ширины в диапазоне.

Если ячейки — это последовательность, она определяет края ячейки, включая левый край первой ячейки и правый край последней ячейки; в этом случае интервалы могут быть расположены неравномерно. Все, кроме последней (самой правой) корзины, полуоткрыты. Другими словами, если бункеры есть:

тогда первая ячейка — это [1, 2) (включая 1, но исключая 2), а вторая — [2, 3) . Однако последняя ячейка — это [3, 4] , которая включает 4.

Если bins является строкой, это одна из стратегий numpy.histogram_bin_edges поддерживаемых numpy.histogram_bin_edges : ‘auto’, ‘fd’, ‘doane’, ‘scott’, ‘stone’, ‘ris’, ‘sturges’ или ‘sqrt ‘.

range tuple или None, по умолчанию: None

Нижний и верхний диапазон ящиков. Нижние и верхние выбросы игнорируются. Если не (x.min(), x.max()) , диапазон равен (x.min (), x.max ()) . Диапазон не действует, если интервалы являются последовательностью.

Если бункера представляет собой последовательность или диапазон определен, автомасштабирование на основе указанного диапазона бен вместо диапазона х.

density bool, по умолчанию: False

Если True , нарисуйте и верните плотность вероятности: каждая ячейка будет отображать необработанный счетчик ячейки, разделенный на общее количество счетчиков и ширину ячейки ( density = counts / (sum(counts) * np.diff(bins)) ), поэтому что область под гистограммой интегрируется до 1 ( np.sum(density * np.diff(bins)) == 1 ).

Если stacked также True , сумма гистограмм нормализуется до 1.

weights (n,) как в виде массива или None, по умолчанию: None

Массив весов той же формы, что и x . Каждое значение в x только вносит свой связанный вес в счетчик бункеров (вместо 1). Если для плотности установлено значение True , веса нормализуются, так что интеграл плотности по диапазону остается равным 1.

кумулятивное логическое значение или -1, по умолчанию: False

Если True , то вычисляется гистограмма, где каждая ячейка дает счетчики в этой ячейке плюс все ячейки для меньших значений. Последняя ячейка дает общее количество точек данных.

Если значение плотности также равно True , гистограмма нормализуется таким образом, что последний интервал равен 1.

Если кумулятивное число меньше 0 (например, -1), направление накопления меняется на противоположное. В этом случае, если плотность также True , гистограмма нормализуется так, что первый интервал равен 1.

нижний массив, скаляр или None, по умолчанию: None

Расположение дна каждого бункера, т.е. бункеров взяты из bottom части к bottom + hist(x, bins) Если скаляр, в нижней части каждого бункера смещаются на ту же величину. Если это массив, каждая ячейка сдвигается независимо, и длина дна должна соответствовать количеству ячеек. Если Нет, по умолчанию 0.

Тип гистограммы для рисования.

  • «bar» — это традиционная гистограмма в виде столбиков. Если дано несколько данных, полосы располагаются рядом.
  • «barstacked» — это гистограмма в виде столбцов, в которой несколько данных накладываются друг на друга.
  • ‘step’ генерирует линейную диаграмму, которая по умолчанию не заполнена.
  • ‘stepfilled’ генерирует линейный график, который по умолчанию заполнен.

Горизонтальное выравнивание полос гистограммы.

  • ‘left’: полосы по центру левого края корзины.
  • ‘mid’: полосы располагаются по центру между краями контейнера.
  • ‘right’: полосы центрируются по правому краю корзины.

Если «горизонтальные», barh будет использоваться для гистограмм штриха-типа , а нижняя kwarg будет левый края.

rwidth float или None, по умолчанию: None

Относительная ширина полос как часть ширины корзины. Если None , автоматически вычисляется ширина.

Игнорируется, если histtype равен ‘step’ или ‘stepfilled’.

log bool, по умолчанию: False

Если True , ось гистограммы будет установлена ​​в логарифмическом масштабе.

color цвет или массив цветов или None, по умолчанию: None

Цвет или последовательность цветов, по одному на набор данных. По умолчанию ( None ) используется стандартная последовательность цветов линий.

label str или None, по умолчанию: None

Строка или последовательность строк для соответствия нескольким наборам данных. Гистограммы дают несколько патчей для каждого набора данных, но только первый получает метку, так что legend будет работать должным образом.

stacked bool, по умолчанию: False

Если True , несколько данных накладываются друг на друга. Если False , несколько данных располагаются бок о бок, если histtype равно ‘bar’, или друг над другом, если histtype равно ‘step’

Returns: n массив или список массивов

Значения интервалов гистограммы. См. Плотность и веса для описания возможной семантики. Если вход x является массивом, то это массив длины nbins . Если ввод представляет собой последовательность массивов [data1, data2, . ] , то это список массивов со значениями гистограмм для каждого из массивов в том же порядке. Тип d для массива n (или его массивов элементов) всегда будет с плавающей точкой, даже если не используются весовые коэффициенты или нормализация.

Края мусорных баков.Длина nbins+1 (nbins левые края и правый край последнего бина).Всегда один массив,даже если передано несколько наборов данных.

патчи BarContainer или список одного Polygon или список таких объектов

Контейнер отдельных художников,используемый для создания гистограммы,или список таких контейнеров,если имеется несколько входных наборов данных.

Other Parameters: индексируемый объект данных , необязательно

Если указано, следующие параметры также принимают строку s , которая интерпретируется как data[s] (если это не вызывает исключение):

Двумерная гистограмма с прямоугольными бинами

Двумерная гистограмма с шестиугольными бинами

Notes

Для большого количества бинов (> 1000) построение графика может быть значительно быстрее, если для параметра histtype задано значение «шаг» или «шаговое заполнение», а не «гистограмма» или «гистограмма».

Источник

Plotting Histogram in Python using Matplotlib

A histogram is basically used to represent data provided in a form of some groups.It is accurate method for the graphical representation of numerical data distribution.It is a type of bar plot where X-axis represents the bin ranges while Y-axis gives information about frequency.

Creating a Histogram

To create a histogram the first step is to create bin of the ranges, then distribute the whole range of the values into a series of intervals, and count the values which fall into each of the intervals.Bins are clearly identified as consecutive, non-overlapping intervals of variables.The matplotlib.pyplot.hist() function is used to compute and create histogram of x.

The following table shows the parameters accepted by matplotlib.pyplot.hist() function :

Attribute parameter
x array or sequence of array
bins optional parameter contains integer or sequence or strings
density optional parameter contains boolean values
range optional parameter represents upper and lower range of bins
histtype optional parameter used to create type of histogram [bar, barstacked, step, stepfilled], default is “bar”
align optional parameter controls the plotting of histogram [left, right, mid]
weights optional parameter contains array of weights having same dimensions as x
bottom location of the baseline of each bin
rwidth optional parameter which is relative width of the bars with respect to bin width
color optional parameter used to set color or sequence of color specs
label optional parameter string or sequence of string to match with multiple datasets
log optional parameter used to set histogram axis on log scale

Let’s create a basic histogram of some random values. Below code creates a simple histogram of some random values:

Источник

Читайте также:  Javascript utf8 to string
Оцените статью