Данные: непрерывные или дискретные?
При выборе типа данных всегда полезно анализировать непрерывные данные, а не дискретные, поскольку дискретные данные, хотя и изучаются при больших выборках, не будут разбиты на значимую информацию. Непрерывные данные можно разбить на более мелкие части и сделать данные информативными для принятия решений. Основываясь на непрерывных данных, мы можем оценить, насколько среднее значение процесса близко или далеко от цели, и выходим ли мы за пределы контрольных границ процесса или остаемся в них.
Пример 1: непрерывные данные вместо дискретных
Диаметр трубы составляет 10 мм, и превышение на 1 мм — это нормально. Что касается статистики, то на очень высоком уровне, результат процесса классифицируется на <10 мм, между 10 мм и 11 мм и >11 мм. Соответствие будет прогнозироваться в виде дискретных данных, поскольку категории/границы определяются и учитываются как дефекты. Это не имеет никакого значения для принятия решений. Но когда данные представлены как непрерывные на диаграмме I-MR, то может быть выявлено количество деталей, выходящих за пределы спецификации, основная причина будет выявлена и устранена. С дискретными данными это невозможно. Следовательно, непрерывные данные всегда предпочтительнее.
Пример 2: дискретные данные вместо непрерывных
Допустим, у 20 сотрудников, работающих в процессе АВС, контролируют соблюдение времени прихода на работу. Время входа в систему сравнивается с целевым временем начала смены и отображается на диаграмме временных рядов в виде непрерывных данных для определения процента дефектов. Но они будут совершенно бессмысленны, если нам придется подсчитывать количество дефектов и сообщать, сколько из них опоздало и сколько пришло вовремя. Следовательно, для такого типа данных, хотя данные собраны из сценариев реального времени и обладают непрерывными характеристиками данных, имеет смысл процент представлять в виде дискретных данных. Такие случаи, как среднее время доставки, время обработки, время входа в систему и т. д., подпадают под непрерывные данные. Но для целей отчетности полезно представлять их как дискретные.
Примеры | Непрерывные | Дискретные |
Время выхода на смену |
Время входа фиксируется для всех работников | Для целей отчетности непрерывные данные преобразуются в дискретные (позже, раньще, вовремя) |
Минимальный баланс на банковском счете |
Баланс фиксируется для всех клиентов | Классифицируется как "поддерживается/не поддерживается" |
Значение уровня топлива в баке |
Значение уровня топлива в литрах | Индикатор показывает "Полный/половина/пустой" |
Рост и вес детей |
Рост отмечается для каждого ребенка и сравнивается с таблицей соответствия возрасту | Сколько детей имеют достаточный/недостаточный вес? |
Означает ли это, что достаточно хороши только непрерывные данные? Конечно, нет. Оба типа играют разную роль. Для принятия решений, анализа непрерывные данные более значимы, но для целей отчетности на высоком уровне лучше использовать дискретные данные. Итак, ответ: это зависит от основной характеристики, которую мы хотим измерить/собрать и представить. Если это непрерывные данные, у вас будет возможность сообщить о них как о непрерывных, дискретных или о том и другом.