-
- Главная
- Фармакопея
- ФСО
- Общая информация
Утверждена приказом: | Приказ Минздрава России от 13.03.2024 № 120 |
Дата введения в действие: | c 13.03.2024 |
Издание: | Государственная фармакопея Российской Федерации XV издания |
Раздел: | 1.1. Общие положения |
Тип: | Общая фармакопейная статья (ОФС) |
Номер: | ОФС.1.1.0013 |
Внутр.№: | 4329.2 |
Статус: | Действующая статья |
Срок приведения нормативной документации в соответствие с ОФС/ФС: | 01.03.2027 |
МИНИСТЕРСТВО ЗДРАВООХРАНЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Статистическая обработка результатов физических, физико-химических и химических испытаний |
||
Настоящая общая фармакопейная статья содержит сведения об основных статистических подходах к обработке и оценке данных, полученных при проведении испытаний лекарственных средств физическими, физико-химическими и химическими методами анализа.
Задача статистической обработки результатов многократных измерений заключается в нахождении оценки измеряемой величины и доверительного интервала, в котором находится истинное значение. Статистические методы обработки результатов измерений используют для описания полученных данных, наиболее близких к истинному значению, для оценки систематических и случайных погрешностей измерений ‒ результатов испытаний.
Статистическая обработка результатов физических, физико-химических и химических испытаний, которые могут быть изменчивыми, позволяет научно обосновывать и корректно интерпретировать полученные аналитические данные, а затем на их основе решать ряд прикладных задач, связанных с определением статистической достоверности результатов испытаний лекарственных средств. Правильное применение статистических принципов к аналитическим данным испытаний лекарственных средств возможно при условии, что такие данные собраны, зарегистрированы прослеживаемым образом и не содержат систематических ошибок. Получение таких данных необходимо осуществлять в соответствии с требованиями ОФС «Отбор проб», ОФС «Стандартные образцы», ОФС «Валидация аналитических методик». В настоящей общей фармакопейной статье используются некоторые термины, определение которых приведено в ОФС «Отбор проб» и ОФС «Валидация аналитических методик».
Представленные в настоящей общей фармакопейной статье данные носят информационный характер и не являются исчерпывающими.
a – свободный член линейной зависимости;
b – угловой коэффициент линейной зависимости;
f – число степеней свободы; функция плотности вероятности нормального распределения;
i – порядковый номер варианты;
L – фактор, используемый при оценке сходимости результатов параллельных определений;
P – доверительная вероятность без конкретизации постановки задачи;
(P2), (P1) – доверительная вероятность соответственно при двух- и
односторонней постановке задачи;
Q1, Qn – контрольные критерии для идентификации грубых погрешностей;
Rc – общий индекс корреляции (линейной);
r – (линейный) коэффициент корреляции;
RSD = sr·100 % – относительное стандартное отклонение среднего значения, %;
sr – относительное (по отношению к среднему результату) стандартное отклонение;
s2r – относительная дисперсия;
σ2 – дисперсия генеральной совокупности;
s – стандартное отклонение среднего результата;
sr – относительное (по отношению к среднему результату) стандартное отклонение среднего результата;
slg – логарифмическое стандартное отклонение;
s2lg – логарифмическая дисперсия;
slg– логарифмическое стандартное отклонение среднего результата;
s, s, s – общая дисперсия и дисперсия коэффициентов линейной зависимости;
U – коэффициент для расчёта границ среднего результата гарантии качества испытуемого продукта;
х, у – текущие координаты в уравнении линейной зависимости;
Хi, Yi – вычисленные, исходя из уравнения линейной зависимости, значения переменных х и у;
, – средние значения выборки (координаты центра линейной зависимости);
хi,, yi – i-тая варианта (i-тая пара экспериментальных значений х и у);
± ∆ – граничные значения доверительного интервала среднего результата;
хi ± ∆х – граничные значения доверительного интервала результата единичного определения;
d или ∆ – разность некоторых величин;
p – уровень значимости, степень надёжности;
∆х – полуширина доверительного интервала неопределенности единичного определения;
∆– полуширина доверительного интервала неопределенности среднего результата;
∆х,r – полуширина относительного доверительного интервала неопределенности единичного определения;
∆,r – полуширина относительного доверительного интервала неопределенности среднего результата;
ΔAS:r – суммарная неопределенность анализа;
ΔFAO,r – неопределенность конечной аналитической операции;
ΔRS,r– неопределенность аттестации стандартного образца;
ΔSP,r – неопределенность пробоподготовки;
δ – относительная величина систематической погрешности;
ε, – относительные неопределенности, соответственно, результата отдельного определения и среднего результата;
µ – истинное значение измеряемой величины;
∑ – знак суммирования (сумма);
1. Выборка и основные статистические характеристики однородной выборки
При статистической обработке результатов физических, физико-химических и химических испытаний используют термин «выборка» для обозначения совокупности реально полученных, статистически эквивалентных результатов испытаний (вариант). В качестве такой совокупности можно, например, рассматривать ряд результатов, полученных при параллельных определениях содержания какого-либо вещества (величины x) в однородной по составу пробе. Количество полученных результатов представляет собой число наблюдений n, образующих выборку, называемых «объёмом выборки» Отдельные значения вариант выборки объёма п обозначают через xi (1≤ i ≤n). Упорядоченная в порядке возрастания вариант выборка может быть представлена в виде:
При статистической обработке результатов физических, физико-химических и химических испытаний различают выборку малого (n ≤ 10) и большого объёма (n > 10). В других случаях статистической обработки результатов выборка «малого объёма» может быть определена, как не превышающая 30 (n ≤ 30).
1.2. Среднее значение, дисперсия, стандартное отклонение
В большинстве случаев среднее значение выборки является наилучшей оценкой истинного значения измеряемой величины µ, если его вычисляют как среднее арифметическое всех вариант:
При этом разброс вариант хi вокруг среднего значения характеризуется величиной стандартного отклонения s. При количественном определении веществ методами физического, физико-химического и химического анализа величину s часто рассматривают как меру случайной погрешности, свойственной данной методике анализа. Квадрат этой величины s2 называют дисперсией. Величина дисперсии может рассматриваться как мера прецизионности (сходимости) результатов, представленных в данной выборке. Вычисление величин s и s2 проводят по уравнениям (1.5) и (1.6). Иногда для этого предварительно определяют значения отклонений di и число степеней свободы (число независимых вариант) f:
Стандартное отклонение среднего результата рассчитывают по уравнению:
При обработке результатов испытаний лекарственных средств во многих случаях целесообразно использовать относительные (по отношению к величины, например, относительное стандартное отклонение sr, относительную дисперсию . Их рассчитывают по формулам:
Указанные относительные величины в зависимости от решаемой задачи могут выражаться в процентах относительно . В этом случае их часто обозначают RSD:
Относительное стандартное отклонение среднего результата, выраженное в процентах называют коэффициентом вариации. При обработке результатов испытаний лекарственных средств абсолютные величины обычно используют для прямых, а относительные ‒ для косвенных методов анализа.
Если при измерениях получают логарифмы искомых вариант, среднее значение выборки вычисляют как среднее геометрическое, используя логарифм вариант:
Значения s2, s и s в этом случае также рассчитывают, исходя из логарифмов вариант, и обозначают соответственно через s, slg, slgg.
Пример вычисления среднего значения и дисперсии приведён в разделе 7.1.
1.3. Проверка однородности выборки. Исключение выпадающих значений вариант
Результаты, полученные при статистической обработке выборки, будут достоверными лишь в том случае, если эта выборка однородна, т.е. если варианты, составляющие выборку, не отягощены грубыми погрешностями, допущенными при измерении или расчёте. Для принятия решения об исключении таких выпадающих значений вариант, перед окончательным вычислением статистических характеристик проводят проверку однородности выборки, используя различные подходы в зависимости от объёма выборки.
Вместе с тем, следует учитывать, что могут быть такие испытания лекарственных препаратов, которые предусматривают проверку данных каждой из вариант выборки без предварительной оценки её однородности и исключения вариант, например, при определении показателя «Однородность дозированных единиц» в соответствии с ОФС «Однородность дозирования», когда должны быть учтены и проанализированы все полученные результаты (значения вариант).
Для проверки однородности выборки и исключения резко выделяющихся, выпадающих, отягощенных грубыми погрешностями значений вариант используют различные подходы в зависимости от объёма выборки. Для проверки однородности выборок малого и большого объёма наиболее часто используют следующие подходы.
Подход 1. Проверку однородности выборок малого объёма (n ≤ 10) осуществляют без предварительного вычисления статистических характеристик. С этой целью все значения выборки представляют в виде (1.1) и предполагают, что крайние, граничные значения вариант выборки, то есть, x1 и xn, являются выпадающими, отягощёнными грубыми погрешностями. Для этих крайних значений выборки рассчитывают значения контрольного критерия для идентификации грубых погрешностей Q, исходя из величины размаха варьирования (размаха вариации) R, то есть разности значений между x1 и xn.
Выборка признается неоднородной, если хотя бы одно из вычисленных значений Q превышает критическое значение контрольного критерия Q (Р, n), найденное для доверительной вероятности Р (таблица 8.1 Приложения). Варианты х1 или xn, которым соответствует значение Q > Q (Р, n), отбрасывают и для полученной выборки уменьшенного объёма выполняют новый цикл вычислений по уравнениям (1.10) и (1.11) с целью проверки её однородности.
Если в исходной выборке следующие значения вариант: < и < , то уравнения (1.10а) и (1.10б) принимают вид:
Полученная в конечном счёте однородная выборка используется для вычисления , s2, s и s.
Пример проверки однородности выборки малого объёма приведён в разделе 6.2.
Подход
2.
Для проверки однородности выборки большого объёма
(n > 10) целесообразно
проводить предварительную статистическую обработку всей выборки, полагая её
однородной, и уже затем на основании найденных статистических характеристик
решать вопрос о справедливости сделанного предположения об однородности
согласно уравнению (1.13).
Вычисляют статистические характеристики , s2, s, s для выборки большого объёма и проверяют её однородность. Выборка признаётся однородной, если для всех вариант выполняется условие:
Если
выборка признана неоднородной, то варианты, для которых
|di|
> 3·s,
отбрасывают как отягощённые грубыми погрешностями с доверительной вероятностью Р
> 99,0 %. В этом случае для полученной выборки сокращённого объёма
повторяют цикл вычислений статистических характеристик по уравнениям (1.2)–(1.7)
и снова проводят проверку однородности. Вычисление статистических характеристик
считают законченным, когда выборка сокращённого объёма оказывается однородной.
1.4. Объединение однородных выборок
1.4.1. Объединённая дисперсия и объединённое среднее значение
Если имеется g выборок из одной и той же генеральной совокупности с порядковыми номерами k (1 ≤ k ≤ g), расчёт объединённой дисперсии проводят по формуле:
или для объединённых относительных величин:
При этом объединённое число степеней свободы равно:
Если g выборок из одной и той же генеральной совокупности с порядковыми номерами k (1 ≤ k ≤ g) характеризуются выборочными средними значениями , полученными из вариант, объединённое среднее значение по всем выборкам рассчитывают по формуле:
Необходимым условием совместной статистической обработки нескольких однородных выборок является отсутствие статистически значимой разницы между отдельными значениями в уравнении (1.14), в уравнении (1.14а) или в уравнении (1.14б), т. е. справедливость гипотезы равенства дисперсий. В простейшем случае можно ограничиться сравнением крайних значений с использованием критерия Фишера F. В более общем случае можно использовать критерии Бартлетта и Кохрена.
Для проверки гипотезы, что все принадлежат к одной генеральной совокупности, используют выражение, приближенно распределённое как :
При этом величины s2и
рассчитывают
по уравнениям (1.14) и (1.15). Найденную таким образом величину сравнивают
с процентной точкой
хи-квадрат распределения (таблица
8.5 Приложения). Если имеется g
выборок, то число степеней свободы для берут
равным =
g – 1. Проверяемую
гипотезу принимают при условии >
В
противном случае вычисленное значение корректируют
по формуле:
и снова сравнивают с процентной точкой хи-квадрат распределения Если > , то между некоторыми стандартными отклонениями имеются значимые различия. В этом случае необходимо провести анализ имеющихся данных, отбросить одно или несколько значений дисперсии, наиболее сильно отличающихся от остальных, и снова провести тест Бартлетта. Необходимо иметь в виду, что критерий Бартлетта, так же, как критерий Кохрена, очень чувствителен к нарушению требования нормального распределения. Но именно поэтому он может быть весьма полезен при сборе и формировании надёжного архива данных о тех или иных аналитических испытаниях.
Описанный критерий
Бартлетта применим только при условии, что число степеней свободы у всех
объединяемых дисперсий больше 3, т.е. все
>
3.
В том случае, когда все объединяемые дисперсии имеют одинаковое число степеней свободы (т.е. f1 = f2 = …= fg = f) для проверки гипотезы равенства дисперсий (однородности дисперсий) можно применять значительно более простой критерий Кохрена со статистикой:
В формулах (1.17) и (1.20) вместо абсолютных величин могут быть использованы относительные величины и RSDk.
Критические значения критерия Кохрена приведены в таблице 8.6. Приложения. Для подтверждения гипотезы об однородности дисперсий рассчитанное значение G на выбранном уровне значимости (95 % или 99 %) не должно превосходить критическое значение (Gрассчитанное ≤ Gкритическое). В противном случае гипотеза равенства дисперсий не может быть принята: формулы (1.15)–(1.17) объединения выборок не являются корректными, наибольшую дисперсию в исследуемом наборе дисперсий считают выбросом.
1.5. Доверительные интервалы и оценка их величины
Если случайная однородная выборка конечного объёма n получена в результате последовательных измерений некоторой величины А, имеющей истинное значение µ, то среднее этой выборки следует рассматривать лишь как приближённую оценку величины А. Достоверность этой оценки характеризуется величиной доверительного интервала , для которой с заданной доверительной вероятностью Р выполняется условие:
Данный доверительный интервал не характеризует погрешность определения величины µ, поскольку найденная величина может быть в действительности очень близка к истинному значению µ, которое остается неизвестным. Полученный доверительный интервал характеризует степень неопределённости истинного значения µ величины А по результатам последовательных измерений выборки конечного объёма n. Поэтому правильно говорить о «неопределённости результатов анализа», которая характеризуется доверительным интервалом, вместо выражения «погрешность результатов анализа», которое нередко не совсем корректно используется.
Расчёт граничных значений доверительного интервала при известном значении стандартного отклонения s или для выборок большого объёма проводят по уравнению:
предполагая, что варианты, входящие в выборку, распределены нормально. Здесь U(P) – табличное значение функции нормального распределения.
Для выборок небольшого объёма расчёт граничных значений доверительного интервала проводят с использованием критерия Стьюдента, предполагая, что варианты, входящие в выборку, распределены нормально:
Здесь t(P,f) – табличное значение критерия Стьюдента (таблица 7.2 Приложения).
Распределение по критерию Стьюдента является обобщением нормального распределения U(P) и переходит в него при достаточно большом числе степеней свободы , т.е.→ U(P). С учётом этого далее для единообразия везде используется более часто употребляемое соотношение (1.22б), даже в случае выборок достаточно большого объёма.
Если при измерении одной и той же методикой двух близких значений А были получены две случайные однородные выборки с объёмами n и m, то при m < n для выборки объёма m справедливо уравнение:
где индекс указывает принадлежность величин к выборке объёма m или n.
Уравнение (1.23) позволяет оценить величину доверительного интервала среднего , найденного, исходя из выборки объёма m. Иными словами, доверительный интервал среднего для выборки относительно малого объёма m может быть сужен благодаря использованию известных величин s(n) и t(P, fn), найденных ранее для выборки большего объёма n. Более общим подходом является объединение выборок с расчётом объединённого стандартного отклонения и степеней свободы по уравнениям (1.14)-(1.15).
Аналогично уравнениям (1.21)–(1.22) определяют доверительный интервал результата отдельного определения. Подставляя n = 1 в уравнение (1.22б) или m = 1 в уравнение (1.23), получают:
или с использованием относительных величин:
Этот интервал является доверительным интервалом результата отдельного определения. Для него с доверительной вероятностью Р выполняются взаимосвязанные условия:
Значения и из уравнений (1.22б) и (1.24) используют при вычислении относительных неопределенностей отдельной варианты (ε) и среднего результата (), выражая эти величины в процентах:
Пример расчёта доверительных интервалов в процентах и относительных неопределённостей приведён в разделе 7.3.
Если при измерениях получают логарифмы исходных вариант, то уравнения (1.22б) и (1.24) принимают вид:
Потенцирование выражений (1.29) и (1.30) приводит к несимметричным доверительным интервалам для значений и :
При этом для нижних и верхних границ доверительных интервалов и x относительные неопределённости составляют:
1.5.1. Односторонние и двусторонние доверительные интервалы
Выражения (1.21)–(1.35) характеризуют так называемые «двусторонние» доверительные интервалы. Они основаны на двустороннем t-распределении и широко применяются при оценке правильности и прецизионности методик и представлении результатов. Вместе с тем, при решении некоторых задач, например, при контроле готовой продукции, в частности, при контроле качества лекарственных средств, нередко возникает необходимость использования так называемых «односторонних» доверительных интервалов. Например, для какого-нибудь лекарственного препарата допуски количественного содержания действующего вещества установлены от 90 % до 110 % от номинального. В процессе анализа получено среднее значение содержания = 94 % от номинального значения. Необходимо решить, не выходит ли доверительный интервал за допуски содержания (90–110 %). Очевидно, что в данном случае этот доверительный интервал может выйти за пределы только нижнего допуска (90 %), но не верхнего (110 %) одновременно. Вопрос о возможности выхода истинной величины µ за пределы верхнего допуска не рассматривают, в связи с его крайне низкой вероятностью. Таким образом, истинное значение µ находится в интервале:
Аналогичное выражение можно записать для случая, когда превышает 100 % (например, 105 %):
Выражения (1.36а) и (1.36б) характеризуют односторонние доверительные интервалы, поскольку величина µ ими ограничивается только с одной стороны. Это отличает их от выражения (1.21), где величина µ ограничивается с обеих сторон.
Существует следующее соотношение между двусторонним (Р2) и односторонним (Р1) критериями Стьюдента:
В частности, односторонний критерий Стьюдента для вероятности 0,95 (т.е. 95 %) совпадает с двусторонним критерием Стьюдента для вероятности 0,90 (т.е. 90 %).
Таким
образом, Р2 ‒
это вероятность того, что математическое ожидание (или истинное значение)
оцениваемой величины находится в двусторонне ограниченных пределах (1.21)–(1.35),
а Р1
‒
это вероятность того, что оно находится в односторонне ограниченных пределах
(1.35)–(1.36). Также могут использоваться величины, обозначаемые (1-
P2)
и (1- P1),
которые характеризуют вероятность того, что математическое ожидание (или
истинное значение) оцениваемой величины выходит за вышеуказанные пределы. Во
многих случаях такие величины являются более удобными.
1.6. Проверка наличия значимой систематической погрешности
Для решения вопроса о наличии или отсутствии статистически значимой погрешности для выборки объёма m, если величина , используют критерий Стьюдента, обозначаемый t и рассчитываемый по формуле:
или для относительных величин:
Если, например, при Р = 95 % и f = m − 1, реализуется неравенство:
то полученные данной методикой результаты отягощены систематической погрешностью, относительная величина которой δ может быть вычислена по формуле:
Статистически значимая систематическая погрешность может быть приемлема для решения поставленной аналитической задачи, если она критически не влияет на принятие решения по результатам анализа.
На статистическую значимость систематической погрешности влияет прецизионность. Вследствие высокой прецизионности систематическая погрешность может оказаться статистически значимой, и наоборот, низкая прецизионность может привести к статистической незначимости систематической погрешности (эффект маскировки).
Предположим,
что для методики 1 систематическая погрешность
δ1
= 0,74 % и стандартное отклонение s1=1,20 %,
а для методики 2 данные величины имеют значения δ2=0,37 %
и s2=0,33 %. За
счёт худшей прецизионности систематическая погрешность методики 1 оказывается
статистически незначимой. Лучшая прецизионность методики 2 приводит к
статистической значимости систематической погрешности, несмотря на то, что её
значение меньше в 2 раза, чем у методики 1. Поэтому создаётся ложное
представление о невозможности использования методики 2 для конкретной
аналитической задачи, например, количественного определения действующего
вещества в лекарственном препарате. В действительности, для данной цели
целесообразно использовать именно методику 2.
Таким образом, статистически значимая систематическая погрешность, может быть приемлемой и неприемлемой для решения поставленной аналитической задачи. В связи с этим статистически значимые систематические погрешности, т.е. погрешности, для которых выполняется неравенство (1.39), в дальнейшем оценивают на их практическую значимость.
2. Сравнение двух методик анализа по прецизионности
Сравнение двух методик анализа по прецизионности проводят путём выяснения значимости различия выборочных дисперсий анализа этих двух методик. В более общем случае данный подход применяют для оценки значимости различия двух выборочных дисперсий, например, с целью выяснения, можно ли их считать выборочными оценками одной и той же дисперсии генеральной совокупности.
При сравнении прецизионности двух методик анализа с оценками дисперсий и ( > ) вычисляют критерий Фишера F:
Критерий F характеризует при > достоверность различия между и .
Вычисленное значение F сравнивают с табличным значением F (P, f1, f2), найденным при P1= 99 % (таблица 8.3 Приложения).
Если для вычисленного значения F выполняется неравенство:
то различие дисперсий и признается статистически значимым с вероятностью P1, что позволяет сделать заключение о более высокой прецизионности второй методики.
то различие значений и не может быть признано значимым и заключение о различии прецизионности (сходимости) методов сделать нельзя ввиду недостаточного объёма информации.
то целесообразно провести дальнейшие экспериментальные исследования для методики с лучшей прецизионностью (сходимостью).
При сравнении двух методик анализа результаты статистической обработки могут быть представлены в виде таблицы 2.1.
Таблица 2.1 – Данные для сравнительной статистической оценки двух методик анализа по прецизионности
Сравнение
методик анализа желательно проводить при ,
f1 > 10 и f2 > 10. Если точные значения µ1 и µ2
неизвестны, величины δ и tвыч не определяют.
Если при измерениях получают логарифмы исходных вариант, то вместо величин µ, и s в таблице 2.1. приводят величины lgµ, lg и . При этом в графу 8 вносят величину lgx, а в графу 9 – максимальное по абсолютной величине значение ε. Аналогичные замены проводят при вычислении t по уравнению (1.38) и F – по уравнению (3.1).
Пример сравнения двух методик анализа по прецизионности приведён в разделе 7.4.
3. Сравнение средних результатов выборок
3.1. Данные для сравнения результатов выборок
Если с помощью данной методики анализа определяют значение некоторой величины А, то для экспериментально полученной однородной выборки объёма m рассчитывают значения величин, приведённых в таблице 3.1. Если же для данной методики уже имеются данные для статистической обработки (например, полученные при сравнении методик по прецизионности (таблица 2.1)), то в целях значительного сужения границ доверительного интервала за счёт большего числа степеней свободы (уравнение 1.23) возможно их использование при заполнении граф 2, 4, 5, 7, 8 и 9 таблицы 3.1.
Если >1,5, величины s и f целесообразно вычислять по уравнениям (1.21) и (1.15).
Таблица 3.1 – Данные для сравнения средних результатов выборок
Во многих случаях проще использовать относительные (по отношению к ) величины. В этом случае целесообразно использовать данные таблицы 3.2.
Таблица 3.2 – Данные для сравнения средних результатов выборок с использованием относительных величин
Таким образом, на основании уравнения (1.21) для измеряемой величины А при незначительной систематической погрешности с вероятностью Р выполняется условие:
т. е., величина А при незначительной систематической погрешности лежит в пределах:
или с использованием относительных величин:
Если при измерениях получают логарифмы исходных вариант, в графе 9 таблицы 3.1 приводят величину , а каждую из граф 3, 9 и 10 разбивают на две (а, б). В графе 3а приводят значение , в графе 3б – значение lg, в графах 9а и 9б – соответственно значения нижней и верхней границ доверительного интервала для (уравнения (1.31) и (1.32)). Наконец, в графе 10 приводят максимальное по абсолютной величине значение (уравнение (1.33а)).
3.2. Сравнение средних результатов двух выборок
Если в результате измерений одной и той же величины А получены две выборки объема n1 и n2, причем , может возникнуть необходимость проверки статистической достоверности гипотезы:
т. е. значимости величины разности ().
Такая проверка необходима, например, если величина А определялась двумя разными методиками с целью их сравнения, или, если величина А определялась одной и той же методикой для двух разных объектов, идентичность которых требуется доказать. Для проверки гипотезы (3.3) следует установить, существует ли статистически значимое различие между дисперсиями s и s. Эта проверка проводится так же, как при сравнении двух методик анализа по воспроизводимости согласно уравнениям (2.1)-(2.3).
Различие дисперсий s и s статистически незначимо, когда справедливо неравенство (2.3). В этом случае средневзвешенное значение s2, учитывающее не только количество выборок (дисперсий), но и их объём, вычисляют по уравнению (1.5), а дисперсию разности – по уравнению:
Далее вычисляют критерий Стьюдента:
Если при выбранном значении Р2 (например, при Р2 = 95 %):
то результат проверки положителен: разность () является значимой и гипотезу отбрасывают. В противном случае надо признать, что эта гипотеза не противоречит экспериментальным данным.
Различие дисперсий s и s статистически значимо, когда справедливо неравенство (2.2). Если s> s, дисперсию s разности находят по уравнению (3.7), а число степеней свободы ' – по уравнению (3.8):
Следовательно, в данном случае:
Вычисленное по уравнению (3.9) значение t сравнивают с табличным значением t (Р2, f '), как это описано выше для первого случая.
Приведённые выше расчеты упрощаются, когда n1n2 и s≫ s. Тогда в отсутствие систематической погрешности среднее выборки объёма n2 принимают за достаточно точную оценку величины А, т. е. принимают =µ. Справедливость гипотезы =µ, эквивалентной гипотезе (3.3), проверяют с помощью уравнений (1.38) и (1.39), принимая f1=n1–1. Гипотеза (3.3) отклоняется как статистически недостоверная, если выполнятся неравенство (1.39).
Известно точное значение величины А. Если A=µ, проверяют две гипотезы: и .Проверку выполняют с помощью уравнений (1.38) и (1.39) отдельно для каждой из гипотез. Если обе проверяемые гипотезы статистически достоверны, то следует признать достоверной и гипотезу (3.3). В противном случае гипотеза (3.3) должна быть отброшена.
Если при измерениях получают логарифмы исходных вариант, при сравнении средних используют величины и .В тех случаях, когда разность оказывается значимой, определяют доверительный интервал для разности соответствующих генеральных средних | и | :
Пример сравнения средних результатов двух выборок приведён в разделе 7.5.
4. Интерпретация результатов анализа
Оценка сходимости результатов параллельных определений. При рядовых исследованиях аналитик обычно проводит 2–3, реже 4 параллельных определения. Варианты полученной при этом упорядоченной выборки объёма m, как правило, довольно значительно отличаются друг от друга. Если метод анализа метрологически аттестован, то максимальная разность результатов двух параллельных определений должна удовлетворять неравенству:
Таблица 4.1 – Фактор, вычисленный по Пирсону
Если неравенство (4.1) не выполняется, необходимо провести дополнительное определение и снова проверить, удовлетворяет ли величина неравенству (4.1).
Если для результатов 4 параллельных определений неравенство (4.1) не выполняется, одна из вариант (x1 или xn) должна быть отброшена и заменена новой. При невозможности добиться выполнения неравенства (5.1) следует считать, что конкретные условия анализа привели к снижению воспроизводимости метода и принятая оценка величины s применительно к данному случаю является заниженной. В этом случае поступают, как указано в разделе 1.
Определение необходимого числа параллельных определений. Если необходимо получить средний результат с относительной погрешностью , причём метод анализа метрологически аттестован, необходимое число параллельных определений m находят с учётом уравнений (1.23) и (1.24):
Гарантия качества продукции. Предположим, что качество продукции регламентируется предельными значениями amin и amax величины А, которую определяют на основании результатов анализа. Примем, что вероятность соответствия качества продукта условию:
Пусть величину А находят экспериментально, как среднее выборки объёма т, а метод её определения метрологически аттестован. Тогда условие (4.3) будет выполняться с вероятностью , если значение = А будет лежать в пределах:
Значения коэффициента U для вероятности = 95 % и = 99 % соответственно равны 1,65 и 2,33. Иными словами, для гарантии качества наблюдаемые пределы изменения величины А на практике следует ограничить значениями:
Наоборот, если заданы значения Amin и Amax, значения amin и amax, входящие в неравенство (4.3), могут быть найдены путём решения уравнений (4.6) и (4.7). Наконец, если заданы пары значений Amin, amin и Amax, amax, то уравнения (4.6) и (4.7) могут быть решены относительно т. Это может быть использовано для оценки необходимого числа параллельных определений величины А.
Примечание 4.1. В уравнениях (4.5), (4.6) и (4.7) величина коэффициента U() должна быть заменена величиной t (, f), если значение f, определённое по уравнениям (1.4) или (1.14), меньше 15.
Пример 4.1. Рассмотрим данные таблицы 3.1, относящиеся к выборке 1, как метрологическую характеристику используемого метода анализа.
а) Пусть amin = 98 %, amax = 100,50 %. Тогда для испытуемого образца продукта средний результат анализа при проведении трёх параллельных определений (т = 3) должен находиться в пределах:
б) Реальный
средний результат анализа образца испытуемого продукта
А
= 99 % (при т = 3). Тогда определение пределов amin
и amax,
гарантированно характеризующих качество данного образца с заданной
доверительной вероятностью ,
проводим, исходя из уравнения (4.6) или (4.7), полагая
Полученные оценки amin и amax близки к границам доверительного интервала A = 99 ± 0,56, что соответствует примечанию 4.1.
5. Расчёт и статистическая оценка параметров линейной зависимости
При использовании физических, физико-химических и химических методов анализа для количественного определения веществ непосредственному измерению подвергается некоторая величина у (аналитический сигнал), которая является, как правило, линейной функцией искомой концентрации (количества) х определяемого вещества или элемента. Иными словами, в основе таких методов анализа лежит экспериментально подтвержденная линейная зависимость:
измеряемая величина (измеряемое значение аналитического сигнала); |
|||
концентрация (количество) определяемого вещества или элемента; |
|||
(Здесь b и а рассматривают как коэффициенты (параметры) линейной регрессии y на x).
Для использования зависимости (5.1) в аналитических целях, т. е. для определения конкретной величины х по измеренному значению у, необходимо заранее найти числовые значения констант b и а, т.е. провести калибровку. Иногда константы зависимости (5.1) имеют тот или иной физический смысл, и их значения должны оцениваться с учётом соответствующего доверительного интервала. Если калибровка проведена и значения констант а и b определены, величину хi находят по измеренному значению yi:
При калибровке величину х рассматривают как аргумент, а величину у – как функцию. Наличие линейной зависимости между х и у не всегда является очевидным, её наличие целесообразно подтверждать расчётным путём. Для этого по экспериментальным данным, полученным при калибровке, оценивают достоверность линейной связи между х и у с использованием корреляционного анализа и лишь затем рассчитывают значения констант а и b зависимости (7.1) и их доверительные интервалы. В первом приближении судить о достоверности линейной связи между переменными х и у можно по величине линейного коэффициента корреляции (или просто коэффициента корреляции) r, который вычисляют по формуле, исходя из экспериментальных данных:
Линейный коэффициент корреляции r изменяется в пределах от –1 до +1. Положительные значения r указывают на рост, а негативные – на уменьшение у с ростом х.
Линейный коэффициент корреляции r является частным случаем общего индекса корреляции Rc, который применим также и для нелинейных зависимостей между величинами у и х:
Уравнение (5.3а) в силу своей простоты и наглядности нередко используют вместо уравнения (4.3) в том случае, когда знак коэффициента корреляции не имеет значения.
Чем ближе абсолютная величина к единице, тем менее случайна наблюдаемая линейная зависимость между переменными х и у. Коэффициент корреляции r используют обычно для выявления стохастической взаимосвязи между величинами, функциональная зависимость между которыми может и отсутствовать. Коэффициент корреляции является значимым, если его величина для данной вероятности Р и числа степеней свободы f превышает значения, приведённые таблице 8.4. Приложения. В противном случае нельзя говорить о существовании значимых зависимостей (5.1)–(5.2).
Значимость коэффициента корреляции является обязательным, но не достаточным условием использования уравнений (5.1)–(5.2) для аналитических целей. При статистической обработке результатов физического, физико-химического или химического методов анализа лекарственных средств могут быть использованы линейные зависимости с коэффициентом корреляции 0,98 (при соответствии требованиям таблицы 8.4. Приложения), а при анализе следовых количеств определяемых веществ рассматривают линейные зависимости с коэффициентом корреляции 0,90. При столь близких значениях величины к единице формальное подтверждение наличия линейной связи между переменными x и y проводить не следует. Вместе с тем необходимо учитывать, что для различных методов анализа лекарственных средств, требования к линейности метода, могут быть различными.
Коэффициенты а и b и другие характеристики линейной зависимости (5.1) рассчитывают с использованием регрессионного анализа, т. е. методом наименьших квадратов по экспериментально измеренным значениям переменной у для заданных значений аргумента х. Пусть в результате эксперимента найдены представленные в таблице 5.1 пары значений аргумента х и функции у.
Таблица 5.1 – Значения аргумента х и функции у
Тогда, если величины у1 имеют одинаковую неопределённость (а такое допущение обычно выполняется для достаточно узкого диапазона варьирования величин у1), то:
Если полученные значения коэффициентов а и b использовать для вычисления значений у по заданным в таблице 5.1 значениям аргумента х согласно зависимости (5.1), то вычисленные значения у обозначают через Y1, Y2, ... , Yi, ... Yn. Разброс значений уi относительно значений Yi характеризует величина остаточной дисперсии s(дисперсии линейной зависимости), которую вычисляют по формуле:
Для того, чтобы уравнения (4.1)–(4.2) адекватно описывали экспериментальные данные, необходимо, чтобы остаточная дисперсия не отличалась значимо по критерию Фишера (уравнения (2.1) и (2.2)) от дисперсии прецизионности величин у1. Последняя может быть найдена или спрогнозирована из паспортных данных оборудования.
В свою очередь, дисперсии констант b и а находят по уравнениям:
Стандартные отклонения sb и sa и величины и , необходимые для оценки доверительных интервалов констант уравнения регрессии, рассчитывают по уравнениям:
Коэффициенты а и b должны значимо отличаться от нуля, т.е. превышать, соответственно, величины ∆a и ∆b.
Уравнению (5.1) с константами а и b обязательно удовлетворяет точка с координатами и , называемая центром калибровочного графика:
Наименьшие отклонения значений yi от значений Yi наблюдаются в окрестностях центра графика. Стандартные отклонения sy и sx величин у и х, рассчитанных соответственно по уравнениям (4.1) и (4.2), исходя соответственно из известных значений х и у, определяют с учётом удаления последних от центра графика:
При x = и выражения (5.16) и (5.17) принимают вид:
С учётом значений sy и sx могут быть найдены значения величин ∆y и ∆x:
Значения sx и ∆x, найденные при nj = 1, являются характеристиками прецизионности аналитической методики, если х – концентрация (количество), а у – функция х.
Обычно результаты статистической обработки по методу наименьших квадратов сводят в таблицу (таблица 5.2).
Таблица 5.2 – Результаты статистической обработки экспериментальных данных, полученных при изучении линейной зависимости у = bx + a
1. Если целью экспериментальной работы являлось определение констант b и a, графы 11, 12 и 13 таблицы не заполняют
2. Если y = b∙lg x + a, вычисления, описанные в настоящем разделе, выполняют с использованием уравнений (1.8), (1.9), (1.29)–(1.32).
3. Сравнение дисперсий , полученных в разных условиях для двух линейных зависимостей, может быть проведено, как указано в разделе 2.
6. Расчёт неопределённости функции нескольких случайных переменных
Описанные в разделах 1–4 настоящей общей фармакопейной статьи расчёты доверительных интервалов результатов методик анализа применимы лишь в том случае, если измеряемая величина (концентрация, содержание и т.д.) является функцией только одной случайной переменной. Однако большинство методик количественного определения при испытании лекарственных средств методами физического, физико-химического и химического анализа являются косвенными, то есть используют стандартные образцы. Следовательно, измеряемая величина является функцией, как минимум, двух случайных переменных – аналитических сигналов (оптическая плотность или поглощение, высота или площадь пика и т.д.) испытуемого и стандартного образцов. Кроме того, нередко возникает проблема прогнозирования неопределённости аналитической методики, состоящей из нескольких стадий (взвешивание, разведение, конечная аналитическая операция), каждая из которых является по отношению к другой случайной величиной.
Таким образом, возникает общая проблема оценки неопределённости косвенно измеряемой величины, зависящей от нескольких измеряемых величин, в частности, как рассчитывать неопределённость всей аналитической методики, если известны неопределённости отдельных её составляющих (стадий).
Если измеряемая на опыте величина у является функцией п независимых случайных величин хi, то есть:
и число степеней свободы величин xi одинаково или достаточно велико (> 30, чтобы можно было применять статистику Гаусса, а не Стьюдента), то дисперсия величины у связана с дисперсиями величин xi соотношением (правило распространения неопределённостей):
Однако на практике степени свободы величин xt обычно невелики и не равны друг другу. Кроме того, обычно интерес представляют не сами дисперсии (стандартные отклонения), а доверительные интервалы, рассчитать которые, используя уравнение (5.2), при небольших и неодинаковых степенях свободы невозможно. Поэтому для расчёта неопределённости величины у (Δу) предложены различные подходы, среди которых можно выделить два основных: линейная модель и подход Уэлча–Сатертуэйта.
Если случайные переменные хi статистически независимы, то доверительный интервал функции Δу связан с доверительными интервалами переменных Δxi соотношением (доверительные интервалы берутся для одной и той же вероятности):
Данное выражение является обобщением соотношения (6.2).
При испытании лекарственных средств методами физического, физико-химического и химического анализа, измеряемая величина у представляет собой обычно произведение или частное случайных и постоянных величин (масс навесок, разведений, поглощений или площадей пиков и т.д.), т.е. (К ‒ некая константа):
В этом случае соотношение (4.2) принимает вид:
где использованы относительные доверительные интервалы.
Соотношение (5.4) применимо при любых (разных) степенях свободы (в том числе и бесконечных) для величин xi. Его преимуществом является простота и наглядность. Использование абсолютных доверительных интервалов приводит к гораздо более громоздким выражениям, поэтому рекомендуется использовать относительные величины.
При проведении испытаний лекарственных средств в суммарной неопределённости (ΔAS:r) анализа обычно всегда можно выделить такие типы неопределённостей: неопределённость пробоподготовки (ΔSPr), неопределённость конечной аналитической операции (ΔFAO,r) и неопределённость аттестации стандартного образца (ΔRS,r). Величина ΔRS,r обычно мала, поэтому в приведённом выражении она не использована. Учитывая это, а также то, что анализ проводится и для испытуемого раствора (индекс «smp»), и для раствора сравнения (индекс «st»), выражение (5.5) можно представить в виде:
При этом каждое из слагаемых рассчитывают из входящих в него компонентов по уравнению (5.5).
Если число степеней свободы величин хi одинаково или достаточно велико (> 30), выражение (5.5) даёт:
Это же соотношение получают при тех же условиях и из выражения (6.2).
В этом подходе дисперсию величины у (s2у) рассчитывают по соотношению (5.2), не обращая внимания на различие в степенях свободы (νi) величин xi. Для полученной дисперсии s2у рассчитывают некое «эффективное» число степеней свободы veff (которое обычно является дробным), на основе которого затем по таблицам для заданной вероятности находят интерполяцией значения критерия Стьюдента. На основе его далее рассчитывают обычным путём доверительный интервал величины у (Δу):
Для определения величины у обычно выполняется уравнение (6.4). В этом случае в подходе Уэлча–Сатертуэйта соотношение (6.2) переходит в выражение (5.7), и соотношение (5.8) принимает более простой вид:
Здесь величину рассчитывают из соотношения (5.7).
Подход Уэлча–Сатертуэйта обычно даёт более узкие доверительные интервалы, чем линейная модель. Однако он гораздо сложнее в применении и не позволяет выделить так просто неопределённости разных этапов (с последующими рекомендациями по их минимизации), как линейная модель в форме выражения (6.6).
При прогнозе неопределённости анализа используют генеральные величины (с бесконечным числом степеней свободы). В этом случае подход Уэлча–Сатертуэйта совпадает с линейной моделью.
Пример расчёта неопределённости функции нескольких переменных приведён в разделе 7.6.
7. Примеры статистической обработки результатов испытаний
7.1. Вычисление среднего значения и дисперсии
При количественном определении действующего вещества в образце лекарственного препарата, были получены данные, указанные в таблице 7.1.