北京儿童插座价格联盟

质量源于设计:基于知识组织的中药生产潜在关键工艺参数的辨识

只看楼主 收藏 回复
  • - -
楼主

重要小贴士

中药大品种联盟近期正在征集专家库成员,我们殷切欢迎有技术、有能力、有经验,愿意为中药大品种培育、为中药产业贡献力量的优秀人才,加入中药大品种联盟。详细信息请查看平台功能栏【专家报名】中的通知,或直接点击文章最下方阅读原文进行报名。 

    ⊙编辑:轻安

质量源于设计:基于知识组织的中药生产潜在关键工艺参数的辨识

崔雅华1,王茜1,徐冰1*,1,2,杜新刚1,2,史新元1*

(1.北京中医药大学中药学院,中药生产过程控制与质量评价北京市重点实验室,北京 100029;

2.北京康仁堂药业有限公司,北京 101301)

质量源于设计(quality by design,QbD)理念最早由质量管理的先驱Joseph M. Juran博士提出,他认为质量应当通过设计被注入到产品中。2004年,美国FDA颁布了《Pharmaceutical CGMPs for the 21st Century-ARisk Based Approach》文件,旨在提高药品质量,并正式提出了在制药工业中实施QbD的方法。2009年,人用药品注册技术要求国际协调会(ICH)将QbD纳入其质量指南文件ICH Q8中,指出QbD是一种用于药物开发的系统方法,其目标是通过对制药过程和产品的设计、理解和控制以提高工艺稳健性,降低产品质量可变性。尽管QbD理念在制药行业提出较晚,但许多药品研发和生产部门在药品质量控制过程中已经进行了诸多QbD实践。

QbD的实施包括4个基本步骤:①确定产品的目标质量特性,辨识产品的关键质量属性(critical quality attributes,CQAs)和关键工艺参数(critical process parameters,CPPs);②研究关键工艺参数对产品关键质量属性的影响,建立工艺设计空间;③建立工艺控制策略,控制过程和产品质量变异;④对工艺过程进行持续监控和质量改进。在QbD实施中,关键工艺参数是在生产过程中输入的,在正常的变化范围内能对产品质量产生重要的影响。对一个制药过程单元来讲,往往涉及众多参数,通常采用风险评估的方法,如失败模式和效应分析(failure mode and effect analysis,FMEA),将参数进行风险评级,选择高或中等风险参数作为潜在关键工艺参数,在此基础上设计实验对其关键性进行确认。但风险评估过程多依赖专家经验,存在一定主观性。

在现代中药制剂工艺研究过程中,大量工艺知识隐藏于文献报道中,然而,中药生产工艺的文献繁多,而且文献之间相对独立,导致了子知识难于获取。若能运用知识组织方法,将散布于文献中的试验设计和统计分析数据进行归纳,则可为工艺研究和生产过程质量控制提供指导。本文拟以丹参乙醇提取工艺文献为载体,采用知识组织的方法实现丹参醇提过程潜在关键工艺参数辨识,为QbD在中药制剂工艺中的研究和应用提供参考。

原理和方法

1.1 知识组织

“知识组织”一词最早由美国图书馆学家Bliss H E提出,我国对知识组织的系统研究始于1998年,国内学者蒋永福定义“知识组织”为促进实现主观知识客观化和客观知识主观化而对知识客体所进行的诸如整理、加工、引导、揭示、控制等一系列组织化过程及方法。知识组织的目标是对知识存贮进行整序和提供知识,以及对已经显现的错误倾向进行有效控制,以阻止未来有可能发生的知识无序化。基于文献的中药生产工艺知识组织研究路线见图1。首先通过文献遴选确定要研究的文献,即知识组织的对象;其次对入选为研究对象的工艺文献知识进行分类、整理,结合文献中的试验设计和数据分析结果建立数据库采集表,即为知识抽取的过程;再运用频数统计法和(或)秩和比法对工艺参数的影响程度进行排序,即知识重组;最后对组织结果进行分析,得出关键工艺参数的辨识结果。

图1  中药生产工艺文献知识组织方法研究路线

1.2 确定知识组织对象

知识组织对象是由研究目的决定,其确定方式为文献调研。文献调研的基本步骤为①确定检索关键词。根据研究目的确定一个或几个关键词,并确定检索数据库,进行检索。②确定研究热点。确定研究热点有2种方式,第1种方式为聚类分析。步骤①中的检索具有广泛性,聚类分析就是对步骤①中的检索结果按照某一属性进行分类,使复杂的资料条理化,根据分类结果确定研究热点,进一步缩小研究范围。聚类分析工作量大,但是具有普遍性。第2种方式为下载量分析,即对步骤一中的检索结果按照下载量进行排序,选取下载量靠前的文献进行分析,确定研究热点。③确定目标文献。对步骤②中的研究热点和研究目的进行综合分析,重新确定检索关键词,使其明确化、具体化,再进行目标文献检索。④进行文献筛选。分析研究目的,确定遴选规则,对步骤③中得到的目标文献进行筛选,得到最终文献,即知识组织对象。

1.3 知识抽取

知识抽取是对入选为研究对象的工艺文献进行知识编辑和知识存检的过程,通过建立“生产工艺文献数据库采集表”实现初步知识分类和整理,该表主要内容包括文献标题、文献作者、期刊日期、关键工艺参数及排序。工艺参数的排序以文献中的方差分析表为依据,不含有方差分析表但文献本身已对工艺参数进行明确排序的,直接采用其排序。

1.4 知识重组

知识重组是对生产工艺文献知识进行再组织的过程,通过一定方法得出中药生产工艺参数的综合影响程度及排序,本研究使用的方法为频数统计法及秩和比法。

1.4.1 频数统计法

频数统计法可以统计某一工艺参数在所有确定文献中出现的频数,在一定意义上代表工艺参数的影响程度。

1.4.2 秩和比法

秩和比法是采用秩和比(rank-sum ratio,RSR)进行统计分析的一种方法。RSR是指行(或列)秩次的平均值,为非参数统计量,具有0~1连续变量的特征。秩和比综合评价法基本原理是在1个n行(n个评价对象)m列(m个评价指标)的矩阵中,通过秩转换,获得无量纲统计量秩和比。在此基础上,运用参数统计的方法,研究RSR的分布。以RSR对评价对象的优劣进行排序或分档排序,从而对评价对象作出综合评价。

秩和比法的基本步骤为①计算秩和比。式中i=1,2,……,n;Rij为第i行第j列元素的秩,将n个评价对象的m个评价指标排列成n行m列的原始数据表矩阵,编出每个指标各对象的秩,一般来说,高优指标从小到大编秩,即工艺参数影响程度越大赋予的数值越小,低优指标从大到小编秩,同一指标数值相同者编平均秩,研究中未涉及的工艺参数编为0,由此得到关键工艺参数排序表。然而,本研究在数据处理时将影响程度最大的因素赋值为1,因此在应用秩和比公式计算之前,要将关键工艺参数排序表转换为倒排表再进行计算。因此,RSR越大代表该工艺参数的综合影响程度越大。

②确定秩和比分布。由于秩和比法的非参数性,所以求RSR的确切分布是困难的。将RSR与累积频率进行对应,将RSR的分布转化为正态分布。按类别或特征对数据进行分组后,分布在各组的数据个数称为频数或次数,各组频数与全部频数之和的比值称为频率,某一数值以下或某一数值以上的频率之和,称为累积频率。从变量值小的一方向变量值大的一方累加,称为向上累积,反之为向下累积。累积频率最大值100%。 为了使计算结果简单明了,将累积频率与概率单位进行对应。标准正态分布横轴上的标准正态离差(u)加5即为概率单位。概率单位y的计算公式为y=u+5。累积频率与概率单位的转换可计算得到,即借助《标准正态分布表》得到各累积频率对应的标准正态离差的绝对值,并通过百分率确定符号,从而得到概率单位的值(百分率>50%的u为正值,百分率<50%的u为负,百分率=50%时,u为0)。标准正态分布表中的数据表示标准正态分布函数(-∞,u)的线下面积,百分率表示(0,+∞)的线下面积,故查找标准正态离差时,应先将百分率进行转换再进行查找。例如百分率P=0.143,u为负值,百分率在标准正态分布函数中的对应数值为0.857,查《标准正态分布表》得标准正态离差为u=-1.07,其相应的概率单位为-1.07+5=3.93。《标准正态分布表》中的标准正态离差精确到小数点后2位,精密度更高的数据可通过查《百分数与概率单位对照表》得到。

③计算回归方程。拟将RSR转化为概率单位进行量化计算,为验证其合理性,需进行相关性检验。以概率单位为自变量X,RSR为因变量Y,进行线性回归分析,检验其相关性。当评价对象较多时,可通过线性回归曲线得到概率单位的估计值。

④对评价对象进行分档。按照评价对象的影响程度差异,可将其分成不同的档,该步骤尤适宜于评价对象较多的情况。分档的依据是概率单位的计算结果,标准是各档方差一致,相差具有显著性。分档后首先要做方差一致性检验,在方差一致的前提下,再做方差分析。如果各类间方差不一致或差异不显著,则应重新分档。具体的计算方式将在结果中以丹参醇提工艺为例进行介绍。

结果

2.1 确定知识组织对象

研究目的是对中药生产过程中的潜在关键工艺参数进行辨识,根据该研究目的确定的关键词为“中药工艺”,在中国知网(CNKI)进行文献检索,选取近3年的文献进行下载量分析,为使数据更具代表性,另选取2008年和2010年的检索结果,选取下载量位于前十的文献的研究对象(2008年为人参、丹参、葛根、黄芪、柴胡、白芍、金银花、连翘、枸杞、菊花,2010年为钩藤、雷公藤、丹参、鸦胆子、益母草、款冬花、艾叶、黄芪、牛膝、大黄,2013年为三七、关黄柏、金莲花、生姜、茯苓、丹参、金银花、黄芩、淫羊藿、北五味子,2014年为人参、山药、三七、石菖蒲、丹参、苦杏仁、枸杞、栀子、杜仲、板蓝根,2015年为薄荷、人参、酸枣仁、天花粉、丹参、牡丹皮、黄芪、淫羊藿、金银花、北五味子),其中关于丹参研究的文献在5个年份中下载量均位于前十,因此,本文将丹参确定为研究热点。在工艺方面,丹参醇提工艺应用最为普遍。

分别以丹参醇提、丹参制剂工艺、丹参酮ⅡA为检索关键词,于CNKI进行文献检索,检索范围为期刊、博硕士论文、会议论文,文献来源为《中国期刊全文数据库》、《中国博士学位论文全文数据库》、《中国优秀硕士学位论文全文数据库》、《中国重要会议论文全文数据库》,共检索到目标文献7 853篇。本文的研究目的是对工艺参数进行排序,按照工艺分析以方差分析为手段的原则进行文献遴选,得到有效文献34篇。从目标文献中确定有效文献,其方法并不是唯一的,研究目的不同,方法也就不同。以本研究为例,本研究的目的是对工艺参数进行排序,目标文献中凡明确将工艺参数进行排序的都可确定为有效文献;工艺参数的影响程度差别可通过正交试验结果更加直观地体现出来,凡通过正交设计,以方差分析为手段的文献均可确定为有效文献。

2.2 知识抽取

以34篇有效文献为基础,建立丹参醇提工艺文献数据库字段采集表,见表1,包含文献标题、文献作者、期刊日期、关键工艺参数及排序。关键工艺参数根据方差分析表中的F值进行排序,评价对象为高优指标,从小到大进行排序。

表1  丹参醇提工艺文献数据库字段采集

2.3 知识重组

2.3.1 运用频数统计法,得到各关键工艺参数的频次

以表1为基础,计算每个工艺参数出现的频次并进行排序。顺序为提取时间、乙醇体积分数、乙醇用量、提取次数、提取温度、浸泡时间、药材粒度,频次分别为34,32,30,17,5,4,4。

2.3.2 建立丹参醇提关键工艺参数倒排表

根据表1进行排序,得出丹参醇提关键工艺参数倒排表,见表2。

表2  丹参醇提关键工艺参数倒排

2.3.3 丹参醇提关键工艺参数RSR计算

将各影响因素在每篇文献倒排后的顺序编码代入RSR计算公式,得丹参醇提工艺的各个关键工艺参数在34篇文献中的量化综合影响程度。如计算提取时间的综合影响程度,代入公式中得RSR1=(1+1+2+……+2+1+1)/(7+34)=0.205 9。按此方式计算乙醇体积分数、乙醇用量、提取次数、提取温度、药材粒度、浸泡时间的RSR分别为0.319 3,0.2521,0.180 7,0.067 23,0.037 82,0.029 41,RSR越大影响程度越大。结果显示乙醇体积分数对工艺的影响最显著,乙醇用量次之,浸泡时间的影响程度最小。

2.3.4 丹参醇提关键工艺参数RSR的分布

将RSR按由小到大的顺序为浸泡时间<药材粒度<提取温度<提取次数<提取时间<乙醇用量<乙醇体积分数,累积频数依次为1,2,3,4,5,6,7,累积频率依次为14.3%,28.6%,42.3%,57.1%,71.4%,85.7%,96.4%,累积频率96.4%的数值以(1-1/4n)×100估算得到,通过查《百分数与概率单位对照表》得到各累积频率对应的概率单位分别为3.933 1,4.434 9,4.805 8,5.178 9,5.565 1,6.066 9,6.799 1,结果见表3。将各个工艺参数的影响程度通过概率单位量化表达,其中乙醇体积分数的概率单位明显高于其他项,说明其对于丹参醇提工艺的影响最大。以RSR为因变量,概率单位为自变量X进行线性回归,得RSR=0.112 9X-0.436 8(r=0.973 0),说明二者线性相关性强。

表3  丹参提取工艺参数秩和比分布

2.3.5 关键工艺参数的分档

由表3可知,浸泡时间、药材粒度的累积频率均<30%,概率单位均<4.5,分为档I,对工艺的影响程度较弱。提取温度、提取次数、提取时间的累积频率在30%~80%,概率单位均接近5,分为档Ⅱ,影响程度中等。乙醇用量、乙醇体积分数的累积频率均>80%,概率单位均>6,分为档Ⅲ,影响程度最强。为了确定分档合理性,经方差齐性检验,分档I和分档Ⅱ之间P=0.55>0.05,分档I和分档Ⅲ之间P=0.38>0.05,分档Ⅱ和分档Ⅲ之间P=0.31>0.05,说明各档方差一致。经方差分析,分档I和分档Ⅱ之间P=0.030<0.05,分档I和分档Ⅲ之间P=0.018<0.05,分档Ⅱ和分档Ⅲ之间P=0.025<0.05,说明各档间差异显著,实现了最佳分档。综上所述,秩和比法所得工艺参数影响程度为乙醇体积分数>乙醇用量>提取时间>提取次数>提取温度>药材粒度>浸泡时间。通过分档又得到,影响程度最强的为乙醇体积分数、乙醇用量,中等的为提取时间、提取次数提取温度,影响程度最弱的为药材粒度、浸泡时间。

讨论

3.1 频数统计法与秩和比法的一致性与差异性

对比频数统计方法和秩和比方法可知,2种方法的计算结果是有差异的,前者所得丹参醇提工艺影响因素的重要程度为提取时间>乙醇体积分数>乙醇用量;后者为乙醇体积分数>乙醇用量>提取时间。一方面,2种方法的结果具有一定的一致性,提取时间、乙醇体积分数、乙醇用量均被认为比较重要。另一方面,频数统计方法代表了影响因素的出现次数,无法量化表达影响因素的重要程度,无法区分影响力度相近的因素,而秩和比法则可以弥补这一缺点。

3.2 秩和比方法的不足

秩和比法中排序的主要依据是原始数据的秩次,秩和比反映的是综合秩次的差距,对于原始数据并无体现,这样就会造成原始数据信息的缺失。按照概率单位对工艺参数进行分档时并无明确标准,可根据分析结果灵活调整,在工艺参数较多时,这样可能造成分档结果的多样性,但对工艺参数的排序影响不大。

本研究创新性的将知识组织的方法应用到潜在工艺参数的辨识中,并运用RSR的方法对工艺参数进行了分档,可以根据研究目标简化大量的文献知识,为中药制剂工艺研究提供指导。目前,知识组织在中药生产工艺方面的应用较少,但中药工艺知识纷繁复杂,迫切需要应用知识组织的方法将其简化,减少工作量,避免开发盲目性。QbD理念顺应时代的发展,并不断克服着药物生产固有的局限性。在QbD理念的引导下,越来越多的新方法新技术会应用于中药工艺研发和生产的各个方面,对提高中药产品质量的可控性具有重要价值和意义。 

参考文献:略。

[本文来源:《中国实验方剂学杂志》,2016,22(15).中国实验方剂学杂志社授权中药大品种联盟(BBTCML)编校发布,转载请注明。]

合作及联系方式

电话:15313953779;010-57730848

邮箱:consult@bbtcml.com

微信:bbtcml_g

点击下列热门文章题目,即可直接进行阅读

《中药大品种培育的343模型》

《【联盟讲坛】中药工艺核对的认识及应对》

《配方颗粒:统一标准 开放竞争》

?》

实干托起梦想 责任铸就担当 聚合迸发能量

《中药大品种核心价值挖掘与品牌构建》

《儿童用药市场全景分析》

《构建中药饮片质量保障体系的关键问题》

肠道菌群——被遗忘的器官


▼▼▼点击阅读原文,即可报名专家库


举报 | 1楼 回复

友情链接