【#第一文档网# 导语】以下是®第一文档网的小编为您整理的《中医药信息数据的挖掘》,欢迎阅读!

浅谈中医药信息数据的挖掘
摘要:数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含
在其中的、人们事先不知道但又是潜在有用的信息和知识的过程。数据挖掘技术是对中医药海量数据进行智能分析的一个有效工具,关联规则、聚类、决策树、分类与回归、人工神经网络和支持向量机等数据挖掘方法在中医药新药开发、复方配伍规律、方症相应研究等领域中都得到了初步的应用并显示出独特的优越性,具有广阔的发展前景。在实际应用中,可以根据数据特征和科研课题需要同时采用多种数据挖掘方法从不同角度加以研究。中医药尚未被充分认识的丰富的科学内涵,已引起众多专家学者的关注,新的技术和方法不断引入中医药基础研究领域,如对中医证侯的现代科学基础、针刺镇痛原理和经络的研究以及中药复方作用机制的深入认识;中医药对特殊病、疑难杂症治疗的特殊疗效;活血化瘀中药治疗心脑血管病的重大疗效;中医药古典医籍的挖掘整理。
1、数据挖掘
数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道但又是潜在有用的信息和知识的过程。数据挖掘是一个多步骤过程(它需要为数据挖掘算法访问和准备数据),包括挖掘数据、分析结果和采取行动。
[1]
数据挖掘的目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果。
数据挖掘技术主要包括组合或关联、聚类、分类、估计、预测等等,这些方法在实际应用时各有自己的特色和适用条件,需要结合实际的研究目的和不同的变量类型而加以使用。下面对近年来中医药领域常用的数据挖掘方法进行一些浅析。
数据挖掘的特点是从数据库中识别出有效的、新颖的、潜在有用的并且最终可理解的模式的非平凡过程。因为和数据库密切相关,又称为数据库知识发现,具有以下特性:(1)有效性,是指发现的模式应用于新的数据时要具有一定的可信度;(2)新颖性,是指要求发现的模式应该是新的、用户未知的或未预料到的;(3)潜在有用性,是指发现的知识将来具有实际效用,如用户根据发现的知识进行商业决策可产生一定经济效益;¼最终可理解性,要求所发现的模式容易被用户理解.
数据挖掘技术从一开始就是面向应用的,它不仅是面向特定数据库的简单检索查询调用,而且要对数据进行统计、分析、综合和推理,以指导实际问题的求解,发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测。当然,所有发现的知识都是相对的,是有特定前提和约束条件、面向特定领域的,同时还要能够易于被用户理解。事实上,数据挖掘并不只是一种技术或是一套软件,而是一种结合数种专业技术的应用。
2、 中医药信息数据的挖掘:
数据挖掘技术是对中医药海量数据进行智能分析的一个有效工具,关联规则、聚类、决策树、分类与回归、人工神经网络和支持向量机等数据挖掘方法在中医药新药开发、复方配伍规律、方症相应研究等领域中都得到了初步的应用并显示出独特的优越性,具有广阔的发展前景。在实际应用中,可以根据数据特征和科研课题需要同时采用多种数据挖掘方法从不同角度加以研究。数据挖掘技术是一个相对年轻的研究领域,还面临着许多问题和挑战,需要中医药工作者和数据库、数据挖掘方面专家的共同协作,以便更好的理解中医药数据并在挖掘的效率和准确性方面进一步提高。
医学数据具有多态性、不完整性、较强的时间性、复杂性和冗余性。由于中医药历史悠久,加之我国幅员辽阔,形成了地域性的中医药文化,带来数据的不完整、不一致和异常等。
使用数据挖掘技术能够针对中医药数据特点实施合理的数据处理和知识提取。应采用聚类方法、数据归约技术、模糊集理论等进行数据的预处理,清理过滤数据,确保数据的确定性;采用数据融合技术消减数据的维数,使不同模式数据在属性上趋同或一致,之后进行综合;中
医药数据库类型众多,信息量大,其挖掘算法应具有一定的容错性和鲁棒性。
3、数据挖掘在中医药领域的研究及应用
中医药尚未被充分认识的丰富的科学内涵,已引起众多专家学者的关注,新的技术和方法不断引入中医药基础研究领域,如对中医证侯的现代科学基础、针刺镇痛原理和经络的研究以及中药复方作用机制的深入认识;中医药对特殊病、疑难杂症治疗的特殊疗效;活血化瘀中药治疗心脑血管病的重大疗效;中医药古典医籍的挖掘整理。
3.1中医药基础理论的现代化研究
中药药性理论是中药配伍应用的核心内容之一,其内容完善的程度将直接影响到组方的准确性和治疗的有效性。中医对于中药药性的认识是一个逐渐积累和完善的过程,至今还存在某些药物的药性不完整的情况,如华山参的药性特征为只有性味。而无归经[2];对于中药的功效归类也因专家对药物认识程度的不同,而导致同一药物分属于不同类别,甚至功效分类名称也不统一的情况。数据挖掘技术可以在分析大量历史数据的基础上,协助中药药性的完善研究。如数据挖掘中的分类方法可以依据药性特征的辨识结果,将一些还未归类的中药进行分类预测;也可用聚类方法将药味聚类后,根据同类药物的药性相近,归类也应相近的特点进行分类预测;用决策树和关联规则分析可以自动对药物进行功效分类与其药性特征之间的关联模式或规则研究;粗糙集理论可以实现对药物分类的简化药性特征研究等。进行中药药性特征的数据挖掘研究,将对于进行中药复方配伍的科学规律研究有着重要意义。
3.2在中医诊断标准化方面
王学伟等[3]应用贝叶斯网络方法,通过分析474例血瘀证临床诊断数据进行血瘀证定量诊断。结果发现了血瘀证的7个关键症状:疼痛程度、肢体麻木、舌质青紫、舌体瘀斑、舌脉曲张、口唇黯红和脉涩,并定量计算其诊断贡献度。刘晋平等[4]以明清、近现代3 000余例病案为研究分析对象,将病案分为病名、证型、脉象、舌象及症状,探求疾病与其各个构成因素及各因素之间的相关影响。结果:医案中细脉出现频率最高,为34. 39%。秦中广等[5]运用粗糙集进行中医类风湿证候的诊断,收集224个病例,每个病例有81个属性,并从这224个病例中随机抽取学习样本180例,进行预测诊断44例。利用属性约减得到寒湿阻络、湿热阻络、痰瘀阻络、气阴两虚、寒热错杂5种证的必定规则和可能规则。诊断正确率达90%以上,高于传统模糊数学方法。
3.3单味药有效成分、化学成分研究
使用数据挖掘可用于对单味药方的管理与分析,对多种单味药的性味功能、药理作用、化学成分、治疗疾病、药用部位和产地进行统计分析,并用关联规则方法挖掘出上述各部分之间的关联关系,进而获得它与其它药物在配伍后所产生的相须、相使、相畏和相杀等方面的规律,以帮助人们设计出对治疗某种疾病的最佳配伍的方剂,大大提高中药和天然药物在创制新药方面的命中率。
3.4在方剂配伍规律中的应用
数据挖掘可在一定程度上发现和认识临床病症与复方组方关系、复方药物的配伍关系、药味之间的相互作用关系等。姚美村等[6]应用关联规则分析技术,以文献收录的106个消渴中药复方为对象,经解析后建立复方特征数据库,以数据挖掘系统EnterPriseMiner为平台,关联规则分析为工具,在单味药层次上进行消渴复方组成药味之间的关联模式研究。得出历代中医专家在治疗消渴的主要药物配伍方面的整体规律性。
3.5在中医药其他方面的应用
数据挖掘技术不但可以应用到中医药研究中的上述方面,而且在研究中医病证与复方组方的关系、中医症候与现代医学临床表现之间关联的关系以及中医药信息数据仓库的开发研究等方面都可以得到广泛应用。
对中医药信息进行文本数据挖掘是促进中医药信息结构化的途径之一。从中医诊断、
本文来源:https://www.dy1993.cn/S0AG.html