电子病历系统架构设计与大数据挖掘

日期:2020-12-28 17:06:56 / 人气:1951

01 什么是系统架构?

系统整体架构,从需求到设计的每个细节都要考虑到,把我整个项目使得设计的项目尽量效率高,开发容易,维护方便,升级简单给出开发桂发,搭建系统实现的核心架构,并澄清技术细节、扫清主要的项目难点。

系统架构是一系列相关的抽象模式,用户指导大型软件系统各个方面的设计。系统架构是一个系统的草图。软件架构描述的对象直接构成系统的抽象组件。各个组件之间的链接则明确和相对细致地描述组件之间的通讯。在实现阶段,这些抽象组件被细化为实际的组件,比如具体某个类或者对象。在面向对象领域中,组件之间的链接通常用接口来实现。软件体系结构是构建计算机软件实践的基础。

02 基于电子病历的医院信息平台技术架构

电子病历是指医务人员在医疗活动过程中,使用医疗机构信息系统生成的文字、符号、图表、图形、数据、影像等数字化信息,并能实现存储、管理、传输和重现的医疗记录,是病历的一种记录形式。而非狭义的纸质病历的电子化。

卫计委提出的《电子病历临床文档数据组与数据元》是研制电子病历数据交换的标准,在电子病历生成的过程中必须与这一标准接合。本标准规定了电子病历临床文档中数据组的构成、数据元的内容范围、分类编码和数据元及其值域代码调用标准,建立了数据元分类表、数据组分类目录表与数据元与数据组分类子目录表。为了医疗机构使用方便在数据元的基础中建立了。这些文档按树形结构保存到数据表中,在电子病历模板中选择数据组与数据元时将其数据元标识符代入电子病历中相应的标签中。

03 电子病历的五项设计原则

  1. 简单易用:主要体现在符合临床逻辑思维方式的功能组织和符合临床场景应用需求的信息内容组织。
  2. 扩展性强:不同时期对信息系统的个性化需求或外延扩展的需求设计注意分层架构、模块化设计、数据建模、流程建模、状态建模、安全权限建模。
  3. 信息集成:电子病历系统是临床医务工作者和患者信息为双中心的信息工作平台,将网络所在范围内的信息系统的数据与信息进行集成。
  4. 知识辅助:辅助临床医务供着人员进行有效的临床逻辑分析与判断,为临床医疗行为在信息应用环节提供有力的保障,都离不开各种临床知识库的辅助。
  5. 安全可靠

04 电子病历的实现技术

电子病历系统作为一个行业应用系统,主要从终端实现方式,信息系统架构分层、电子病历数据存储了解实现的技术方法。

1. 用户终端实现方式:采用的是窗体应用程序方式和浏览器方式通过IE潜入ActiveX控件。

2. 信息系统架构分层:分为单机系统、客户端加服务器架构、多层架构系。

例如:三层架构,该模式将系统架设在数据服务器、应用服务器、浏览器三个层次上,数据服务器专门存放数据,应用服务器提供明类服务组件来访问数据服务器和响应客户的请求,浏览器端供用户访问网站。这种模式的系统维护比为简单,系统的修改和升级只需在应用服务器进行即可,客户端的用户界面一致,用户操作起来比较容易上手。

3. 电子病历数据存储采用的是可扩展标记语言(XML)。

05 电子病历数据处理方式

  1. 客观资料的数据采集:客观临床资料是通过医务人员观测,或借助工具、仪器进行观测采集,电子病历系统只需要完成对这些数据类设备或信息系统完成数据接口的开发,定义好数据采集、数据映射接口就能完成临床数据的自动化采集。
  2. 主观资料的数据录入分为纯结构化数据录入与结构化文档录入。
  3. 电子病历的展现方用户终端实现方式分为纸质类(现已经被淘汰)、集成可视化展示性。

06 数据结构化建模

电子病历系统中产生的大量信息,不简单是文字,如何最大化的利用各种信息,就需要结构化的分析和储存。

结构化信息是指信息竞购分析后可以分解成多个互相关联的组成部分,各组成部分间有明确的层次结构,其使用和维护通过数据库进行管理,并有一定的操作规格。

电子病历数据结构分为四层(见图1):

1. 临床文档

位于电子病历数据结构的最顶层,是由特定医疗服务活动(卫生 事件)产生和记录的患者(或保健对象)临床诊疗和指导干预信息的数据集合。 如:门(急)诊病历、住院病案首页、会诊记录等。

2. 文档段

结构化的临床文档一般可拆分为若干逻辑上的段,即文档段。文档 段为构成该文档段的数据提供临床语境,即为其中的数据元通用定义增加特定的 约束。结构化的文档段一般由数据组组成,并通过数据组获得特定的定义。本标 准中未明确定义文档段,但隐含了文档段概念。

3. 数据组

由若干数据元构成,作为一个数据元集合体构成临床文档的基本单 元,具有临床语义完整性和可重用性特点。数据组可以存在嵌套结构,即较大的 数据组 中可包含较小的子数据组。如:文档标识、主诉、用药等。

4. 数据元

位于电子病历数据结构的最底层,是可以通过定义、标识、表示和允许值等一系列属性进行赋值的最小、不可再细分的数据单元。数据元的允许值 由值域定义。

随着医疗机构信息化建设的大力推进,电子病历数据持续的海量增长,针对电子病历数据的知识挖掘也应运而生;电子病历记录了病患就诊的全过程,包含数字、图像、文本等多种数字化信息。

项目从电子病历应用场景出发,根据完整的医疗活动过程中不同的角色,分别从临床医疗、教学科研、管理部门和病患四个角度进行需求分析;明确电子病历的功能定位,挖掘出电子病历中潜在的医学规则和模式;一方面为医务人员临床诊断中提供决策支持,另一方面方便向大众普及病症知识,为疾病防治与健康医疗模式带来改变。

1. 数据清洗

1)隐私数据处理

电子病历中包含患者的全部信息,对电子病历的信息抽取涉及到患者隐私,因此需要将患者身份信息隐藏,仅保留研究相关的诊断信息,以保护患者基本权益不受侵犯。

2)主数据目录(分词、词性、同义词、相似词)

首先保障数据的完整性、一致性与唯一性,自动分词和词性标注是文本挖掘的基础,分词和词性算法的优劣直接决定了文本挖掘的效果。

首先融合权威词表、官方标准,通过网络尽可能完整地收录医学词汇,构建医学词典,避免分词错误;同时构建词性标注集合,确保适应电子病历的词性体系;并结合基于统计和机器学习的分词和词性算法,对未登录词进行识别,提升电子病历分词和词性效果;构建电子病历分词和词性标准,为后续电子病历的挖掘奠定基础。

2. 数据抽取

抽取规则:多种表达式(业务活动、时间轴、病种、科室、地名等)

为了实现对电子病历数据的有效组织和分析,基于电子病历信息库,在传统机器学习模型上,使用基于七分位词位标注集和复杂语言特征模板的条件随机场,从电子病历的文本中抽取实体。

基于深度学习模型,在人工标注电子病历实体数据的基础上,构建RNN、LSTM、LSTM-CRF和BERT等深度学习实体抽取模型。

在上述所构建的两类实体抽取模型的基础上,完成对电子病历中实体的抽取;在本部分不仅完成对实体的抽取任务,而且会对所构建的实体抽取模型的整体性能进行纵向和横向的对比,以确定最适合电子病历实体抽取的模型;构建电子病历的实体标注规范,并形成针对电子病历的实体抽取模型。

例如:时间轴。

电子病历具有显著地时序性:病症在不同诊疗阶段具有明显的差异;病人生命体征受时间规律影响;流行病的环境因素中时间因素也是重要的组成部分。

除了电子病历生成时间、修改时间等显示时间外,病历中的隐式时间点及时间段推断也是研究的重难点,对电子病历时间维度上的研究也是电子病历挖掘的重中之重。

3. 数据存储

基于Hadoop大数据平台搭建全文检索引擎,实现海量结构、非结构化数据的高效存储和检索,提供更快、更优用户体验。

4. 数据仓库

主要步骤包括:

  • 命名实体识别,即在文本中找到关键词,并能与文中所指的概念对应起来;如在某一文本中,不仅能通过基因符号识别出这个基因,也可以通过同义词,或以往名称识别出该基因。
  • 信息抽取,基于语言结构的先验知识(如自然语言中的主、谓、宾三元结构),通过自然语言处理方法,抽取出特定的动词或名词。
  • 信息存储,将抽取到的信息(数据)加载并转存到标准化数据模型中,形成以患者为中心、医院临床信息系统(HIS、EMR、LIS、PACS等)无缝、连续和可互操作的集中式医疗大数据平台;该过程中的数据抽取、转化、加载称之为数据仓库(extract-transform-load, ETL)技术。

二、业务应用

1. 全文检索平台

当前,海量的电子病历为医务人员蕴藏了丰富的专业知识,却也给循证医学造成了阻碍。

其中大量非结构化的文本无法有效地进行信息查询,主要存两点问题:

  • 数据库无法存储海量数据;
  • 数据库中非结构化数据查询效率极低。

基于大数据技术,构建高性能数据存储、分布式检索和分析平台,实现海量病历文本高效检索,为临床医疗和教学科研等工作提供基础保障。

2. 构建临床循证知识库(辅助治疗)

知识库是经过有机组织的知识集群,采用命名实体识别方法对电子病历中疾病名称、身体部位、症状、检查项目、治疗手段、药品名进行抽取,形成实时更新的医学实体库及相关的医疗用语库。

利用关系抽取方法,抽取出“症状-诊断”关系,“疾病-药物”关系,形成可供推理的医学知识图谱;为临床医疗提供决策辅助,加强药物管理,实现精准用药。

综合利用大数据、机器学习、NLP和深度学习等技术,通过主诉+病史+AI辅助检查检验结果构建单病种诊断知识图谱,并提供大数据精准治理方案。

3. 定制电子病历模板

由于电子病历形式多样,各个系统之间没用统一的规范,严重阻碍了电子病历的分析与利用,通过实体标准化技术将不规范的医疗实体映射为标准的医疗实体,为有效利用医疗数据扫除障碍。

形成医务人员广泛认可的实体标准,并统一定制电子病历模板供系统开发商借鉴;在医务人员培养过程中,加强医疗实体规范化,对电子病历使用进行培训和意见反馈,提升病历质量。

4. 病症分类模型研究

首先采用分类算法对不同科室的病历建立分类模型,为病症自动分诊提供帮助;其次,电子病历具有冗余性,通常为了确诊需要检查很多项目,无论检查结果正常或异常都会完整记录在案。

病历中除了提及的实体,还有用来修饰的定性词或数字,如“{无}关节肿痛”,“体温{37}度”等,这类定性词或定量数值对疾病的诊断具有关键作用;通过建立分类模型能够辅助医生进行诊断,提高整体医疗水平。

5. 知识普及与推荐服务

基于医学知识图谱和患者既往病史向患者提供针对性的病症知识普及服务,为病患了解自身疾病的相关信息提供权威、便捷的途径,防止被互联网错误信息误导。

满足病患对自身健康管理的需求,同时也消除了医患之间的信息不对称,这有助于缓解医患之间的紧张关系,从根源消除医患纠纷;采用基于内容和基于协同过滤的方法进行专家推荐,方便病患和医生之间相互了解,也便于患者找到合适的医生。

6. 疾病预测推演

根据确诊病历,统计病例数、性别比例、年龄分布、职业分布、手术率、好转率、死亡率、并发症、用药情况及关联的检查检验等;在临床治疗方案的选择中,可列出相关治疗方案的比例,便于医生进行比较分析临床效果。

通过数据分析找到患病特点十分必要,除此之外,如果能将临床描述性信息转化为数字化临床信息,将基因数据、临床表型和疾病三者关联起来;比如:任一临床表型能同时找到与之相关的基因或蛋白信息,并通过这种方式指出疾病分子机制、耐药性、推测预后等,这对于临床医生而言将十分有意义。

作者:电子病历开发,电子病历系统开发,病历app开发,互联网医疗app开发


COPYRIGHT © 2016-2026 爱炎(北京)科技有限公司 版权所有  京ICP备17034934号  客服热线:15810745364