孙喆,医渡云联合创始人兼CEO

今天我主要是讲医渡云在医疗大数据这个行业所做的一些工作并且怎么去认识医疗数据对于医疗机构,或者是对于制药企业政府,对于我们的生活会带来哪些改变和变化。

医渡云其实是一个年轻的公司,于 2013年成立,在行业做了大概六年的时间,在医疗大数据这个细分的市场来看的话,我们其实算是比较早的,所以所做的一些在行业前瞻性探的路,所遇到的一些问题,还是有助于把这个行业推向成熟化的一个过程。

精准医疗

从全球的医疗发展来看,精准医疗的概念现在已经成为了一个热门的主题,对于我们说到精准医疗其实它有一个很大的精准点,就来自于说你是不是基于真实的世界去做,你能不能基于海量的数据去做,这个是我们做医疗大数据的一个基准。

我们以整个现在医疗行业对于医疗是一个以研究为驱动的行业,无论是对于医生诊疗,还是监管局监管药片,都是一些过去的方法,以前都是随即对照的方法,它带来的好处是比较明确的效力研究,它的问题是会有特定的设定组,比如说我们要去对照某一个人群有没有效果,它要把所有的干扰因素都去掉。当我们研究的药品放到现实当中,有些药品是没有效的,我们实际感受到的药是没有研究的效果那么好的。我们利用真实的世界,每个人可能带有亚健康的状况,带有的病发状态来作为研究,这个依赖于你有多少真实化的数据,你的数据宽度够不够,如果说这些数据不够的话,那么也是很难的。

2微信图片_20180717100317.jpg

在今天的真实环境下,真实的数据它有几个大的部分,一类最核心的还是围绕我们的临床数据,无论我们今天做新药的研发还是做真实世界的诊疗,都是在大量的医疗当中去做,这都是我们数据核心的部分,我们为了把数据做好,我们还要考虑今天在精准医疗所需要的生物药品数据,基因数据,包括气侯环境,外部的数据,以及每个人的健康生活状态的数据,这些数据的共建才能为我们的精准医疗打下一个基础。

我们实际回到现实当中,虽然理想很美好,如果有这些数据当然我们能做很多的事儿,但是现状医疗数据相较于其它的行业而言它的共性是不一样的,无论是医疗机构的封闭还是说其它的,我们都能看到参与医疗的伙伴都没有办法把医疗数据共享开,以及从立法的角度来讲,对于医疗数据首先是属于患者的,那么它又怎么可以被企业或者是医疗机构去使用,我们的行业进程和实际的状况还是有差距的,所以我们还是有一条比较长的路要走。

除了说在法律层面上,在大家的意愿层面的问题以外及我们可以看到医疗数据的专业性,整个行业的从业人员和专业的人才梯队是很缺乏的,这就造成我们对于医疗的数据,会比金融的数据更难,因为它是非机构化的数据,医疗发生对于疾病的描述,仅仅可能是疾病当中的5%或者是10%,还有很多我们不知道医疗相关的数据,这都阻碍了我们在医疗数据应用上处理的难题。

我们从2015年看到无论是大数据还是人工智能都成为了国家的战略,国家也很明确,要建立统一的信息平台还是要做这个行业的数据治理,去做临床等等所有的方向都是推动了产业更多的进入到这个行业,其实进入到这个行业的人也都知道这个行业是非常累的。

医疗大数据的核心

我们为了把医疗大数据做好,核心是三个部分,一部分是要解决数据网络的问题,也就是说这些数据从哪儿来,数据的现状是格局的,存储在不同的医疗机构,不同的制药企业,这里边又缺乏一个好的标准,缺乏共享机制,缺乏现在流通的环节同时还有隐私保护的环节,这些都是要挖掘的。从采集、清晰、重构存储算法都是数据技术方面的。还有数据的认知能力,对于医疗诊断,新药研发,公共决策,患者服务,我们只有把这三个环节结合在一起才能做好医疗大数据。

行业的趋势,首先是要解决医疗数据获取的问题,通过这里边的赋能我们要把数据挖掘出可用的数据,在这里边才能构建成产品的应用平台,我们要打通闭环,之后才能服务于其它的机构。

医渡云做到今天在中国来讲我们已经是这个行业从数据的规模到整个的产业应用闭环是做得最完整的,到现在我们整个的平台和我们的合作伙伴现在是覆盖了三亿的人的数据,差不多是十二亿人次的临床数据,我们在这里边联合了一百家的最好的医院,同时我们有七百家以治疗为主的医院网络体系,同时我们还有70万的医生群体帮他们做诊断。同时我们还有大量覆盖的疾病,这个疾病是大类的疾病。应用的方面其实涉及到的方向主要是集中在医疗、科研、管理,包括我们讲的政府监管和新药研发这几个大的行业。

我们到目前是唯一的一个独家手企业。医渡云在过去做的时候,我们着重强调跟医疗机构的合作,这也是中国最主要的医疗数据也是存储在医疗机构,在全中国肿瘤领域,以及在综合化医疗领域最好的医院都是我们的合作伙伴。同时我们需要和各地的政府,和很多的专家,很多的医科大学从人才的角度,从区域人群的数据和整个公共服务的角度都需要把这个网络体系做起来,如果这个体系没有你的数据就没有办法去解决,你的应用场景就没有办法应用,那么就变成了一个纯技术化的服务。大家知道到人工智能这个阶段,所谓的人工智能应用如果要做得好,其实本质上还是说你有优质的数据,你对数据的理解有多深,算法今天这个东西大家的水准都比较接近了,所以数据是核心的要素。

医渡云在医疗大数据行业内所做的一些工作

医渡云业务最下层构建的是整个的医疗大脑的部分,往上是我们的医疗服务平台,它面向政府的监管,面向老百姓的健康,以及保险等几个大的方面。我沿着这个路径来谈一下,我们先讲AI大脑的问题,我们今天理解其实来自于三件事儿,第一件事情就是在于有多少的电子诊疗数据在训练模型,也是正是因为我们在过去五六年的时间整个平台处理了大概在中国来讲应该是最大的最全的医疗数据,得益于我们在算法上有很好的沉淀,同时我们整合前沿的专家给你提供疾病深度的知识,这些知识是前面无数的专业人士的积累,这个对于我们训练模型或者是把辅助类的产品做出来是很重要的事情。第三个数据的处理体系,技术能不能平台化,能不能复制化,因为医疗数据是多元的,异构的,我们又是分布式的存储,所以对于存储体系要求就更高。

我们有600多人,我们有60%大部分是从事过医生事业的。外部的专家也需要很多的专家支持,无论是做生物信息学还有我们各个疾病领域的专家,肿瘤专家等等这些都是共同去推动了我们在模型建立的工作,以及在这里边还有很多做计算的专家的支持。

我们利用AI大脑最核心的能力就是疾病模型,因为疾病模型无论是我们做研发、临床辅助决策的根基,我们需要找到批量化的方法,这些方法是需要有专业的团队去共建的,才能建立最底层的工作。有了AI大脑之后,它是一个要承载于平台层,应用层所以我们自己去定义我们自己的平台叫医疗数据智能平台它要把数据采集、挖掘应用都要服务好,从底层采集层来看,我们遇到的问题是多源异构的问题,我们以医疗机构为主,有一百多个机构,那么一百多个机构还有数百个厂商为它服务,从数据的整合难度还有集成难度都很高,而且里边来带有前段的数据指控的问题,这是一个比较严重的问题。我们在整个建立以社保体系也好,或者是以患者的身份信息为串联我们所有医疗过程当中做得很多不足的地方,所以需要基于这些数据去解决,我们怎么围绕一个人把他所有从生到死的数据串联起来,这在医疗里边就是一个核心的问题。

数据的融合问题,刚才谈到医疗数据不是结构化数据为主的一个实际的状况,中间有大量的影像,对于影像的数据除了有图片,我们要从影像报告当中去结构化相关的信息,我们要把影像信息从不可用变到可用。现在每年医院影像资源都很大,但是与我们影像数据建模方面来说没有太大的帮助。我们要做新药研发,生物样本到今天其实是横在了对于医院来说还是产业来讲都是一个天花板。美国花重金采集人类的血样各种样本建立标本库,这些库都是我们在寻找做靶点,做一个数据库。

做了这些基础化的服务之后,我们还是希望把平台支撑到我们的服务,支撑到我们的服务对象,因为重要的合作伙伴是医疗机构,医疗机构里边有大量的产业的专家,我们需要跟合作伙伴建立以疾病、专科为主的临床的研究网络,在这个研究网络大家可以看到无论它的底层,底层还是我们刚才说到的以全生命周期为基准的数据为本。国家出台了很多的政策,从2014年国家引导医院做临床研究中心,他们在建立网络体系的时候,横在他们面前的问题就是说很容易线下建立这样的合作,但是大家的数据不可被交换,共享,除了大家的意愿问题以外,技术问题也造成大家成本很高的问题,所以在今天在我们的平台上医生可以去协同打通自己的GCDP做新药的研发,这都基于把底层做好。

我们除了做研究以外,很重要的一点,我们也是从搜索开始到患者整个的时间轴完成建立,做大数据我们也是核心的围绕前面在标准体系,同时也是专家对于疾病认证的领域,想肿瘤领域我们做了很多的工作。

对于老百姓来讲我们希望基于这个平台让老百姓他在医疗诊疗过程当中能得到更好的医疗效果,所以和我们合作的医疗机构一方面是把患者的健康数据采集回来,另外一方面也是用到大数据和人工智能,所以我们和医疗机构开始搭建以健康为中心的管理体系,用这套管理体系其实和我们的平常的生长,把患者的全生命周期、患者出院后的那部分数据收集完整。

关于我们

订阅大会消息

关于主办

中国大数据专家委员会
中国电子信息产业集团有限公司
中国电子学会

联系我们

于 博 电话:010-51662329转64
邮箱:aaron@ceac.com.cn QQ:23130699
安 然 电话:010-51662329转65
邮箱:anran@ceac.com.cn QQ:327499282