SCDM 最近发布了“临床数据管理向临床数据科学的演变”,其中定义了“临床数据科学”一词并提供了创建临床数据科学组织的指导。
他们对临床数据科学的定义如下(节选):
临床数据科学可以定义为一门战略学科,它能够以患者为中心、数据驱动和基于风险的方式执行复杂的方案设计,确保受试者保护以及“试验结果的可靠性和可信度”。
临床数据科学通过增加数据风险、数据含义和价值维度来拓宽[临床数据管理领域],以实现数据质量(即数据可信可靠)。临床数据科学还通过要求能够从临床数据中生成知识和见解来支持需要不同专业知识、方法和技术的其他临床研究活动,从而将临床数据管理的范围扩展到研究结构之外。
虽然我们完全同意这一术语以及临床数据管理向临床数据科学的日益发展,但我 加拿大赌博数据 们注意到本文缺少一个关键要素:促进从临床数据管理向临床数据科学的转变需要哪些技术?组织如何利用当今的解决方案可靠地“生成知识和见解”?如果这是件简单的事情,那么早就发生了。然而,促进这一重要转变的技术直到最近才出现。
了解临床数据科学的障碍
临床数据管理一直致力于最大限度地降低数据风险并最大限度地提高数据质量,但这些任务始终需要大量的精力和时间。通常,在锁定数据库之前,数据管理员会努力整合来自多个源系统的数据以准备进行分析。然而,促进这一过程的工具通常不是以行业为中心,这意味着来自越来越多来源的数据很难进行上下文对齐。试图聚合数据的连接很脆弱,通常需要人工干预才能将数百万个数据点转换为统一的结构以供分析。
简而言之:
随着审判复杂性的增加,数据源的数量也呈爆炸式增长。因此,在开始分析之前必须整合和清理大量不同的数据。
现有的工具并没有使这变得容易,因为每个数据源对数据的定义不同,并且旨在将数据合并在一起的数据库没有对数据的上下文理解以促进对齐。
这些系统之间的连接通常是定制的,这意味着它们也很脆弱。如果有意外的数据格式传入,它们经常会中断,需要人工干预。
将这些系统和连接器组合在一起非常复杂且耗时,这意味着数据管理员通常没有多余的时间来分析生成的数据集,然后才能继续管理下一个研究的数据。