科学技术的不断创新,使研究规模和可获得的数据量急剧扩增,当普通计算能力已不足以应付日益庞大的数据分析时,云计算的诞生有助于解决数据瓶颈问题,提高运算效率,更为未来的实验室数据分析指出新的方向。自然科学大数据的特点:高速度、大容量和多样性。在大健康研究领域,大数据可以帮助我们更准确的预测健康趋势,对疾病进行人群和区域的特异性分析。大数据既是新兴技术,如基因测序等迅速发展的结果,反过来,它也支撑着疾病的诊断以及药靶的筛选,助力个性化医疗。
在大数据时代科学研究数据尤其需要在存储模式、技术架构、共享传输、全球协同、高效处理等方面有所突破。本地计算集群是基础,计算网格是“集群之集群”,需要整合计算资源。而云计算更注重平台的通用性,提高资源利用率,是一个大科学、大需求、大数据、大计算、大发现的过程。它要求多种计算技术,推动了信息化技术的发展,这是一个相辅相成的过程。
人工智能科学技术的实质是通过智能系统与智能机器,将人类的一些基本功能进行延伸、模拟、发展,它是在多种学科理论的支持下所形成的新技术。人工智能技术既是信息化时代的必然产物,也是信息化社会的必然需求。例如,人工智能技术在互联网、信息化教育、信息化高速公路等方面,都将会发挥很大的作用。
数据挖掘是数据库知识发现中的一个步骤,它是从大量的数据中通过算法搜索隐藏于其中信息的过程,数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。科学数据库技术包括推理技术、搜索技术、知识表示与知识库技术、归纳技术、联想技术、分类技术、聚类技术等等,其中最基本的三种技术即知识表示、推理和搜索都在数据挖掘中得到了体现。