2020.12.14 中国矿业新闻网
中国地质调查局地学文献中心近日成功研发文献资源采集“黑科技”:通过多种软件集成优化,实现了海量文献数据的高效自动化采集,为丰富馆藏资源、服务地调创新提供了强力支持。
馆藏文献资源是地学文献中心开展业务的根本保障。除了传统的馆藏纸本和电子文献,网络上还有大量公开的论文、图书、地图等文献数据,获取这些无序、异构、碎片化的数据然后进行系统化、格式化,急需创新研发高效采集技术方法。为此,该中心组织力量开展科技攻关并取得了显著成果。
目前,该中心利用研发的自动采集技术,已采集各类文献1500万篇,数据量达100TB,实现了馆藏文献数据的快速增长,为后续文献数据的整理、挖掘、分析和服务提供了扎实基础。(吕鹏)
{{panelTitle}}