得益于皇冠体育大学社会挑战数据皇冠体育研究所(DISC)的部分资助,道奇家族文理学院图书馆与信息皇冠体育研究学院副教授卢坤博士和博士生Satanu Ghosh的一篇论文发表在《Aslib信息管理杂志》上。
根据美国能源情报署的数据,由于经济和人口的增长,到2050年,全球能源消耗预计将增加近50%。可再生能源和清洁能源将在满足需求方面发挥重要作用。
将光转化为电的光伏(PV)材料将使科学家能够利用可再生和清洁的太阳能。对于PV材料来说,要做到这一点,光中的光子需要携带足够的能量来激发电子进入自由状态,从而产生电流。带隙是将材料中的电子激发到这种自由状态所需的最小能量。了解带隙信息对于材料科学家确定光伏电池的候选材料非常重要。
“带隙信息在科学文献中被广泛报道,但文献的数量使科学家无法获得各种材料带隙的完整视图,”卢说。“手动收集这些信息效率低下,无法跟上不断增长的数量。因此,大多数科学决策都是基于部分信息做出的,这可能导致错失发现新型太阳能材料的皇冠体育。从文献中提取带隙信息的自动化方法将克服这一障碍。”
这篇题为“从材料科学文献中提取带隙信息——一项试点皇冠体育研究”的论文介绍了从144万篇原始文献中提取近1.2万篇学术论文中与材料及其带隙相关的信息的初步工作。
未来的工作将集中在改进Lu模型的性能和解决信息提取中的错误。他说:“我希望与领域的科学家合作,争取更多的资金来改进我们开发的项目。”