天文大语言模型AstroOne发布加速解码“天籁之声”

　　中新网杭州10月31日电(鲍梦妮)据之江实验室10月31日消息，之江实验室联合中国科学院国家天文台共同打造的天文大语言模型AstroOne于近日发布。该模型拥有700亿参数、320亿tokens文本语料，历经1万道天文学评测数据集的测评。

　　“传统天文研究亟需人工智能技术赋能，以突破天文数据处理困境。”中国科学院国家天文台台长、党委副书记刘继峰表示，“天文学界常说‘以天之语，解物之道’，但‘天籁之声’非常嘈杂，信息量巨大，处理每年产生的百PB量级天文数据是一个难题。”

发布现场。　之江实验室供图

　　据了解，AstroOne能够为天文研究提供强有力的辅助，可快速检测研究中的潜在错误、数据异常或逻辑矛盾，减少人为疏漏；能从海量文献中提取和核对信息，辅助验证假设和结果的可靠性；实现跨学科知识推理与整合，帮助天文科学家突破知识边界、启发创新灵感，生成富有想象力的研究假设。

　　智能时代，计算从辅助性的工具变成了重要的创新引擎，正在全面变革科技创新的模式。此背景下，今年5月起，之江实验室和中国科学院国家天文台共同举办“天文大模型培训班”(以下简称“天文班”)，通过封闭式科研攻关实训，培养“AI+天文”复合型人才。在天文班，计算背景和天文背景的学员相互协作，成功开发出天文大语言模型AstroOne。

　　“我们的优势在于理论和观测，有很多天文数据，同时能够为计算提供天文的想法和知识，但缺乏大模型方面的经验。双方合作能够取长补短，效率更高。”天文班学员、中国科学院国家天文台博士陈孝钿说。

　　此外，双方还合作打造了一个天文图文模型和四个天文学专业领域模型——用于快速捕捉极端瞬变源的Falco、进行恒星普查的SpecClip、精确预测太阳活动的SolarGPT以及实时识别GRBs等高能瞬变源的GRBs X射线探测模型。

　　“这只是一个起步，AI+天文还有很多事情要做。我们将持续深化合作，加强资源共享，推进学科交叉融合和科学数据开放共享，推动科研范式变革。”之江实验室党委副书记赵新龙表示。(完)

【编辑:苏亦瑜】

天文大语言模型AstroOne发布 加速解码“天籁之声”

相关推荐