热门资讯

国产中文大语言模型“天河天元”发布：由天河超算训练

业界来源：快科技 2023-05-21 10:32:56

5月21日消息，5月18日，2023第七届世界智能大会于国家会展中心（天津）正式开始。而天河新一代超级计算机是中国新一代百亿亿次超级计算机，也在此次展会迎来首次亮相。

同时，为充分发挥超算在算力方面的优势，推动国产异构超级计算机平台在AI应用开发和服务领域中的应用。

国家超算天津中心在大会上发布了“天河E级智能计算开放创新平台”和“天河天元大模型”。

据介绍，中文大语言模型的数据集非常稀缺。国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据，以及专业领域的中医、医药、问诊、法律等多种数据集。

训练数据集总token数达到350B，最终训练打造出了自己的中文语言大模型——天河天元大模型。

据悉，“天河E级智能计算开放创新平台”将带来突破百亿亿次的跨模态的超级计算算力，支撑传统的科学工程计算，并服务智能混合计算，打造全方位的算力赋能创新和数字经济高质量发展载体。

关注公众号：拾黑（shiheibook）了解更多

友情链接：

*文章为作者独立观点，不代表牛品汇立场

本文由和光同尘发表，转载此文章须经作者同意，并请附上出处( 牛品汇 )及本页链接。

原文链接 https://www.niupinhui.com/net/it/5319.html

天河天元天河超算中文大语言模型大语言模型

图库