中国信通院联合工作组 60 余家单位,共同研制了《大规模预训练模型技术和应用评估方法》系列标准,包含模型开发、模型能力、模型应用和可信要求四个重要部分。目前模型开发、模型能力两部分标准已发布,模型开发标准包括数据构建、模型训练、模型管理、模型部署 4 个能力域、16 个能力子域、60 余个能力项,全面评估研究主体开发大模型的能力。
模型能力标准包含功能丰富度、性能优越度、服务成熟度 3 个评测维度、8 个能力域、30 余个能力项,全面评估大模型的各项技术能力。模型应用标准初步定稿,包含应用丰富度、服务成熟度、运营管理能力 3 个能力域、14 个能力子域、30 余个能力项,综合评估大模型应用成熟度。可信要求标准正在前期研究中,近期将启动编制工作。
从官方获悉,中国科学院自动化研究所、武汉人工智能研究院研发的“紫东太初”大模型,在 2 月 12 日-3 月 3 日参与可信 AI 评测工作,模型开发和模型能力两部分获得 4 + 级评分,成为国内首家通过该项评测的学术机构。