当前位置: 当前位置:首页 >探索 >用于大模子的首批中文根基语料库宣告 正文

用于大模子的首批中文根基语料库宣告

2024-05-07 06:19:11 来源:有目共睹网作者:休闲 点击:587次

  中新网北京12月21日电 中国收集空间清静协会家养智能清静规画业余委员会20日在北京召开宣告会,用于面向社会宣告用于大模子的大模的首首批中文根基语料库。

  据悉,批中网安协会家养智能清静规画专委会会同国家威信机构,文根发挥企业、基语高校以及科研单元协同优势,料库经由“共建-同享”机制,宣告集聚一批高品质可信数据,用于经由去重、大模的首过滤等技术本领,批中组成并对于社会宣告首批120G中文根基语料,文根搜罗1亿余条数据,基语500亿个token。料库用户登录中国收集空间清静协会网站,宣告点击“中文根基语料库”链接,用于经由注册、认证等挨次,就能下载相关语料。

  网安协会家养智能清静规画专委会负责人展现,语料库建树是一项临时性、业余性的使命,需要凭证响应纪律、尺度以及尺度,需要协力共建、突破立异,增长组成迷信实用的语料库集聚、处置、运用机制,为国家家养智能技术立异以及财富睁开赋能。

  来自专委会成员单元、大模子存案机谈判相关规模科研、企业、社会机关代表近100人退出宣告会。

作者:时尚
------分隔线----------------------------
头条新闻
图片新闻
新闻排行榜