您现在的位置: 台海网 >> 新闻中心 >> 天下 >> 国内聚焦  >> 正文

用于大模型的首批中文基础语料库发布

www.taihainet.com 来源: 中国新闻网 用手持设备访问
二维码

  中新网北京12月21日电 中国网络空间安全协会人工智能安全治理专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。

  据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质量可信数据,经过去重、过滤等技术手段,形成并对社会发布首批120G中文基础语料,包括1亿余条数据,500亿个token。用户登录中国网络空间安全协会网站,点击“中文基础语料库”链接,通过注册、认证等程序,就能够下载相关语料。

  网安协会人工智能安全治理专委会负责人表示,语料库建设是一项长期性、专业性的工作,需要遵循相应法规、标准和规范,需要合力共建、突破创新,推动形成科学有效的语料库汇聚、处理、使用机制,为国家人工智能技术创新和产业发展赋能。

  来自专委会成员单位、大模型备案机构和相关领域科研、企业、社会组织代表近100人参加发布会。(完)

相关新闻
国产大模型面临的机遇与挑战

近日,6部门联合印发《算力基础设施高质量发展行动计划》,其中提出打造一批算力新业务、新模式、新业态,深化算力赋能行业应用。近年来,作为算力应用落地的代表,生成式人工智能技术不断发展,多种大模型产品竞相亮相。海量应用场景成为我国人工智能发展的优质“试验田”,一大批新技术、新应用、新突破加速成长,释放算力应用潜能。   目前,国产大模型的发展态...

马来西亚总理提交2024预算案引孟子秀中文

马来西亚政府13日向国会提交2024年预算案。总理安瓦尔在提交预算案时说,中国哲学家孟子的思想能体现本次预算案推动改革、改善民生、清除贪腐的精神。   安瓦尔还用中文将“仁”“义”“智”“礼”四个字一一说出,以此概括他心目中的孟子思想。除了中文外,安瓦尔当日还引用泰米尔语谚语,表达维持财政健康的决心。   此次是安瓦尔去年底任总理后第二度提出预算...

华为在大模型上再有新动作 多家上市公司入局生态链

近日,华为区域气象预报大模型、视觉大模型等应用相继落地。据10月9日视觉中国官微消息,该公司与华为旗下华为云近日正式签署关于视觉大模型的合作协议,双方将以华为云盘古大模型为基础打造视觉大模型。此前,华为云宣布将联合深圳市气象局打造区域气象预报大模型。   “华为在大模型上的新动作不断。提高了气象要素预报的精度和模型运算速度,为跨学科及其他领域...

蚂蚁金融大模型问世

蚂蚁集团近日在外滩大会上正式发布金融大模型,并公布大模型全栈布局。   据介绍,蚂蚁金融大模型基于蚂蚁自研基础大模型,针对金融产业深度定制,底层算力集群达到万卡规模。“通用大模型无法在专业严谨的领域直接商用,特别是金融服务对错误的容忍度很低,金融大模型要确保领域知识和专业逻辑的严谨性,才能真正落地带来产业价值。知识力、专业力、语言力以及安全...

中国科学院院士何积丰:应对大模型的安全问题,需设好“紧箍咒”

台海网9月7日讯(海峡导报记者 孙春燕)模型的通用能力让其能够应用到人类生产生活的各个场景中,可谓“无孔不入”。AI的发展因此带来了新的安全隐私问题,如何解决这一隐患,9月7日开幕的2023 INCLUSION·外滩大会上,中国科学院院士何积丰开出了他的“药方”:利用对齐技术为大模...