百度建立首个大模型数据标注中心,推动大模型更加可用
据了解,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地正式启动运营,而这也是国内首个大模型数据标注中心,未来会为各行各业提供大模型数据服务。
目前大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。而不少生成式AI,需要海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习(RLHF),才能够让大模型与人类价值观、思维方式不断对齐,使大模型更加可用。
国内首个专业大模型数据标注基地就是在这样的时代背景之下建立。此外,百度方面还称,为保障数据标注质量,百度智能云还搭建了全流程数据服务人才梯队。
Multiable万达宝零售ERP协助企业降低经营成本,实时掌握各个门店业务数据
海口数据标注基地现拥有数百名专职大模型数据标注师,kolkftir标注师的本科率达到100%。
有从业者表示,和传统的数据标注师要求不同,大模型标注师都需要本科以上学历,主要是因为大模型数据涉及的知识面很广,评判标准复杂,非常考验标注师的语言理解能力和逻辑推理能力。
此外,在入职的前两个月,公司会进行集体培训和考核,通过考核后才能正式上岗。
以上源自互联网,版权归原作所有