首页 >新闻 > 人工智能 > 内容

Google为人工智能助手提供了对人类水平的理解的开源数据集

人工智能 2019-11-02 17:13:59

Google今天开放了两个人之间对话数据集的指导式会话偏好征集(CCPE)和Taskmaster-1开源。Google AI研究人员正在共享这两个数据集,以提供为实现人类水平性能的自然语言系统建模所需的培训材料。

Google研究人员称CCPE是一种收集语音数据的新方法。它包括与人们进行500场关于他们的电影喜好的对话-总共10,000场,涉及12,000项讲话。

电影首选项之所以被选为主题,是因为元数据的价值,例如演员和导演的姓名。

“我们没有将工人限制在详细的脚本或很小的知识库上,因此,与现有数据集相比,我们观察到我们的数据集包含更加现实和多样化的对话,”一篇涉及CCPE的论文发表。

Taskmaster-1数据集由13,200多个对话样本组成。它和CCPE都是使用“绿野仙踪”方法制作的,其中一个人扮演代理的角色,临时工作人员网站上的工作人员描绘的是普通的数字助理用户。

Taskmaster-1包含六个类别的对话:订购比萨饼,创建汽车维修约会,设置乘车服务,订购电影票,订购咖啡饮料以及进行餐厅预订。

在其他Google对话式AI的其他新闻中,Google的Project Euphonia引入了对话式AI,以提高对带有重音和ALS的人的声音的识别,并且Google DeepMind研究人员与其他AI社区利益相关者合作,推出了SuperGLUE基准以实现更健壮的对话式AI。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。