悬赏17万:美国“知乎”的奇葩问题,需要AI来识别

科技地平线

百家号11-1422:52

量子位 出品 | 公众号 QbitAI

知乎上面,时常会出现一些“睿智”的问题。

比如,一颗陨石如何挑选自己的归宿:

又比如,公交车的职业操守如何:

这么可爱的问题,并非知乎独享。

知乎的大前辈Quora上面,也有一些脑回路别具一格的人类:

我的MacBook Air重量是2.3磅。下载的东西多了之后,它会不会越来越重?下载的小电影多了之后,它会不会爆炸?

既然,大家都喜欢这样可爱的问题,怎么才从千千万万个问题里面,把它们找出来呢?

重赏之下,必有勇夫。

Quora拿出25,000美元作为奖金,举办了一场Kaggle比赛:

有毒问题在哪里?

比赛内容之一,就是让AI识别出建立在虚假前提上的问题,简称虚假问题 (Insincere Questions) 。

所以,怎样算是虚假前提

还是举起开头的栗子,“陨石坠地前,那陨石坑已经存在”,这是个合格的虚假前提了。

第二,AI要识别的对象还包括,打着提问的旗号,实则在表达观点,这样的问题。

例如,对某一人群表现出歧视、攻击或者侮辱的问题:

第三,若是为给别人带来冲击力(不为寻求答案) 而使用了性内容,也会成为缉拿对象。净化网络环境,也是保护祖国的花朵。

来自山下智博

以上概括起来,任务就是揪出那些并非真心发问而另有用意的问题。

Quora说,站内已经在用机器学习与人类一同完成这项任务了,不过依然需要大家的帮忙。所以才为选手们提供了不错的回报:

冠军,12,000美元亚军,8,000美元季军,5,000美元

如何在一夜之间学会编程?(急,在线等)

比赛用的数据,就是Quora里面的问题。官方提供的数据集,分为训练集合测试集。训练集里有超过130万个问题,测试集里有5.6万个问题。信息包括:问题ID,问题本身,以及问题是否虚假。

在此之外,选手不可以使用其他数据来训练模型。

比赛成绩,是由模型的F1分数决定的:

这里,问题只有两种分类,一是虚假,二是正常。F1分就是衡量二分类模型准确度的指标,兼顾了精确率 (Precision) 和召回率 (Recall) 。

这场为期3个月的比赛,一周前已经启动。现在,已经有超过750支队伍参与其中,排行榜也一直在变化。

窃以为,解锁不可描述的问题,应该是一项愉悦身心的活动。

那么,想要参加比赛的同学注意一下:

报名截止日期为2019年1月29日。提交截止日期为2019年2月5日。

参赛地址在这里:https://www.kaggle.com/c/quora-insincere-questions-classification

有问,必有答

最后的最后,母交车到底能不能吸引公交车?

有理有据,令人信服。

本文由百家号作者上传并发布,百家号仅提供信息发布平台。文章仅代表作者个人观点,不代表百度立场。未经作者许可,不得转载。

返回顶部