发布信息

唐旭屈鑫发自凹非寺量子位出品|“撒币”答题大火

作者:软荐小编      2023-09-01 09:04:51     198

唐旭和曲欣来自奥飞寺

由 Qubits 制作 | 公众号QbitAI

“撒币”答案火了。

主动承认自己“撒币”甚至“大撒币”的资助者数量迅速减少,几大“撒币”战场的奖金发放减少,新的“撒币”战场仍在不断涌现打开。 正确回答一组问题,你可能很快就会成为百万富翁!

通过紧张、严酷、持续不断的“投币”战争,越来越多的人开始享受到悟性知识的乐趣。 除此之外,在这场近乎喧闹的狂欢中,人们还第一次感受到了团队合作的可贵,甚至——

重拾了久违的温暖。

这还不错。

但作为普利策的“船头瞭望员”,量子比特应该刻意与人群保持一点距离。

我们应该做一个冷静的旁观者。 我们不能失去我们深深相信的东西。像这样可能利用人工智能“耍流氓”的机会必须尝试。

古语云:君子本性不异,善于虚伪。

尽管早在2011年,IBM开发的问答人工智能系统Watson就已经在智力问答节目《危险边缘》中击败了人类顶尖选手。 并赢得了百万美元的奖金。

七年过去了,人工智能已经有了更大的发展。 借助这种AI“插件”,普通人能否顺利通过“撒币”测验? 这个问题的答案或许对实现共同富裕具有重要意义。

一条科学致富之路就在我们面前。 可行吗?

现在就开始尝试搜狗自动刷词软件好,让事实说话。

刀具规划

工欲善其事,必先利其器。

对于一个普通人来说,有什么AI武器可以推动“花钱币”答题呢?

虚拟助手、智能耳机和专用插件。

我们最终的实验对象是:

iPhone7手机一台(带Siri、简单搜索、旺仔接听助手)、渡鸦智能耳机RavenH、阿里巴巴智能耳机“天猫精灵”、小米智能耳机“小爱友”。

百度出品的简易搜索声称在5天前更新的iOS1.12.1版本中优化了“语音搜索”,“帮你答题赢奖,拿一等奖”;

搜狗搜索应用内置的旺仔接听助手则更加极致,省去了语音输入的步骤,手动同步接听菠萝视频,答案直接显示在页面上。

我们规划的测试数据集是:2018年1月10日19:00香蕉视频《百万英雄》,共12题。

(如果你觉得样本量不够,看完你敢不敢同意我就告诉你)

一切准备就绪,我们开始吧!

方法一:直接法

量子位立即尝试了直接回答的方法。 也就是说,让那些AI设备直接听“币差”竞猜主持人念的问题。

这个方法听起来省心又省力。

然而,我们计划的AI插件缺乏自然语言理解能力,它们基本上无法理解甚至无法理解主持人所阅读的主题。 对于选择题等模式,AI更是无能为力。

这条路被堵住了!

技巧2:升级方法

仅靠人工智能是不够的,人们还得发挥主观能动性。

这就是我们总结的方式。

第一点:科学题复习

回答时间,只有黄金10秒! 10秒后,黄花菜就冷了。 同学们,这些与时间赛跑的事情其实比什么都重要! 快的! 叉! 好的!

所以首先要把题目总结得尽可能简洁,然后才能得到升级版的新题库,以保证能够尽快得到答案。

我们尝试了很多次,已经找到了一些规律和技巧。

在这里,我们将原主题和修改后的新主题开源如下:

#原标题 新标题

三角形的外角和是120°、180°还是240°?

三角形顶点和

以下哪部作品不是鲁迅的《孔乙己》、《纪念刘和贞》、《家人》?

家园的作者是谁(根据原题,不仅王哉没有AI理解,所以只能从我们预设的角度出发……)

我国唯一的苗族自治区是四川、云南还是河南?

中国苗族自治区

我们常说“人有七窍”。 “七窍”包括眼睛、鼻子还是颧骨? 发送子问题!

七窍出血(原题谁都看不懂,这个题基本无效。)

鲸鱼在水下用身体的哪个部分呼吸,是鳃、肺还是心脏?

海豚如何呼吸?

我们一般用什么字母来表示摄氏度,是C、D还是F?

摄氏度的符号是什么?

最近热播的电视剧《虎啸龙吟》讲的是哪个时期的故事? 是三国时期、汉朝还是清朝?

虎啸龙吼电视剧

“伟大的生,光荣的死”是毛主席对雷锋、刘胡兰、邱少云中的哪一个人物的评价?

生得伟大,死得光荣

排球女子110米短跑比赛中,运动员要过多少关? 是 9、10 还是 11? 我的上帝!

110米栏的几个栏架

10

以下哪首歌不是周杰伦的? “听爸爸的话”、“听妈妈的话”、“听妈妈的话”

周杰伦听妈妈的话

11

从职责上来说,日本国务卿相当于我国的外务长官、国务院总理、中央军委委员长吗?

中国的国务卿相当于什么?

12

以下哪个城市不位于黄河南岸搜狗自动刷词软件好,是上海、扬州还是北京?

合肥在黄河的哪一边?

其中,问题2、4、10为了考虑AI的智能水平,做出了巨大的改变。

第二点:保持正确的语速

修改完题目后,我们只能亲自给AI读题。

这里一定要注意,语速不能太慢也不能太快!

我们建议以 666 字/分钟的语速清晰地阅读问题。

第三点:保持头脑冷静

有时人工智能无法给出直接答案,你必须能够快速找到答案中潜在的正确信息。

回答问题的整个过程保持高度集中,充分调动每一个脑细胞。

实验过程及数据记录

以下是如何比较。

对于每个AI插件测试,我们从开始读题的那一刻开始计时。 当智能耳机的答案中出现答案的关键词,或者没有出现关键词但答案结束时,计时结束; 结果出来后停止计时。

朗读步骤是由一个能说得清楚、流利的年轻人完成的。 计时工具是iPhone 5s系统内置秒表。

三位智能耳机代表通过语音回答问题,两位App代表在屏幕上以文本或图像格式返回搜索结果。

注:以上两项不适用于旺仔语音助手。 其回答已于1月10日晚上7点至7点20分期间准确截图,回答时间设定为一秒。

计时完成后,记录智能耳机/语音助手给出的答案/结果(考虑到“Scabi”直播的速度要求,语音助手仅进行截图),并与正确答案进行比较来判断后者给出的信息是否足以得出正确答案?

为了尽可能避免语音识别带来的偏差,AI回答错误的每个问题都至少被重新问了3次。

实验过程如下。 反应时间和“对错”分别放在括号中。

问题1

原题:三角形的外角和是120°、180°还是240°?

新主题:三角形的顶点和角度之和

关键词:180°

问题2

原标题:以下哪部作品不是鲁迅的《孔乙己》、《纪念刘和贞》、《家》?

新标题:房子的作者是谁

(根据原问题,不仅王在没有AI理解,所以如果我们只能从我们预设的角度开始......)

关键词:巴金

问题3

原标题:我国唯一的苗族自治区是四川、云南还是河南?

新话题:中国苗族自治区

关键词:湖南

问题4

原标题:我们常说“人有七窍”。 “七窍”包括眼睛、鼻子还是颧骨? 发送子问题!

新标题:七窍出血

(量子位也尝试提出诸如“七个孔是什么意思”和“七个孔是什么”之类的问题,但没有人工智能能够理解它们。这根本不是人工智能的子问题,而是一个命题。)

关键词: 洞或嘴

问题5

原问题:鲸鱼用身体的哪个部分在水下呼吸? 是鳃、肺还是心脏?

新问题:海豚如何呼吸?

关键词: 肺

问题6

原问题:我们一般用哪些字母来表示摄氏度? 是C、D还是F?

新问题:摄氏度的符号是什么?

关键词:C

问题7

原问题:最近热播的电视剧《虎啸龙吼》讲的是哪个时期的故事? 是三国时期、汉朝还是清朝?

新剧名:电视剧《虎啸龙啸》

关键词:三国志、诸葛亮、司马懿等

问题8

原标题:“生得伟大,死得光荣”是毛主席对雷锋、刘胡兰、邱少云中哪个人物的评价?

新标题:生的伟大,死的荣耀

关键词:刘胡兰

问题9

排球女子110米短跑比赛中,运动员要过多少关? 是 9、10 还是 11? 天啊!

新话题:110米栏有多少栏?

关键词:10

问题10

原题:以下哪首歌不是周杰伦的? “听爸爸的话”、“听妈妈的话”、“听妈妈的话”

新话题:周杰伦听妈妈的话

(量子比特们苦苦思索,这些问“哪一个不是”的选择题,确实是AI克星,唯一的解决办法就是根据选项将它们拆开,问AI三个问题:“周杰伦听父母的话?”周杰伦听妈妈的话?周杰伦听父母的话?”我们选了其中一位来测试)

如果没有关键词,就算勉强算对也搜不到

我找不到它,你可以尝试帮忙。 嘿...

问题11

原标题:从职责上来说,日本国务卿相当于我国外务大臣、国务院总理、中央军委委员长吗?新话题:日本国务卿相当于什么中国?

关键词:外交

问题12

原标题:南京、扬州、北京,哪个城市不在黄河以南?

新话题:南京在黄河哪一边?

关键词:北

初步结果

智慧与知识的碰撞。 攻防精彩,令人心旷神怡。

这里我们引入一个“命中”的概念:即如果AI给出的答案或多或少点缀着正确答案,即使是“命中”,在上一部分中也是一个√。

△ 每个AI的答题结果和持续时间,红色表示命中

因此,按照这个标准,在众多残局中,百度简单搜索以11次点击脱颖而出,平均每题响应时间为2.9秒; 第二个座位上,每个问题的平均回答时间为6.7秒。 真正的插件旺仔答题助手正确回答了5个问题,速度碾压你的AI同行。

如果去掉变化较大的3题,剩下的9题中,简单搜索命中8题,RavenH命中6题,旺仔命中4题。

剩下的我就不提了...

实验过程可谓是黑暗而又黑暗。 几个著名的人工智能在面对个别特定类型的问题时的集体无知令人印象深刻。 皮皮虾平常的英语理解能力让现有的一切数据变得毫无意义,也让无数百万富翁的梦想化为泡影。

实验推论

结果是不是出乎意料的好? !

2.9秒或6.7秒,就有可能得到正确答案。

虽然明天! 明天! 能够赢得数百万美元并达到人生巅峰!

想想美丽!

等一下,这个理论时间并不是全部时间。

除了搜狗的旺仔接听助手外,整个接听流程如下:

读题→改题→(觉醒)→读题→2.9秒或6.7秒→确认答案→做出选择

完美情况下最快10秒。

如果情绪不够稳定,适当超过10秒。

因此,在场地、设备、测量方法等客观条件存在巨大偏差的情况下,实验仍然证明,理论上可以用民用级AI作为插件,扫清“撒币”之路。回答当前中国的问题。 性别。

如果你手上有合适的AI武器,就尽快使用吧!

很明显Siri纯粹是为了娱乐,不要再尝试了。

(这里假装被问):你怎么不出去问问峰会助理? 首先,“过关助手”本身不具备问答功能,只是一个带有刷题功能的题库; 第二,至于Going Ask的问答功能,大家可以下载Going Ask的手机应用自己感受一下……不多说了。

奥米特

请记住,我们在上面提醒您,您需要保持冷静和专注。

而且,武林世界里,只有速度快的人,才能被打败。

AI提速的可能性太低,所以你的反应时间还得不断提高。 请记住为您的情商增加更多价值。

祝你明天走上人生巅峰!

-超过-

真诚紧急

Qubit正在招聘编辑/记者到上海中关村工作。 我们期待有才华、有热情的朋友加入我们! 相关详情请在量子比特公众号(QbitAI)对话界面回复“招聘”。

量子比特QbitAI·今日头条签约作者

о'ᴗ'Ы追踪AI技术和产品最新动态

相关内容 查看全部