一个问题,区分真假满血版DeepSeek
相信大家最近都被各大厂商接入DeepSeek的消息给刷屏了吧?
说实话我刚看到这些消息的时候还是挺震惊的,之前搞AI的巨头都是各做各的,现在管它三七二十一,统统接入DeepSeek-R1

就在昨天,微信也悄悄接入了DeepSeek-R1,据说还是满血版,不过目前还在内测阶段,估计很多人还体验不到。

看到这里,想必不少人心中都有一个疑问:现在网上到处都是接入了DeepSeek-R1的产品,到底怎么区分是不是满血版?
一个问题,区分真假满血版
其实我一直也有这种疑问,但由于我自己算是个外行人,也不清楚到底如何才能准确的区分。
不过这周末在家刷帖的时候,看到了一个博主搞了个R1满血版的测试题,据说只有满血版R1能答对,其它的蒸馏版/量化版(阉割版)都做不出来。
一个汉字具有左右结构,左边是木,右边是乞。这个字是什么?只需回答这个字即可。

刚开始我还不太信,于是我去硅基流动里在线测试了一波,结果还真挺让我震惊的,这个问题的正确答案是“杚”,下面给大家挨个放上测试结果。
DeepSeek-R1-Distill-Qwen-32B的回复结果是“楂”,显然不对。

DeepSeek-R1-Distill-Llama-70B的回复结果是“杞”,也不对。

DeepSeek-V3由于没有深度思考,它的回复更是牛头不对马嘴...

最后,咱们再试试真正的DeepSeek-R1满血版(671b),可以看到经过一番短暂的思考,它给出了正确的答案。

该说不说,这位博主的测试题确实刁钻,测试了多个头部AI推理模型,基本上是全军覆没,只有满血版的DeepSeek-R1能够回答出来。
并且根据这位博主的反馈,某些蒸馏版的模型在做这题目时,可能还会有无限循环的情况。

经过我的实测发现,确实会有这种情况,而且出现的概率还挺大...

既然现在有了能够辨别真假满血版R1的方法,那么我觉得很有必要去测测那些号称接入“满血版R1”的产品,看看是不是有水分
首先要测的就是「微信」,毕竟它昨天刚偷摸接入了DeepSeek-R1,有必要试试水,得先拿来“开刀”,好在它不负众望,给出了正确答案。

然后是腾讯元宝,它也答对了。

钉钉接入的也确实是满血版。

包括之前有人推荐过的问小白,它也是实打实的满血版R1.

然后再测测很早前就接入了R1的纳米搜索,可以看到这个“高速专线”并非满血版(虽然它也没说自己是),所以如果你想用满血版,一定要认准另一个标注了“联网满血版”的版本。

还有个平台大家可能看别人宣传过,但我昨天测试它们R1-671B模型时发现回复的内容不太对劲,甚至都没有进行深度思考,难不成把V3当R1放上去了?

但截至目前,该平台已经下架了这个671B的模型,可能是开发人员的失误吧,应该不是故意的

经过这一番测试,可以肯定的是大厂接入的R1满血版,基本上都是真的,虽然成本较高,但它们都顶得住,可以放心用。
需要怀疑的则是部分第三方的套壳网站,它们大多都是个人开发者或者小团队开发,成本需要把控,所以有没有水分还不太好说,大家可以自行测试玩玩。
最后的最后,我还是要声明一下,以上测试的结果均不严谨,仅供测试参考,不敢保证百分百准确,测出问题别找我
那么以上就是今天的全部内容了,如果觉得我的分享对你有帮助,记得点个关注哦!
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~

也许时间是一种解药
校验提示文案
值友4778917917
校验提示文案
白粥送饭
校验提示文案
那么个漏斗
校验提示文案
浩-儿
校验提示文案
剧毒CD
校验提示文案
婴儿撒娇
校验提示文案
值友5332690103
校验提示文案
libinmuziwenwu
校验提示文案
值友5332690103
校验提示文案
藩田sx
校验提示文案
doyao
校验提示文案
值友5332690103
校验提示文案
黑洞熵
校验提示文案
张大妈的老伴张大爷
校验提示文案
一头文化人
校验提示文案
狗屎一刀斩
校验提示文案
狗屎一刀斩
校验提示文案
一头文化人
校验提示文案
张大妈的老伴张大爷
校验提示文案
黑洞熵
校验提示文案
值友5332690103
校验提示文案
doyao
校验提示文案
藩田sx
校验提示文案
值友5332690103
校验提示文案
libinmuziwenwu
校验提示文案
值友5332690103
校验提示文案
婴儿撒娇
校验提示文案
也许时间是一种解药
校验提示文案
剧毒CD
校验提示文案
浩-儿
校验提示文案
那么个漏斗
校验提示文案
白粥送饭
校验提示文案
值友4778917917
校验提示文案