最近AI领域的国产DeepSeek算是成了国产之光,凭它一己之力把一众国外的GPT们比了下去,估值数百亿美元,各大平台纷纷接入,国家给予大力宣传,当之无愧是国人心中的“国之神器”,是我们普通人目前能方便使用的最好的平台了。
刚刚我遇到一个“有趣”的问题,有趣的地方不在于“问题”本身,在于解决这个问题的过程。
一道普通的《信息系统项目管理师》的章节课后题,让包括DeepSeek在内的AI们在我心中“原形毕露”,不论是DeepSeek官网满血版,还是第三方接入的DeepSeek,以及我的第二备选AI “豆包”,全部没有做对。而且同样是DeepSeek大模型,居然给出了不同的答案。
现在已经2月下旬,4月份“高项”就要考试了,所以最近我开始努力抓紧时间学习赶进度。我给自己定的学习原则,并不是只拿证就可以了,希望自己真正的可以学以致用,所以不是单纯的死记硬背,总想着能够举一反三,彻底掌握这些知识。
每章的课后练习题,我要求自己不仅能做对,还要熟知这道题考察的知识点是在教材的哪个部分、哪个章节,为什么要这样考,这样出题的目的是什么。我觉得只有这样学习的效率才能高一点。
今天遇到这道题,我第一时间没能确定正确答案,看到答案以后,也没有第一时间明白为什么是这个答案,所以想着借助AI,让这位老师给我解析一下这道题。
题目是:
关于IT审计范围的描述,不正确的是:
- 总体范围需要根据审计目的和投入的审计成本来确定
- 组织范围需明确审计涉及的组织机构、主要的流程、活动及人员
- 逻辑范围需明确涉及的信息系统
- 物理范围需明确具体的物理地点与边界
课本给的答案是 C
因为DeepSeek官网目前经常性的“服务器繁忙”,又因为我觉得这个问题相对简单,所以先用了豆包,毕竟豆包随叫随到随用随行,这种小问题一定能解决。
没想到豆包告诉我此题的答案应该为“D”。
难道是官方教材课本上的答案错了?
这种可能性也不大吧。
我让豆包再确认一次,有时候它也许会能“改正”自己的错误。
但,它仍坚持说答案是“D”,可是课本的答案明明是“C”。
对话截图如下:

这时候我不得不再问问别的AI了,先问百度版的吧,因为百度号称接入了DeepSeek,而且是满血版的。
没想到,百度版的DeepSeek给了我不同的答案,但也是错误的,它说是A不正确,答案应该是A。

到此,把我搞糊涂了,课本说是C,豆包说是D,百度版DeepSeek说是A。
我不得不去DeepSeek的官方,用纯正的DeepSeek来回答一次吧。目前我使用DeepSeek的官网的经验告诉我,每天(或隔一定时间)第一次使用它的时候,都能正常用,短时间内再用它的时候,就会服务器繁忙,所以我挺珍惜使用官网的机会。
我把问题发给DeepSeek官网,不愧是官网,经过了203秒的深度思考,告诉我最终答案是“A”。


这时候我的心思已经不在于追求正确答案这么简单了,我就想知道,为什么,别的AI还会有别的答案吗?
接下来我用了火山引擎部署的DeepSeek,用时36.12秒,告诉我答案是“A”。

腾讯云的DeepSeek,也说答案是“A”。

最后,我调用了我本地步骤的deepseek-r1:32b。是的,在我自己电脑上部署了一个32B大小的deepseek-r1,不受任何限制,没有网络也可以用,但没想到它给了我一个和豆包一样的答案,虽然它也是出自deepseek。

本地部署的DeepSeek说答案应该是D。
最终,我使用了豆包(字节跳动/抖音旗下)、基于百度的DeepSeek-R1、基于火山引擎(字节跳动/抖音旗下)的DeepSeek-R1、DeepSeek官方、本地部署的DeepSeek-R1,没有一家给我给到我正确的答案。
我回到问题的本身,打开教材翻了一翻,原来答案就是在教材中的原文,只要一对比就知道了,明明就是C错误了。
教材原文是这样写的:“逻辑范围:涉及的信息系统和逻辑边界。”

题目中选项C是:“C.逻辑范围需明确涉及的信息系统”
注意重点在于“和逻辑边界”。
这就很好理解了,教材原文说了,确定逻辑范围是需要两个条件:一是明确所涉及的信息系统,二是需要明确逻辑边界。
即,确定范围需要明确主体和边界,而题目中只说了要明确主体,范围只有主体没有边界,明显是错误的。
我一个普通的人脑,找到出处之后就能瞬间明白答案应该是C,那为什么豆包、各个DeepSeek却没有能告诉我正确的答案呢?
原因也许简单,它们没有看到原始的教材。
不过,这本教材是2023年3月清华大学出版社出版的国考的官方教材,而且问题其实也明确很好理解,为什么他们就没有搞懂呢?
本来我用火山引擎建了一个知识库,并让deepseek来调用它,但因为每天需要20元左右的费用,我就删除了。这个知识库上传的就是这本教材,想着能帮我一起来学习,我估计,如果当时我没有删除知识库,答案也许就能回答对了。
不过没有也许,就是这么寸,我刚删除了知识库就遇到了这个问题。
看来人不能懒,我接下来要在本地部署知识库,再做类似的AI测试。本来觉得本地部署知识库用处不大,现在看来,没有白干的事。
开通了一天多的知识库,目前就计费了22元:



总之,目前这个阶段,AI的能力还是不那么乐观,在某些领域,要代替、超过人的脑力,还任重道远,要避免盲目相信AI,如果有问题,起码可以交替多问几个不同的AI模型,最终自己来确定,自己对自己负责。