关于 Claude 模型的一个缺陷

HelloWorld 发表于 2025-9-11 04:46:17

本帖最后由 HelloWorld 于 2025-9-11 17:04 编辑

好几次在用 claude 模型时，遇到它自作主张用 mock 数据完成任务：

1. 给代码修 bug，在 cursor 里用 sonnet 4 模型，API 请求直接在代码写死 mock 数据，这根本不是生成环境需要的代码

2. 跟 claude 客户端 opus 4.1 模型聊天，让它写 python 代码去分析某个 .xlsx，生成图表，我把代码复制到 .py 文件，运行后生成了一堆图表，仔细一看代码，根本没调用任何 .xlsx 文件，我问它没调用文件数据哪来的，它说不好意思，用的是 mock 数据，然后才改成调用 .xlsx 的代码给我

有一次用 cursor 修改某个 react 的 bug，用 opus 4.0 模型，它直接跑去 ./node_modules 里去改 .js 代码，这种 bug 修改即使改好了，对代码库也没任何帮助

上述这些问题，在 gpt5 模型里没遇到过，总之得小心一点，opus 4.1 也不一定靠谱

https://www.youtube.com/watch?v=YpmTeFqpc9U

页: [1]

数字居民论坛's Archiver

关于 Claude 模型的一个缺陷