关于 Claude 模型的一个缺陷
本帖最后由 HelloWorld 于 2025-9-11 17:04 编辑好几次在用 claude 模型时,遇到它自作主张用 mock 数据完成任务:
1. 给代码修 bug,在 cursor 里用 sonnet 4 模型,API 请求直接在代码写死 mock 数据,这根本不是生成环境需要的代码
2. 跟 claude 客户端 opus 4.1 模型聊天,让它写 python 代码去分析某个 .xlsx,生成图表,我把代码复制到 .py 文件,运行后生成了一堆图表,仔细一看代码,根本没调用任何 .xlsx 文件,我问它没调用文件数据哪来的,它说不好意思,用的是 mock 数据,然后才改成调用 .xlsx 的代码给我
有一次用 cursor 修改某个 react 的 bug,用 opus 4.0 模型,它直接跑去 ./node_modules 里去改 .js 代码,这种 bug 修改即使改好了,对代码库也没任何帮助
上述这些问题,在 gpt5 模型里没遇到过,总之得小心一点,opus 4.1 也不一定靠谱
https://www.youtube.com/watch?v=YpmTeFqpc9U
页:
[1]