HelloWorld 发表于 7 天前

关于 Claude 模型的一个缺陷

本帖最后由 HelloWorld 于 2025-9-11 17:04 编辑

好几次在用 claude 模型时,遇到它自作主张用 mock 数据完成任务:

1. 给代码修 bug,在 cursor 里用 sonnet 4 模型,API 请求直接在代码写死 mock 数据,这根本不是生成环境需要的代码

2. 跟 claude 客户端 opus 4.1 模型聊天,让它写 python 代码去分析某个 .xlsx,生成图表,我把代码复制到 .py 文件,运行后生成了一堆图表,仔细一看代码,根本没调用任何 .xlsx 文件,我问它没调用文件数据哪来的,它说不好意思,用的是 mock 数据,然后才改成调用 .xlsx 的代码给我

有一次用 cursor 修改某个 react 的 bug,用 opus 4.0 模型,它直接跑去 ./node_modules 里去改 .js 代码,这种 bug 修改即使改好了,对代码库也没任何帮助

上述这些问题,在 gpt5 模型里没遇到过,总之得小心一点,opus 4.1 也不一定靠谱

https://www.youtube.com/watch?v=YpmTeFqpc9U
页: [1]
查看完整版本: 关于 Claude 模型的一个缺陷