hermes 白嫖 stepfun/step-3.5-flash 的心得
这几天 hermes 白嫖 stepfun/step-3.5-flash 的心得
不那么聪明, 但是能动性强,
开发任务不能一次性正确. 但是如果设置明确的判断标准, 可以自动多轮迭代完成任务.
比如, 开发一个上传文件的服务端, 开发对应的客户端, 这两个任务报告说完成了其实都有BUG.
但是, 我让TA把这两个结果自己对接起来测试功能是否正确, TA自己能发现问题, 然后多循环迭代几轮就能清理掉BUG.
什么? 你说token用量多, 带来的费用高的问题? 我同意, 但, 这不是白嫖着嘛.
群友说 stepfun/step-3.5-flash 话多, 啰嗦.
是的, 所以要定义明确的标准, 让TA自己动.
要么定义输出 什么格式的文件/报告, 里面要装什么数据. 我只看输出的文件.
评论
发表评论