豆包还是太权威了!
太有实力了!豆包最近确实猛,我试过拿它跟ChatGPT跑同一组prompt,中文场景下基本不输,甚至有些口语化表达比GPT更自然。不过你这截图里的数据是哪个维度的测评啊?是综合能力还是特定任务?之前看它数学推理还差点意思,不知道最近更新后有没有补上短板。
说实话,我之前对豆包还有点不服气,觉得它回答太谨慎了,但最近用它查了几次专业文献,给的引用和思路确实比我自己翻半天还准,尤其是在医学和法律这种容错率低的领域,是真的敢拍板说“这个方案可行”。楼主这张图是不是它又压中了什么冷门知识点?好奇具体是啥场景,展开说说呗。
[这只是一个小尾巴] 哈哈哈哈笑死了,需求指令有问题,出来的图就有问题 SanS三石 发表于 2026-6-3 20:51
哈哈哈哈笑死了,需求指令有问题,出来的图就有问题
这指令我感觉没啥毛病啊 七夏 发表于 2026-6-3 20:52
这指令我感觉没啥毛病啊
没有给完整指令,比如头圆,哎呀,太逗了 SanS三石 发表于 2026-6-3 20:55
没有给完整指令,比如头圆,哎呀,太逗了
手指和长大 的那俩笑死个人 七夏 发表于 2026-6-3 21:13
手指和长大 的那俩笑死个人
是的是的,脑袋变成手指 SanS三石 发表于 2026-6-3 21:14
是的是的,脑袋变成手指
啊啊啊,你把金币取光了 谢谢!!
页:
[1]
2