此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:
DeepSeek上次更新为8月21日,短短一个月,取得这一成绩来之不易,可喜可贺。
值得一提的是,新模型在Humanitys Last Exam(人类最后的考试)中,成绩提升幅度高达36.48%!
之前,有网友发现:DeepSeek V3.1输出中随机带有「极」字。网友称:
这一Bug已经导致DeepSeek V3.1无法从事编程或对输出结构敏感的相关工作。希望官方早日修复。
这次更新明确已解决「偶发异常字符等情况」,结合「Code Agent优化」,希望这次更新能完美解决DeepSeek无法从事编程或对输出结构敏感的相关工作的Bug。
至于中英文混杂,是LLM的老毛病了,比如OpenAI o3-mini等模型被曝使用中文推理。
我们也对之前在网上流传最广的会触发「极你太美」Bug的Prompt进行了测试:
现在,新模型给出了5种定时器实现方法,多处都使用了time.Second。
我们经过多次尝试,均未能复现出该Bug,说明Bug确实可能已经被修复了。
与DeepSeek-V3.1相比,新模型在工具使用与Agent任务中的表现有较大提升:
在计算机术语中,终端(Terminal)也称终端设备,是计算机网络中处于网络最外围的设备,主要用于用户信息的输入以及处理结果的输出等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
医生做手术时手机突然因“涉诈”被停机,二十多天未能复机,“无法与病人取得联系”!其妻子也因“打电话频繁”被停机,最新进展来了
突发特讯!加拿大总理通告全球:我们和美国,结束了,罕见措辞引爆国际舆论
30万元打200头野猪,当“赏金猎人”配备无人机:护农神器还是空中杀手?
4-0!38岁梅西率队晋级半决赛:1V4乱杀+3场砍5球 解锁生涯400助
非农“没了”,下周的美国CPI也要“没了”,美联储12月还能“闭眼降息”吗?