zzboat0422
V2EX  ›  OpenAI

实测 DeepSeek 代码能力果然强,文心一言是真不行

  •  
  •   zzboat0422 · Mar 13, 2025 · 1313 views
    This topic created in 436 days ago, the information mentioned may be changed or developed.

    使用以下代码测试

    A = "aaa"
    b = 1
    
    def main():
        print(A)
        for i in range(10):
            B = A + "-" + str(b)
            print(B)
            if b < i:
                b += 1
    
    
    if __name__ == '__main__':
        main()
    

    让各个 AI 指出代码中的错误,输出正确的代码,并显示正确代码的运行结果。

    结果如下:

    AI 是否指出错误 是否给出正确的运行结果
    GPT-4o
    文心一言
    Grok3
    腾讯 hunyuan
    DeepSeek(腾讯元宝版,不开深度思考和联网搜索)
    豆包
    通义千问
    讯飞星火

    结论:DeepSeek 还是强,Grok3 代码能力也不是全面胜出。

    题外话:GPT-4o 是唯一一个连代码逻辑都给改了的 AI ,还要加限定词不要改代码逻辑。

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   935 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 22:38 · PVG 06:38 · LAX 15:38 · JFK 18:38
    ♥ Do have faith in what you're doing.