评测维度

我们从代码生成、长文档理解、创意写作、安全性四个维度对 Claude 3.5 与 GPT-4o 进行了对比测试。

代码能力

两者在算法题和工程代码上表现接近,Claude 在代码解释上略胜一筹,GPT-4o 在复杂重构任务中更稳定。

长上下文

Claude 支持 200K token 上下文,GPT-4o 为 128K。处理整本书或大型代码库时,Claude 优势明显。