思維鏈(COT)+反思(Reflection)+語言強化(Verbal R)能否提升大模型推理能力到ChatGPT O1的水平?
已有的大模型能否通過PromptEngineering達到O1類似的推理水平?我見過很多嘗試,在個別案例上有觀察到驚艷的推理效果,但大多沒有普遍提升已有大模型的推理能力。今天看到這個方法,感覺是通過PromptEngineering可以有效普遍提升大模型的推理能力。以下就是那個MagicPrompt,先睹為快。作者準備了50道需要長推理過程的問題,分別測試幾種場景:ClaudeSonnet+上述PromptClauseSonnetLlama3.18B+上述PromptLlama3.18BChatGPT4o+上...