OlympicArena:為超級(jí)智能AI基準(zhǔn)測(cè)試多學(xué)科認(rèn)知推理能力
一、結(jié)論寫(xiě)在前面下面介紹的論文來(lái)自上海交大、上海AIlib。論文標(biāo)題:OlympicArena:BenchmarkingMultidisciplineCognitiveReasoningforSuperintelligentAI論文鏈接:??https:arxiv.orgpdf2406.12753??項(xiàng)目鏈接:??https:gairnlp.github.ioOlympicArena??圖1:AI從高考[57]現(xiàn)場(chǎng)參與奧運(yùn)會(huì)為了全面評(píng)估當(dāng)前模型在認(rèn)知推理能力方面的表現(xiàn),論文引入了OlympicArena,這是一個(gè)包含11,163個(gè)雙語(yǔ)文本問(wèn)題的基準(zhǔn),涵蓋純文本和...