当前位置: 主页 > 财经 > 详情
微软华人团队发布全新基准AGIEva AI考公指日可待-世界热推荐

DoNews快讯   2023-05-11 11:09:54


【资料图】

微软研究人员发布了一个新的基准测试AGIEval,用于评估基础模型在人类认知任务中的表现,包括高考、公务员考试、法学院入学考试、数学竞赛和律师资格考试等。+++实验结果显示,GPT-4在一些任务中的表现超过了人类平均水平,但在需要复杂推理或特定领域知识的任务中不太熟练。评估推理能力可以确保模型在不同环境下的可靠性和可信度。(站长之家)
相关资讯