资讯
作者:Bryan编辑:Cage在上一篇研究图谱中,我们指出医疗领域很可能是 Vertical Agent 最先落地的领域,其中最有代表性的公司之一是 OpenEvidence,一款专为医生设计的 AI 专业诊断 ...
5 天
钛媒体APP on MSN大厂围猎AI智能体文 | 青橙财经,作者丨青沐,编辑丨六子 大模型的征战还未结束,一场关于AI Agent(智能体)的围猎之战又轰然开启。 被称为“全球首款真正意义通用AI ...
研究还发现,数据访问的不平等也是影响排行榜公正性的关键因素。专有模型,如Google和OpenAI的产品,能够获得远超开源模型的用户反馈数据。具体而言,Google和OpenAI分别占据了测试数据的19.2%和20.4%,而83个开源模型共同占有的数据份额仅为29.7%。这种数据资源的不均衡,使得开源模型在排行榜上的表现受到严重制约。
LMArena更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,从此前的第2名,直线掉到了第32名!这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama4大模型的质疑。开源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名为32名,远低于Gemini2.5Pro、GPT4o、DeepSeek-V3 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果