Gemini升级DeepResearch功能效果直逼200美金的ChatGPTPro会员

好用的小火箭节点推荐⭐Shadowrocket高速节点推荐

就在今天,谷歌再度祭出大招,终于把Deep Research的底层模型更换成Gemini 2.5 Pro。  新版本的Deep Research功能效果得到显著的提高。

在Google放出的成绩单来看到,新版的Deep Reseach在在指令遵循、全面性、完整性、写作质量方面切全面超越了OpenAI 的Deep Reseach功能,而且几乎是碾压级的。

为了宣传此次Deep Reseach史诗级的升级,Google CEO甚至亲自下场为它打Call,重视程度可见一斑。

但, 实际效果到底如何 ?

下面我们来实际测试一下。

提示词:帮我获取关于腾讯今年三月份一个月的股票价格详情,我需要每天的数据,并分析其涨幅情况

它直接把腾讯的三月份每天的股票信息制作成表格整理了出来,而且我去对照了一下腾讯三月份的股票涨幅的情况,一模一样。

并且最后它还分析了腾讯涨幅的原因,从我个人的角度来看,我对这份报告是十分满意的。

最后我为了测试一下新版Deep Research的的极限,让它帮我整理一份NBA球队的报告,报告包括每支球队的人员数量,人员姓名,每位队员的薪资待遇,最后帮我预测那支球队今年可以获取NBA总冠军。

结果还真让我测到了,它给出了15支球队人员的详细信息,还有15支球队,它直接摆烂,并没有生成出来。

总共是生成了42页报告,引用了126个链接,生成了20820个字,似乎2万字就是它的极限了,这里吐槽一下,它生成的速度不是很快,这份报告生成了接近20分钟。

目前距离发布已经过了10个小时了,不少网友已经纷纷发布了自己的实际测试。

博主@kol Tregaskes使用 Gemini 2.5 Pro的深度思考功能生成了一篇46页的报告,表示长度比2.0版本的要长得多,与OpenAI 的深度思考功能相当。

而且需要注意的是,它在输出报告的过程中,引用了138个链接,实话实说,Google的生态能力确实强。

还有AI研究科学家ChrisUniverse也是第一时间对Gemini 2.5 Pro的Deep Research做了测试,他让谷歌Deep Reseach研究过去五年纳米技术的突破。

最后输出一份长达46页的学论文,报告引用了339个网站,ChrisUniverse体验过后,直接被震撼住了。

为什么此次新版的Deep Reseach表现如此劲爆了,那这不得不提它最新的底座模型——Gemini 2.5 Pro。

从放出的榜单成绩来看,Gemini 2.5 Pro可以说是有史以来最强的大模型,在大模型竞技场 Chatbot Arena 的榜单上,Gemini 2.5 Pro 以绝对优势强势登顶,创下了前所未有的最大分数飞跃,比 Grok - 3 和 GPT - 4.5 高接近 40 分。

其次,在衡量编码能力的SWE-bench榜单以及衡量模型代码编辑水平的Aider Polyglot榜单中。除了在 Agentic coding 方面逊色于 Claude 3.7 Sonnet,Gemini 2.5 Pro 均斩获第一。

好用的小火箭节点推荐⭐Shadowrocket高速节点推荐

THE END
分享
二维码
< <上一篇
下一篇>>