首页>资讯 > 焦点资讯 > 正文

今日快讯:Nano Banana不会应试!指标拉垮,视觉效果惊艳,实测14个任务

来源:新智元    2026-01-04 17:31:58

新智元报道


(相关资料图)

编辑:LRST

【新智元导读】最新报告探讨了生成式模型Nano Banana Pro在低层视觉任务中的表现,如去雾、超分等,传统上依赖PSNR/SSIM等像素级指标。研究发现,Nano Banana Pro在视觉效果上更佳,但传统指标表现欠佳,因生成式模型更追求语义合理而非像素对齐。报告还提出改进方向和新评测范式的思考,强调生成式模型虽有潜力,但与专用模型仍有差距。

过去几年,文本生成图像(T2I)与多模态生成式模型的能力突飞猛进,已经能稳定地产生高质量、具备细节与语义一致性的图像内容。

报告关注的核心矛盾在于:这些「擅长生成」的模型,是否也能在传统低层视觉任务中充当通用求解器(generalist)?

低层视觉(low-level vision)通常强调对图像退化的「精确逆过程」:例如去雾、超分、去噪、去雨、去模糊、去反射、去光晕等。

这类任务的经典评价方式往往依赖 PSNR/SSIM 等参考指标,强调像素级一致性。但生成式模型天生带有「补全/重建」的倾向:它们可能会依据先验去「合理地编造」高频细节,从人眼观感看更清晰、更「像真的」,却在像素对齐意义上偏离GT。

华中科技大学的研究人员最近发布了一篇报告,把这种冲突概括为「人类感知偏好 vs. 传统指标导向」的张力。

项目主页:https://lowlevelbanana.github.io

论文链接:https://arxiv.org/abs/2512.15110

开源仓库:https://huggingface.co/datasets/jlongzuo/LowLevelEval

报告中提出一个非常直接的问题:Nano Banana Pro能否成为低层视觉全能选手?

报告采用了一个刻意「极简」的使用范式:不训练、不微调,只用「输入图 + 简单文本 prompt」直接让Nano Banana Pro输出结果,对其进行zero-shot基准评测。

零样本+文本提示

14个低层任务的系统基准

研究人员把评测扩展到14个低层视觉任务、40个数据集,覆盖三大类能力:图像恢复(restoration)、图像增强(enhancement)、图像融合(fusion)。

任务清单包括:Dehazing、Super-Resolution、Deraining、Deshadowing、Motion Deblur、Defocus Deblur、Denoising、Reflection Removal、Flare Removal、Low-Light Enhancement、Underwater Enhancement、HDR Imaging、Multi-focus Fusion、Infrared-Visible Fusion;

图中用颜色区分了restoration / enhancement / fusion三类任务。

保守估测性能

报告特别强调:当前结论是对模型能力的保守估计,即研究人员没有做精细 prompt tuning,也没有用多轮推理去「挑选最好看的输出」,而是用固定、简单的提示词来模拟一种更接近「普通用户上手」的用法。

闭源模型的评测约束

在一些任务章节里,研究人员也说明了评测工程细节:由于模型以API方式调用且闭源,无法做任务定制训练;并且生成输出分辨率可能固定在约1024尺度,因此需要将输出resize回与GT一致的分辨率再计算指标,以保证定量比较尽量公平。

视觉「更好看」

但指标「更差」

报告最重要的结论可以概括为一句话:

Nano Banana Pro在主观视觉质量上往往更讨好,但在PSNR/SSIM等传统参考指标上整体落后于专用模型。

研究人员将其归因于生成式模型的内在属性:生成式模型更倾向于追求「语义可信/感知合理」,而非严格的像素级对齐;同时模型输出带有随机性(stochasticity),使得稳定性与可复现性也成为部署障碍。

系统性现象:感知质量与指标不一致

以Flare Removal为例,研究人员观察到一种非常典型的现象:有些样本视觉上已经「挺干净、挺舒服」,但因为亮度/颜色等与GT存在偏差,量化分数依然不高,这反映了像素级指标对生成式增强的惩罚机制。

同时,研究人员也指出生成模型存在「高上限、低下限」的特征:在合适输入上,它可能在细节恢复上超过 SOTA,但这种优势会被扩散/生成模型的随机性与语义漂移所抵消,出现明显方差与语义幻觉,prompt 工程也只能部分缓解,难以保证工业级确定性。

稳健但不极致:生成式模型有时会选择更保守的输出

在低光增强(Low-Light Enhancement)的分析中,研究人员给出另一个视角:

Nano Banana Pro可能不太会引入显著的光晕、结构破坏、严重色偏等「灾难性伪影」,这使得它在某些实际应用中具备吸引力;

但它也会出现亮度控制不一致、对prompt敏感、以及与benchmark的GT定义不完全匹配等问题,因此整体仍难以与专用方法竞争。

更进一步,报告还给出可能的改进方向:更具体的prompt设计、few-shot示例对齐、轻量适配/微调、以及把统一多模态模型与任务模块结合的混合范式。

报告贡献与意义:它不只是在「打分」,而是在推动重新定义评测与目标

这份报告的价值不止在于给Nano Banana Pro下结论,更在于它把一个长期存在但常被忽略的问题摆到台面上:

  • 当生成式模型进入低层视觉后,「像素一致性」是否仍是唯一目标?

  • 传统指标是否在系统性地误导我们对生成式恢复/增强的判断?

  • 是否需要能同时刻画「感知质量 + 结构/语义稳定性 + 像素保真」的新评测范式?

报告明确指出:Nano Banana Pro作为零样本低层视觉求解器,已经是一个很强的 baseline,并展示出跨任务的「泛化潜力」;但要达到专用模型那种高保真、可控、稳定的水准仍有明显鸿沟。

参考资料:

https://arxiv.org/abs/2512.15110

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

关键词: 视觉 nano banana

今日快讯:Nano Banana不会应试!指标拉垮,视觉效果惊艳,实测14个任务

NanoBanana不会应试!指标拉垮,视觉效果惊艳,实测14个任务,视觉,nano,banana

心有所向,何惧路长!2026,致奋斗的你!-每日关注

当晨光唤醒通辽我们已站在2026年的新起点未来如待书写的画卷脚步自带向

张健华:AI时代金融基础设施分三层 当前应用未现颠覆性创新-速讯

张健华:AI时代金融基础设施分三层当前应用未现颠覆性创新

俄宣布到2030年前研制出核动力航天发动机原型|每日精选

利哈乔夫对俄媒说,俄国家原子能公司和俄国家航天集团在月球轨道站和兆

概念动态|翔楼新材新增“机器人概念”

2026年1月4日,翔楼新材(301160)新增“机器人概念”。据同花顺数据显

ST路通:股东代偿1022.54万元资金占用款并转让追偿权_今热点

南方财经1月4日电,ST路通(300555 SZ)公告,股东吴世春代公司实际控

元旦假期杭州累计接待游客660.19万人次

人民财讯1月4日电,据“杭州发布”,据统计,2026年1月1日至3日,杭州

NF阻垢剂商品报价动态(2026-01-03) 每日消息

交易商品牌 产地交货地最新报价NF阻垢剂含量99%

破案了!山西男篮4连败原因已找到,媒体人说出关键,太有道理了

破案了!山西男篮4连败原因已找到,媒体人说出关键,太有道理了,cba,古

血液灌流器概念龙头:这些公司值得收藏!(12/31)

A股2025年血液灌流器概念股龙头有哪些?据南方财富网概念查询工具数据

不到两个月再变更!宗馥莉重任宏胜集团法定代表人,严学峰任联络员

宗馥莉重新担任宏胜集团法定代表人。近日,国家企业信用信息公示系统显

景联集团(01751)1月2日发行4838.4万股配售股份|微速讯

智通财经APP讯,景联集团(01751)发布公告,于2026年1月2日,根据配售配

世纪联合控股(01959.HK):截至2025年12月31日止月份之股份发行人的证券变动月报表内容摘要 焦点简讯

世纪联合控股有限公司提交了截至2025年12月31日的证券变动月报表。公司

港股异动 | 新东方-S(09901)尾盘涨超6% 本月底将发二季度业绩 机构看好公司利润率压力逐步出清

智通财经APP获悉,新东方-S(09901)尾盘涨超6%,截至发稿,涨6 44%,报4

重点聚焦!首饰概念股看这里(12/31)

截至1月2日,A股涉及首饰的上市公司分布情况为:主板的有6家、中小板的

不同经济阶段黄金配置比例?

在不同的经济阶段,合理配置黄金对于投资者构建稳健的投资组合至关重要

2025年上海机场异地城市航站楼服务旅客数量突破15万人次-快讯

人民财讯1月2日电,据上海机场集团消息,2025年,上海机场苏州工业园区

庄皇集团公司(08501.HK):截至2025年12月31日止股份发行人的证券变动月报表内容摘要|焦点热文

莊皇集團公司(於開曼群島註冊成立的有限公司)提交截至2025年12月31日

光电子相关公司前十名_2025第三季度营收增幅排行榜 看点

《南方财富网概念库》财报工具数据整理,截至2025第三季度,光电子相关

视频丨元旦佳节“鲜”味浓!新奇蔬果、头茬早茶、活蹦海鲜都来了-每日看点

元旦假期已至,春节也越来越近,消费市场呈现出的“鲜味”越来越足。从

2025年巴西大豆等农产品出口稳步增长

巴西《经济价值报》12月24日报道,根据巴西全国谷物出口商协会(ANEC)

理想汽车-W(02015.HK):自愿公告2025年12月交付更新资料内容摘要 今头条

于2026年1月1日,理想汽车(股份代号:2015)发布自愿公告,披露2025年

商务部:2025年以旧换新相关商品销售额超2.6万亿元 惠及超3.6亿人次

每经AI快讯,1月1日,商务部表示,2025年,以旧换新相关商品销售额超2

两年近三倍!广汽出海可不仅仅是“高增长”

2025年销量增长超45%、两年实现近三倍增长……时至岁末,广汽出海以

焦点热门:今日起,?数字人民币开始计息,这些变化影响你的钱包

红星资本局1月1日消息,据中国人民银行消息,今日起,新一代数字人民币

经济周期中黄金配置该如何调整?|当前看点

经济周期如同四季更迭,对各类资产的表现有着显著影响,黄金作为一种特

理想汽车2025年12月交付44,246辆汽车

【理想汽车2025年12月交付44,246辆汽车】理想汽车2025年12月交付44,246

德阳市人民医院旌北院区正式启用

中新网四川新闻12月31日电(李睿)12月31日,德阳市人民医院旌北院区启用

2025年最后一夜,2026架无人机闪耀“宁的北岸”

2025年最后一夜,2026架无人机闪耀“宁的北岸”

看热讯:东方通信:融资净偿还1273.22万元,融资余额5.67亿元(12-31)

2025年12月31日东方通信融资净偿还1273 22万元,融资余额5 67亿元

综合资讯

+更多

热点资讯

+更多
ST路通:股东代偿1022.54万元资金占用款并转让追偿权_今热点
南方财经1月4日电,ST路通(300555 SZ)公告,股东吴世春代公司实际控 [详细]

Copyright @ 2008-2020  www.43710.com   All Right Reserved Powered by 财经情报网 版权所有

财经情报网   联系邮箱:562 66 29@qq.com

网站备案:沪ICP备2020036824号-12