跳转至

"Jutters"

会议: NeurIPS 2025 (Creative AI Track)
arXiv: 2601.11532
代码: 无(艺术装置项目)
领域: AIGC 检测 / AI 艺术
关键词: AI-generated content, art installation, human-AI interaction, digital curation, AI imagery

一句话总结

通过荷兰传统"jutters"(海岸拾荒者)的隐喻,构建了一个融合真实海滩碎片与AI生成图像/视频的沉浸式装置艺术,引导参观者以拾荒者心态反思如何对待AI生成内容。

研究背景与动机

  1. 领域现状:随着生成式AI的快速发展,数字内容中AI生成的比例急剧增长,用户越来越难以分辨原创与生成内容。
  2. 现有痛点:人们对AI生成内容的态度往往是被动接受或一味排斥,缺乏一种有意识的"策展"(curation)思维来筛选和理解这些内容。
  3. 核心矛盾:AI生成内容缺乏传统物品所具备的作者身份、历史、所有权和使用目的等关系网络,导致人们难以与之建立有意义的关系。
  4. 本文要解决什么? 如何引导人们以更审慎、更主动的方式与AI生成内容互动?
  5. 切入角度:作者将荷兰沿海拾荒传统(jutters)映射到数字时代——jutters在风暴后搜寻被海浪冲上岸的物品,赋予它们新的意义;同样,人们可以像jutters一样"策展"涌上信息流的AI内容。
  6. 核心idea一句话:通过物理空间的艺术装置将AI生成内容具象化,让参观者以jutter的身份主动筛选、判断和赋义。

方法详解

整体框架

整个项目是一个约2×3米的沉浸式装置艺术,模拟一片小型海滩。输入是从荷兰海滩收集的100+真实物品照片,经过AI模型处理后生成图像和视频,最终以物理打印和屏幕展示的形式嵌入人造海滩空间。参观者在音频引导下走过沙地路径,像jutters一样决定哪些"漂流物"值得保留。 装置的核心交互设计是将数字内容的筛选行为具象化为物理空间中的“海滩拾荒”体验。照片打印体和视频屏幕与真实贝壳、漂流木混合放置,参观者无法确定哪些是真实的、哪些是 AI 生成的,这种模糊性正是设计的核心。音频叙事体系包含海浪声和叙述者引导,帮助参观者进入 jutter 的角色并反思每个物品的价值。

关键设计

  1. AI图像生成流程
  2. 做什么:将真实海滩物品照片转化为似真非真的AI图像
  3. 核心思路:先在Hoek van Holland海滩拍摄100+物品照片,然后用GPT-4 Omni将两张或三张照片组合为提示,生成新图像。筛选标准是"熟悉但诡异"(familiar but uncanny),让参观者产生判断欲望
  4. 设计动机:通过制造模糊性(ambiguity),迫使参观者主动思考和判断,而非被动接受

  5. AI视频生成流程

  6. 做什么:生成物品在海浪中变形的超现实视频
  7. 核心思路:在Zandvoort海滩录制真实海滩物品视频,使用WarpFusion(基于Stable Diffusion v1.4)进行video-to-video风格转换,选用早期扩散模型以获得更超现实的效果。后处理使用TopazLabs帧插值提升帧率
  8. 设计动机:视频隐喻海浪对物品的侵蚀和转化过程,映射AI对数字内容的"加工"

  9. 沉浸式空间设计

  10. 做什么:创建物理-数字混合的交互空间
  11. 核心思路:干湿交替的沙地模拟潮间带,浅色沙子勾勒步行路径,贝壳和漂流木等真实海滩碎片与7张AI打印图和2个视频屏幕混合放置。音频叙事引导参观者进入jutter角色
  12. 设计动机:物理空间的具身体验比屏幕上的数字展示更能激发反思和判断

训练策略

本项目不涉及模型训练,直接使用预训练的GPT-4 Omni和Stable Diffusion v1.4模型进行推理生成。

实验关键数据

装置参数

要素 细节
空间尺寸 约 2×3 米人造海滩
AI生成图像 7 张打印作品
AI视频 2 个屏幕展示
真实物品照片 100+ 张
图像生成模型 GPT-4 Omni
视频生成模型 WarpFusion + SD v1.4

设计选择分析

设计决策 选择 原因
图像生成模型 GPT-4 Omni 可以基于多张照片组合生成,效果逼真但带有陌生感
视频基础模型 SD v1.4(早期版本) 早期扩散模型生成的图像更超现实,更符合艺术需求
物理介质 打印+屏幕混合 将数字内容锚定在物理空间中,增强具身体验

关键发现

  • 选择"熟悉但诡异"的AI图像比选择明显虚假或完全逼真的图像更能激发参观者的主动判断
  • 早期扩散模型(SD v1.4)在艺术创作中反而比新模型有优势,因为其"不完美"更具超现实美感
  • 真实海滩碎片与AI图像的混合放置模糊了真实与生成的边界,恰好映射了日常信息流中的情况

亮点与洞察

  • 隐喻驱动设计:将jutters传统与AI内容消费建立映射,这种跨领域隐喻比直接讨论AI素养更容易引发共鸣和反思
  • 具身交互优于屏幕交互:通过物理空间让参观者"走过"、"拾取"、"决定保留或丢弃",这种具身体验比屏幕滚动更能培养审辨意识
  • 模型缺陷作为特征:有意选用早期SD模型的"不完美"输出,说明生成式AI的艺术应用中,模型能力并非越强越好

局限性 / 可改进方向

  • 缺乏用户研究:论文未报告参观者行为数据或反馈问卷,无法量化装置对"AI素养"的实际影响。后续应设计前后测问卷或行为追踪
  • 规模有限:仅7张图和2个视频的规模较小,难以模拟真实信息流的"信息过载"体验。可考虑生成更多AI图像形成更丰富的"海滩"
  • 单向叙事:音频引导较强,参观者的自由探索空间受限,可能更像"被引导的体验"而非"自主策展"。可考虑去除音频让参观者完全自主
  • 缺乏对比基线:未与其他AI素养教育方法(如讲座、在线交互工具)对比效果
  • 无多模态交互:参观者只能视觉观看,不能物理"拾取"或"带走"AI图像,削弱了jutter的参与感
  • 可复现性差:装置依赖物理空间和实际沙地,其他研究者难以复现或改进

相关工作与启发

  • vs 传统AI素养教育:传统方法多为信息传达(讲座、检测工具),本文用艺术体验培养直觉判断力,更关注"态度转变"而非"知识传授"
  • vs AI艺术展览:多数AI艺术展览展示AI的创作能力,本文反向聚焦"人对AI内容的判断力",以人而非AI为主体
  • vs 数字素养工具:如 Reality Defender、Deepfake 检测工具关注技术准确性,本文关注人类判断力的培养
  • 这种通过物理化+具身化来帮助人们理解数字现象的思路,可迁移到deepfake教育、信息素养培训等场景
  • jutter 隐喻揭示了一个深层问题:如果我们对待 AI 内容的态度不是"检测并删除"而是"策展并赋义",整个 AIGC 检测领域的框架都需要重新思考

评分

  • 新颖性: ⭐⭐⭐⭐ 将传统文化隐喻与AI生成内容反思结合,视角独特
  • 实验充分度: ⭐⭐ 缺乏用户研究和量化评估,仅为装置描述
  • 写作质量: ⭐⭐⭐⭐ 叙事流畅、隐喻精妙,兼具学术性和诗意
  • 价值: ⭐⭐⭐ 作为创意AI作品有启发性,但对技术社区的直接参考价值有限