ECCV`24 | 艺术文本和场景文本分割任务新SOTA 方法！华科&Adobe提出WAS！

发布于 2024-10-22

1194

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：ECCV`24 | 艺术文本和场景文本分割任务新SOTA 方法！华科&Adobe提出WAS！

文章来源：

AI生成未来

扫码关注公众号

扫码阅读

手机扫码阅读

亮点摘要

提出了艺术文本分割任务，并构建了一个真实数据集用于基准测试。
设计了训练数据合成策略，生成了包含10万对图像-mask的合成数据集。
引入了逐层动量查询机制和骨架辅助头，以应对局部笔画变化和全局结构复杂性。
在艺术文本分割和场景文本分割任务中取得了最先进(SOTA)的成果，简化了实验范式。

数据集概述

提出了两个艺术文本数据集，WAS-R由真实世界文本图像组成，WAS-S由合成文本图像组成。WAS-R包含7,100张图像，并提供了详细的标注，包括最小四边形检测框、文本转录及文本效果。WAS-S合成数据集使用文本图像生成模型、Monkey语言模型和GPT-4配合 Mask Render技术生成。

方法介绍

WASNet模型基于Mask2Former架构，增加骨架辅助头和逐层动量查询改进了Transformer解码器。引入了mask注意力机制和逐层动量查询来应对艺术文本的局部笔画多样性。骨架辅助头提取对象中心轴，帮助捕捉文本全局结构。

实验结果

WASNet在WAS-R数据集上表现优越，超越了其他语义分割和文本分割模型。也在公开的场景文本分割数据集上验证了模型的泛化能力，取得了竞争力或最先进的结果。消融研究表明，提出的模块和合成数据集有效提升了性能。

结论与展望

本文聚焦于艺术文本分割任务，提出了真实和合成数据集，并通过引入逐层动量查询和骨架辅助头，显著提升了艺术文本分割的性能和泛化能力。期望未来有更多研究关注这一任务，改变文本分割的实验范式。

AI生成未来

查看原文：ECCV`24 | 艺术文本和场景文本分割任务新SOTA 方法！华科&Adobe提出WAS！

文章来源：

AI生成未来

扫码关注公众号

相关推荐

看完了钉钉新发布的「AI搜索」，让我觉得，真香。

1791

搜索 AI 钉钉信息

他们说，还想骑到AI背上去。

国产大模型海螺AI试用介绍

2901

国内AI初创企业 MiniMax 稀宇科技推出 MoE 混合专家模型架构的abab6.5系列模型。

对互联网人的6条忠告，每一条都很真实

936

用户内容媒体平台

大家好，我是文宇。出身农村，大二就实现经济独立

腾讯把我的公众号，变成了一个巨大的"数字生命"。

1306

公众 AI 知识库微信

我刚刚看到了微信的未来。

39页PPT | 2024智慧教育行业解决方案：打造数字教育、智能教学、大数据管理最优服务体系（附下载）

1230

数据下载智慧星球

智慧教育正以前所未有的速度改变着教育的面貌，它不仅是技术的革新，更是教育理念的升级。

AI编程神器Cursor，保姆级教程来了！

7150

AI 代码 Cursor 工具

Datawhale干货作者：温鑫，Datawhale优秀学习者一、??

AI生成未来

AIGC最新技术及资讯

334 篇文章

浏览 429.6K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

查看方案

AI生成未来的其他文章

ECCV`24 | 首次解决文本到3D NeRFs分解问题！港中文等提出DreamDissector

点击下方卡片，关注“AI生成未来”>>后台回复“

图像生成开源界又出“王炸”！南洋理工&阶跃星辰发布iMontage：解锁“多对多”生成新玩法！

点击下方卡片，关注“AI生成未来”????扫码免费加入A

一言、一格和一念，百度的生成内容生态圈

文心一言、文心一格和百度智能云一念都是百度推出?

4分15秒！高质量超长视频生成取得颠覆突破！字节Self-Forcing++超基线50倍，效果炸裂！

点击下方卡片，关注“AI生成未来”????扫码免费加入

炸裂！昆仑万维开源「元素级视频生成」神器SkyReels-A2！效果吊打闭源商业模型！

点击下方卡片，关注“AI生成未来”如您有工作需要??

随机阅读

中年人的职业规划，从来都不是自己一个人（选行业/公司/岗位……）的事儿

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

ECCV`24 | 艺术文本和场景文本分割任务新SOTA 方法！华科&Adobe提出WAS！

版权声明

亮点摘要

数据集概述

方法介绍

实验结果

结论与展望

项目管理必须是一把手工程

还在用多套工具管项目？

联系我们

融实践库

微信公众号

微信视频号

社区微信群