连环画创作源泉！港科大、腾讯等开源SEED-Story：开创性多模态长故事生成！

发布于 2024-10-25

1654

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：连环画创作源泉！港科大、腾讯等开源SEED-Story：开创性多模态长故事生成！

文章来源：

AI生成未来

扫码关注公众号

扫码阅读

手机扫码阅读

SEED-Story Article Summary

亮点直击

SEED-Story：一个新方法，利用多模态大语言模型（MLLM）生成丰富叙述性文本和上下文相关图像的多模态故事。
提出了多模态注意力汇聚机制，可以高效生成超出训练序列长度的长故事。
引入了专为多模态故事生成而设计的大规模数据集StoryStream。

方法

SEED-Story建立在MLLM的基础上，结合视觉Tokenization和De-tokenization，以及故事指令调优和去分词器适应，提高了故事生成的质量和一致性。通过多模态注意力汇聚机制，能够在保持较低计算负担的同时生成高质量的长篇故事。

实验

通过故事可视化和多模态故事生成的实验，SEED-Story显示了在风格和角色一致性、故事吸引力以及图像-文本一致性方面相较于基准模型的优越性。长故事生成实验证明了多模态注意力汇聚在生成长序列时相对于其他方法的高效性和质量保持能力。

结论

SEED-Story是一种创新的多模态长故事生成方法，它利用了MLLM的强大能力，并通过多模态注意力汇聚机制，高效生成长序列故事。StoryStream数据集的引入，进一步促进了模型训练和基准测试的有效性。

参考文献

[1] SEED-Story: Multimodal Long Story Generation with Large Language Model

AI生成未来

查看原文：连环画创作源泉！港科大、腾讯等开源SEED-Story：开创性多模态长故事生成！

文章来源：

AI生成未来

扫码关注公众号

相关推荐

聊聊 ChatGPT 的逻辑架构与赚钱模式

1560

模型 AI 架构抽象

先讲讲 ChatGPT 这一波AI浪潮的技术架构，再聊聊已经被验证可行的个人盈利模型。

人工智能会取代软件开发人员吗？

1168

人工智能代码软件开发人员

越来越多的公司转向人工智能来加速软件交付。但基于人工智能的开发工具的日益普及引发了人们对安全性、准确性以及对软件开发人员工作影响的担忧

Sora引爆TikTok，AI网红力量震撼全球，商家巨头彻夜难眠

1159

AI 网红 Sora 用户

随着科技的飞速发展，人工智能（AI）已逐渐渗透到我们生活的方方面面。

体验完腾讯元宝的深度阅读，我觉得我以后的论文和研报有救了。

1680

元宝阅读 AI 原文

阅读的救星。

四万字长文带你了解为什么超级大佬们都如此警惕人工智能？Ilya到底在害怕什么？

1620

智能人工智能人类老王

2015年的文章，9年后，穿越时间，预言2023年今天所有的一切。

史诗级突破！一个模型让你秒变PS大神，字节最新InstructX仅用“看图”就学会了剪视频

564

编辑视频图像 MLLM

AI生成未来知识星球免费开放！

AI生成未来

AIGC最新技术及资讯

334 篇文章

浏览 399.7K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

查看方案

AI生成未来的其他文章

6款AI商品海报创作神器，让设计创意无限！

曾经，为了展现物品的美好，我们煞费苦心地设计造?

1.8秒完成90帧视频重建，相比加速1000 倍!颜水成团队提出NutWorld:渲染速度可达450FPS

点击下方卡片，关注“AI生成未来” 后台回复“GAI”?

LLM和自动驾驶强强联合 | DriveDreamer-2：自动驾驶定制视频生成世界模型!

点击下方卡片，关注“AI生成未来”>>后台回复“

全面提升！上海交大等联合发布MegaFusion：无须微调的高效高分辨率图像生成方法

点击下方卡片，关注“AI生成未来”>>后台回复“

史诗级突破！一个模型让你秒变PS大神，字节最新InstructX仅用“看图”就学会了剪视频

随机阅读

从科学管理到丰田生产模式，精益是如何产生的？

08-21

太强了！利用 Python 写了一个监控服务器资源利用率的脚本！

08-17

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

连环画创作源泉！港科大、腾讯等开源SEED-Story：开创性多模态长故事生成！

版权声明

亮点直击

方法

实验

结论

参考文献

客户续签率下滑？这套反馈管理，让客户粘性提高80%

还在用多套工具管项目？

联系我们

融实践库

微信公众号

微信视频号

社区微信群