扫码阅读
手机扫码阅读

ChatGPT 大行其道,带你走近 AIGC

61 2024-03-30

近几周来亲自上手体验了几款产品,内容涉及到 AIGC 的几个代表应用,全文不涉及高深的算法理论,尽量让屏幕的你能够轻松阅读,走进信息科技的前沿。

什么是 GC,全称为Generated Content,生产内容,AIGC 就是AI Generated Content,AI 生成内容,可以简单对标下 Web 的发展历程,Web 1.0 时代,前面的那个是 PGC(专业机构生产内容),Web2.0 时代 UGC(用户生产内容),依此类推,那是不是 Web3.0 时代就是 AIGC 了?目前有声音说是了,究竟是不是交给时间来考证,这里不纠结。(Web 3.0跟Web3 难道还不是一个东西?按当下的概念来讲,确实不是一个东西,虽然很让你纠结)

聊AIGC,ChatGPT 是一个避不开的应用,由 OpenAI 公司研发,它可以做到的技能,想必你在其它文章或音、视频里都看到了,这引发了大众对自己职业的担忧,未来也必将是AI的天下,那人类的未来又在哪里?人类会在AI的辅助下,进行更好的社会发展与治理,或者某一天AI觉醒,将人类取代成为地球的主宰也不是不可能。

ChatGPT 是相对没有人物偏向性的产生内容,除非你指定他以何种角色对话,下面我又体验了两款类似的应用,都是使用一些人物的生平材料作为数据养分喂给模型,模型就可以模拟对应的人物进行对话。

Hello History 可以与历史名人对话的App,可以安装到手机上体验一下。

Character.ai 与一些名人对话,不再局限于是否真实存在,请看下图是我与科技狂人Elon Musk的对话。体验地址:https://beta.character.ai/

从市场反映看,但凡跟 ChatGPT 沾亲带故,动辄几千亿的市值涨幅都很轻松,如 Microsoft、Google、Notion等,微软 Bing 已经集成ChatGPT,其它产品也即将用 ChatGPT 重新武装。OpenAI 部分成员因不满微软对公司的注资,出走创立 Anthopic 公司,旗下的产品也即将面世,可谓是 ChatGPT 的劲敌。Google 也匆忙对外发布名为 Bard 的对标产品,不过被内部研发小伙伴鄙视,具体效果如何,一切待面世时揭秘。由于OpenAI的底层数据模型是闭源的,外界无法了解其内部的模型算法,Facebook(现名Meta)公司开源了一个宣称基本实现类似模型大小相同的产品,Meta 希望这个产品能填补ChatGPT的底层闭源模型商业化造成的空白。

国内也在搞对标 ChatGPT 的产品,体验了几个号称支持音、图、文的多模态产品,名字起的很高端,体验下来貌似停留在 Demo 级别,造势很大,实则名不符实。人工智能三要素:数据,算力和算法,算力上就滤掉了很多团队。有多少家企业可以如 OpenAI 一般不计成本、不计回报、长周期的进行低调研发?这种感觉就像别人潜心数十载练就了绝世武功,张三看到了,他也想天下第一,于是就公开宣扬开始闭关修炼,将来的武功定在别人之上,不管是蹭热度还是有真本事,交给时间吧。


下面再聊聊图片、音频领域,AI 生成图片早已不是什么新鲜事,市面上也有较多的应用出现,职场中也早有大批的相关从业人员利用这些产品作为自己的重要生产力工具,下面简单几款比较常见、名头比较大的产品给大家,有机会可以找到试试,说不定自己能从中找到灵感。

  • Midjourney,目前相对类似产品商业化做得最好,需要付费使用,体验地址:https://midjourney.com/
  • DALL-E 2,OpenAI 旗下的图片处理产品,需要付费使用,可以免费体验几次,体验地址:https://labs.openai.com/
  • DeepAI,付费软件,有较好的信息提示,可以辅助你出图,体验地址:https://deepai.org/machine-learning-model/text2img
  • Stable Diffusion,开源软件,安装比较复杂,一般人可能不知道怎么操作,可以使用一些现成的服务如Dream Studio,体验地址:https://beta.dreamstudio.ai/dream
  • Disco Diffusion,开源产品,可以在 Google Drive 中直接运行或者部署到本地运行,但体验界面不够友好,但出图效果比较优秀。

以前只有专业图片处理高手才能出的图,当下借助于 AI 生图软件,只需要通过一句提示语,普通大众也可以轻松拿到,是不是科技的进来带来更快更高效的生产力呢!

再聊聊音视频领域,AI语音合成也有比较惊艳的表现。

在 podcast.ai 推出的第一集播客节目里,已故的乔布斯竟然“死而复生”成为首位嘉宾,与美国知名播客主持人 Joe Rogan 进行了一场长达20分钟的对话,是不是听起来有些毛骨悚然?事实上,这段采访是由文本生成音频实现的,属于 AIGC 中的一个分支。

Runway AI是一家美国图片和视频AI编辑软件提供商,旗下有一款视频生成器GEN-1,为设计师、艺术家和开发人员提供一系列的工具和平台,帮助他们利用人工智能技术创建作品。其强大到可以根据你的简单描述,或者一张参考图,就能将视频转换成你想要的风格。


AIGC 由人工智能辅助或替代人类进行音、视频、图文的内容创作,将人从大量制式化内容生产中解放出来,许多的职业就会发生深刻变革,如编辑、主播和程序员等,也必将催生新的职业以及新的商业机会,人类注定要在这场革命中重获新生。
原文链接: http://mp.weixin.qq.com/s?__biz=MzIwMjE3MDIwMA==&mid=2247487276&idx=1&sn=b758c662aaf3b17beaf7fabe5146733d&chksm=96e3851ba1940c0dcdad646c4a41ec898d6cf49514f63bdaf9daacd35885303ce62a396ce902#rd

某产研团队技术总监,16年研发管理经验,终身学习践行者,持续关注个人成长和前沿信息技术。

132 篇文章
浏览 15.3K
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设 白皮书上线