【AI探索者之家】一文简读AIGC产品
大家好,我是肥仔杰
今天给大家讲讲最近风头无两的AIGC赛道产品。
为了方便理解,首先大家要明白几个概念:
AI:人工智能(江湖人戏称人工智障)
AIGC:人工智能内容创作
OpenAI:人工智能研发公司
ChatGPT:OpenAI的一款产品,AI聊天程序
Midjourney:根据文本生成图像的AI产品
Gen-2:AI视频创作
好,接下来简单介绍它们。
什么是OpenAI?
OpenAI是一家人工智能研究公司,由一帮人头脑发热捐了10亿美元创办,生于2015年12月,它的的使命是“创造并推动强大的人工智能,为所有人带来更好的生活”。
此公司主要探索人工智能技术的各个方面,包括自然语言处理、计算机视觉、深度学习、机器学习、强化学习等。
它的创始人有点厉害,分别是比尔盖茨、埃隆马斯克、山姆奥特曼。都是声名国内外的科技界大佬,难怪可以打造出ChatGPT这么可怕的产品。
什么是ChatGPT?
ChatGPT,全称聊天生成预训练转换器,是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。该程序使用基于GPT-3.5架构的大型语言模型并以强化学习训练。(维基百科)
目前ChatGPT-4已经推出,据说ChatGPT-5也离我们不远了。
ChatGPT的功能有多强大?
解决一切抛给它的问题
以前我们遇到问题总喜欢百度、谷歌,今天有ChatGPT,它基本能解决90%的问题,并且逻辑缜密,有条不絮。
可以理解成,一个通过与人聊天不断学习的机器人。随着人们不停地给它投喂数据,ChatGPT将会变得无所不知,然后把人们抛来的问题一一解决。
然而,ChatGPT目前的限制也很明显,它只能输出文字,也就是说无论怎么调戏它,呈现给用户的都只是干巴巴的符号,不过也许在不远的未来,这些符号会有更多丰富的含义。
官网:ai.com
什么是Midjourney?
Midjourney是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于2022年7月12日进入公开测试阶段,使用者可透过Discord的机器人指令进行操作。该研究实验室由Leap Motion的创办人大卫·霍尔兹负责领导。(维基百科)
同样是AI产品,与ChatGPT不同,Midjourney走的是图像展示之路。用户只要把文本、关键词扔给MJ,它就会生成几个特征相关的精美图片。上图是团队小伙伴通过一堆关键词生成的喵星人,不得不说,又帅又美。
官网:midjourney.com
什么是Gen-2?
Gen-2是Runaway公司的一个产品,主打AI生成视频。用户可以用文本、图片、视频作为原素材生成新的炫酷视频。
上面左边是一个原视频,通过中间的火男图片作为元素,右边就生成了一个玩火人的视频,效果炸裂屏幕。
图片加文字,生成视频。
图片生成视频。
通过Gen-2,随便一个素材,都能制作出特效满分的魔幻大片,这就是AGIC制片的通天之能。
官网:https://research.runwayml.com/gen2
其他AIGC产品:
DALLE-2:
DALL·E 2 是一个人工智能系统,可以根据自然语言的描述创建逼真的图像和艺术作品。用法类似于MJ,但它使用的是自然语言,而MJ使用的是一堆关键词与指令,所以dalle-2相对来说更加人性化。不过生成的图片质量跟MJ有一定的距离,偏向于艺术风格。
顺带一提,它也是OpenAI公司的产品。
ControlNet
根据输入图片的边缘特征、深度特征、人体姿态再配合关键词生成新图片的AGIC程序。这个程序的作品比较依赖输入图片的特征,算是以图制图吧,出图的效果确实不错。
说个让人心酸的事情,这个程序的创作者是一个00后,他一边写这程序,一边还做了一个类似游戏王的卡牌游戏,人气还不错,现在的00后都怎么了?爱恩斯坦转生?
Stable Diffusion
根据文本描述生成图像,无论是效果与质量都是杠杠的。
好吧,也许是我的描述不太对,也许是AI去了约会,下次一定能出来个大漂亮。
纵观以上AIGC的产品,你觉得哪个最神?在肥仔看来,无疑是ChatGPT,因为它是一个成长型的产品,而且每个用户都是它的老师,在与用户的交互过程中,不停地学习,记忆,然后成为自己的知识。这就很像一个真正的人,甚至把前者超越。
今天的介绍就到此结束了,谢谢大家的关注支持。
我们是AI探索者之家,专注研究AI行业前沿技术,体验AI赛道的优秀产品,分享最新价值资讯,欢迎各位加入我们一起探索人工智能新世界。
加入社群,请添加管理:lanjiejiang 推特:@AiTansuozhe