AIGC爆火钱:春节前美国的投资机构都只看AIGC的方向了 人:裁员潮中AIGC招聘职位却在增长 公司:AIGC方向的初创公司250家以上,接近7成至少拿到天使轮投资,11%已经B轮以上 行业:各种AIGC大会直播 政策媒体:两会报道提了chatgpt AIGC是什么 AIGC即AI Generated Content,是指利用人工智能技术来生成内容 web1.0(PGC)—— web2.0(UGC)——AiUGC——AIGC(本质上是UGC的重组) AIGC的应用 现在 第一个方向是通过AI生成文字,比如自动写邮件和广告营销文案,这要归功于OpenAI的GPT-3 AI语言模型,目前大多数AI生成文字类项目都使用该模型。 第二个方向是利用AI作图,主要技术是结合多模态神经语言模型CLIP和图像去躁扩散模型Diffusion,仅仅提供一些关键词描述就可以自动生成图片。 第三个方向是AIGC的底层技术模型开发,OPENAI和StableAI 是这个方向的龙头,也是融资金额最大的 最近 预计接下来AIGC的热门方向可能是用AI生成视频和动画,这就看Meta、Google的AI视频模型能不能解决视频的连贯性和逻辑性问题,或其他公司提出更好的解决方案。 以后 多场景:仿真驾驶/医疗/工厂/零售/人 多模态:内容生产 AIGC有什么影响 机会 脑力生产者效率的第二次飞跃,低成本自动化内容生产,AIGC极有可能成为内容生产的基础设施 有可能成为元宇宙的基石 生成式Ai可能是通用人工智能的雏形— 威胁 知识产权 隐私 安全 技术伦理 环境 AIGC生成图片 Stable Diffusion:开源可定定制 DALL-E2:擅长写实,提示简单 Midjourney:梯子,每月10或30美元,擅长艺术图像 人工智能绘画你给打几分 StableDiffusion、Midjourney 和 DALL-E-2 三种模型对比prompt Stable Diffusion Midjourney DALL-E2 AIGC生成文本 ChatGPT:专注于对话生成的语言模型,已经开放api,梯子 用户输入自然语言文本,chatGPT智能对答:回答、短文、诗歌、代码、数学、逻辑计算 聊天 通过上下文模拟面试 写代码 写诗 有理有据的拒绝你 特点:虽然可能回答会歪曲事实,但敢于质疑,能承认无知,支持多轮,能够理解上下文 AIGC的其他产品音频:AI播客Podcast.Ai视频:Meta:Make-A-Video(生成一段情节连贯的视频)Google:Imagen Video和Phenaki(文字转视频、图片转视频、视频生成视频)视频的连贯性和逻辑性仍有问题3D模型:(NeRF)可以把全景相机拍摄的视频自动渲染为3D场景虚拟摄影:DeepAgency虚拟摄影工作室服务 AIGC的底层技术 技术架构 变革基础 基础的生成算法突破 、预训练模型引起质变 、多模态技术推进内容多样性 Ai生成图片技术 传统GAN图片结果输出不稳定,分辨率低 Diffusion解决作画的问题:2022年7月,是一种去噪扩散模型,工作原理是对图像逐步施加噪点,直至图像被破坏变成完全的噪点,然后再逆向学习从全噪点还原为原始图像的过程,而AI所看到的是全是噪点的画面如何一点点变清晰直到变成一幅画,通过这个逆向过程来学习如何作画。——逆计算 CLIP解决文本和图像的问题:多模态,它一方面对文字进行语言分析,另一方面对图形进行视觉分析,不断调整两个模型内部参数,达到文字和图像高度匹配的效果。 Ai生成文本技术 结语 人类还在为了生存苦苦挣扎,Ai却早早拥有了诗和远方。