生成式人工智能是一个新的流行语,以其新颖的应用而出现,如DeepFake和ChatGPT。生成式人工智能利用人工智能和机器学习算法,使机器能够根据其训练数据生成人工内容,如文本、图像、音频和视频内容。
生成式人工智能面临某些挑战,涉及数据隐私、用于欺诈或犯罪行为以及幻觉。
在这篇文章中,我们将探讨什么是生成式人工智能,它是如何工作的,优点、缺点和应用,以及充分利用它的潜力所需采取的步骤。
什么是生成式人工智能?
生成式人工智能是通过利用现有文本、音频文件或图像来创造新内容的技术。通过生成式人工智能,计算机检测与输入有关的基本模式并产生类似的内容。
有各种技术,如:
Transformers:如GPT-4、LaMDA、Wu-Dao和ChatGPT模仿认知注意力,并对输入数据部分的重要性进行不同的测量。它们被训练来理解语言或图像,学习一些分类任务,并从大量数据集中生成文本或图像。
生成式对抗网络(GANs):GANs是两个神经网络:一个生成器和一个鉴别器,它们相互对立,以找到两个网络之间的平衡:
- 生成器网络负责生成新的数据或类似于源数据的内容。
- 鉴别器网络负责区分源数据和生成的数据,以识别更接近原始数据的内容。
变量自动编码器:
- 编码器将输入编码为压缩代码,而解码器则从该代码中重现初始信息。
- 如果选择和训练正确,这种压缩的表示法可以将输入的数据分布存储在一个小得多的维度上。
生成式人工智能的应用有哪些?
内容生成
文本生成:生成式人工智能工具可以创建文本输出并与用户进行对话。ChatGPT是一个对话式生成型AI工具的例子。
从种子图像生成人脸、物体和场景的照片:生成式人工智能可以产生真实外观的照片。
名人头像AI生成
文本到图像:它可以从对简单物体如鸟和花的文字描述中产生逼真的照片。DALL-E是一个流行的文本到图像的翻译工具。
StackGAN:利用堆叠生成对抗网络从文本到照片的逼真图像合成
其他内容的生成:生成式人工智能也可以被用来
- 当通过3D打印、CRISPR和其他技术进行操作时,从头开始渲染物品。
- 编写软件代码。
图像到图像的转换
图像到图像的转换:将一个图像翻译成另一个图像。例子包括
- 黑白照片到彩色照片
- 白天的照片转换为夜晚的照片
白天转黑夜
- 照片转特定艺术风格绘画
将照片转为艺术画作
- 卫星照片转为谷歌地图视图
卫星照片转为谷歌地图视图
- 语义图像到真实照片:将输入的语义图像或草图转换为照片的现实图像。
从草图到现实图像
- 脸部正视图生成:它从不同角度拍摄的照片中生成正面的照片,用于人脸验证或人脸识别系统。
左边是轮廓图,中间是合成图,右边是真实正面图。
- 照片到表情符号:将真实照片改成表情符号或小卡通脸。
一个具体的照片到表情符号和卡通脸的例子
- 脸部老化:从一张年轻的脸部照片生成老版的脸。
与视频有关的应用
视频到视频的转换(例如,电影修复):它可以通过将老图像和老电影提升到4K及以上的水平来改善它们。例如,它可以生成每秒60帧而不是23帧或更少,消除噪音,并增加色彩。
内容本地化:深度伪造技术被应用于内容的本地化(例如:配音和调节),同时在媒体和娱乐行业的全球发行。通过使用人脸合成和声音克隆,艺术家/演员的原始声音可以与唇语相匹配。
请随时查看我们关于生成式人工智能的特定行业应用的文章:
或我们关于生成式人工智能应用的综合清单。
生成式人工智能的好处是什么?
- 总的来说:随着能力的成熟,许多行业将受到生成式人工智能的影响。生成文本、图像和视频是目前人类工作的一个重要部分。即使是部分的自动化也有很大的潜力
- 身份保护:生成式人工智能化身为那些不想在面试或工作时透露自己身份的人提供保护。
- 机器人控制:生成式建模帮助强化机器学习模型减少偏见,在模拟和现实世界中理解更抽象的概念。
- 医疗保健:生成式人工智能能够早期识别潜在的恶意,以创造有效的治疗方法。例如,GANs计算X射线图像的不同角度,以可视化肿瘤的可能扩展。
生成式人工智能的挑战是什么?
- 安全性:有些人可以利用生成式人工智能进行诈骗,如诈骗他人。
- 高估了能力:生成式人工智能算法需要大量的训练数据来执行任务。然而,GANs不能创造全新的图像或文本。它们只是以不同的方式组合它们所训练的内容。这就是为什么一些计算机科学家把它们称为 “随机鹦鹉”。
- 幻觉:在一些像GANs这样的生成式人工智能模型中,模型可能产生意想不到的结果。
- 数据隐私:与健康有关的应用涉及个人层面数据的隐私问题。
- 版权:生成式人工智能的版权是一个正在进行的立法和法庭诉讼的话题。
紧跟人工智能热潮的步骤
1. 在你的生活或你的企业中确定生成式人工智能的使用案例。大多数白领活动都围绕着创造新的文本、图像或视频,所以应该有许多可能的活动。
2. 根据这些用例对生成式人工智能的适用性进行排序。这些流程往往更容易用生成式人工智能来实现自动化:
- 在公共或私人数据中是否有相关的数据(如文本或图像),可以为模型提供信息?例如,你不能指望一个大型的语言模型来写一个全新的技术,因为它不会摄入任何关于这个主题的文本。
- 输出是主观的还是客观的?由于幻觉等问题,生成式人工智能解决方案在面对可以用客观标准评估的任务时,有可能会犯错。例如,解决数学问题的生成式人工智能模型可能会犯错误。
- 错误容忍度和错误缓解策略是什么?如果模型的输出可以被主观或客观地评价,就会有其结果令人失望的情况。这种情况需要由人类在环路中进行缓解,但如果这是一个机器需要在几毫秒内做出反应的过程,这可能是不可能的。
3. 按投资回报率对这些用例进行排名。考虑到在你的业务流中使用生成式人工智能的好处和成本,你可以确定最优先的项目
4. 设计新的流程。新的流程可能涉及到额外的人在环,或者简单工作流程的整合。
5. 选择要利用的生成式人工智能工具
6. 运行一个有明确目标和衡量结果的试点。例如,你可能已经选择了生成博客文章作为试点的用例。为了了解生成式人工智能是否带来好处,你可能需要问:
- 在与你有关的方面,新的博文比人工博文好还是不好?
- 省了多少精力?
7. 识别改进,并推出新的流程:例如,你可能已经运行了试点,用户在线使用生成式人工智能应用程序,同时在内部桌面应用程序上完成了一项任务。屏幕切换可能会降低生产力,将生成式人工智能整合到你的应用程序中,利用API可以释放出更多的节约,在上线时需要考虑。
生成式人工智能是有监督的学习吗?
生成式对抗网络建模(GANs)是一个半监督的学习框架。半监督学习方法在监督学习中使用人工标注的训练数据,在无监督学习方法中使用未标注的数据,以建立模型,通过利用标注的数据,可以在标注的数据之外做出预测。
GANs的半监督结构有一些好处,它是生成式人工智能的一种应用,与监督学习相比,它包括:
- 过度拟合:生成式模型往往有较少的参数,所以更难过度拟合。另外,生成模型由于训练过程中会接触到大量的数据,使它们对遮挡物更加坚固。
- 人类偏见:在生成模型中,人类标签不像监督学习方法那样明显。学习依赖于数据属性,这可以避免虚假的相关性。
- 模型偏差:生成式模型不会产生与训练数据中类似的样本。因此,形状与纹理的问题消失了。