Agentic AI vs. Generative AI：理解关键差异和影响

Thu Nov 14 2024

像 GPT (opens new window) 这样的大型语言模型 (LLM) (opens new window) 可以生成文本、回答问题并协助完成许多任务。然而，它们是被动的，这意味着它们只会根据学到的模式对接收到的输入做出反应。LLM 不能自己做决定；除此之外，它们无法计划或适应不断变化的情况。

Agentic AI (opens new window) 的出现解决了这个问题。与Generative AI (opens new window) LLM 不同，Agentic AI可以主动行动，设定目标，并从经验中学习。它是能够主动随着时间的推移调整其行为，并且可以处理需要持续解决问题和决策的更复杂的任务。这种从被动到主动AI的转变为许多行业的科技发展开辟了新的可能性。

在本博客系列中，我们将分析Agentic AI和Generative AI之间的区别，探讨它们如何影响各个行业和技术的未来。在第一篇文章中，我们将首先探讨这两种类型的AI的不同之处。

# Agentic AI

Agentic AI是指能够自主做出决策并采取行动以完成特定目标的AI系统。这些AI模型不是简单地生成内容，而是可以与其周围环境互动，响应变化，并在人工指导最小的情况下完成任务。例如，具有自主智能体功能的虚拟助手不仅可以提供信息，还可以安排约会、管理提醒或执行其他操作来帮助用户实现其目标。同样，自动驾驶汽车也是Agentic AI的主要应用场景，因为它们可以实时做出决策，以便安全地在道路上行驶并独立到达目的地。

# Generative AI

Generative AI是一种专注于创造新内容的人工智能，例如文本、图像、音乐甚至视频。它的工作原理是从大量数据中学习以理解模式、风格或结构，然后根据学到的内容生成原创内容。例如，像ChatGPT这样的Generative AI可以对问题产生独特的文本回复，而像DALL-E这样的图像生成模型可以根据文本描述创建图像。从本质上讲，Generative AI就像一位数字艺术家或作家，根据其所学到的知识创作作品。

上图突出显示了Agentic AI如何通过包括“思考/研究”和“修订”阶段的迭代循环工作流程来工作。这种自适应过程涉及持续的自我评估和改进，使Agentic AI能够产生更高质量、优化的输出。我们可以采取多个步骤来测试和改进其工作，Agentic AI可以独立运行，从每个阶段中学习，并处理需要持续评估和调整的任务。

上图展示了Generative AI如何遵循一个直接的、单步骤的工作流程：它一次性地从“开始”直接移动到“完成”。这意味着AI会提供即时响应，而无需重新审视或改进其输出。该过程是线性的，产生的基本结果符合初始提示，但不考虑边缘情况或迭代测试。这说明了Generative AI在处理更复杂或自适应任务方面的局限性。

# Agentic AI和Generative AI的特征

本节探讨Agentic AI和Generative AI的独特特征，重点介绍它们在智能、自主性和决策方面的不同方法。

自主性: Agentic AI可以在不需要人类持续输入的情况下独立运行。它自主做出决策并执行任务。把它想象成一个无需人工控制就能运行的机器人，它根据周围环境决定下一步做什么。
目标导向行为: Agentic AI的运作以明确的目标为导向。它不是随机地对世界做出反应，而是积极地朝着特定目标努力。例如，自动驾驶汽车努力安全地将您送达目的地，它采取的每一个行动，从转向到刹车，都服务于这一目标。
适应和学习: Agent从其行动和经验中学习。当它遇到问题或失败时，它会进行调整。例如，推荐电影的AI会了解您喜欢的电影，并随着时间的推移改进，以便为您提供更好的建议。
复杂决策: Agentic AI不仅仅做出简单的选择，还会评估许多选项并考虑结果。想象一下一个控制股票交易算法的AI：它分析大量数据，预测趋势，并根据这些信息决定是否买卖股票。
环境感知: 为了使LLM做出明智的选择，它需要了解其环境。它通过传感器或数据来做到这一点。例如，机器人使用摄像头“看到”障碍物，然后绕过它们。

有限的自主性: Generative AI的自主性有限。它不能独立行动，需要人工输入才能生成响应。它处理接收到的输入，并根据学习到的模式生成输出，但它不能启动行动或在没有外部提示的情况下运行。
面向任务的行为: Generative AI是面向任务的，但仅限于被动意义上。它通过生成相关内容（例如文本或图像）来响应特定提示或任务，但它不会追求长期目标或没有总体目标。每个任务都是根据即时输入完成的。
基本决策: Generative AI进行基本决策。它根据学习到的模式选择输出，但它不会评估多个备选方案或考虑后果。例如，在生成文本时，它会根据训练选择最可能的下一个单词或短语，但它不会做出复杂的、多层次的决策。
无学习或适应: Generative AI不会实时学习或适应。一旦经过训练，它就会根据在训练期间学习到的模式进行操作，但它不会根据新的交互改变或改进其性能，除非使用更新的数据重新训练。
无环境感知: Generative AI没有环境感知。它处理数据（例如，文本、图像），但不能感知或解释物理环境。它无法理解周围环境，只能对给定的输入做出反应，而没有任何外部感知。

# 案例研究：自主智能体工作流程的实际应用

虽然Generative AI和Agentic AI之间的理论区别很明显，但在实际应用中看到这些概念才能真正体现Agentic AI的潜力。为了展示其实际价值，让我们探讨一个案例研究，展示Agentic AI如何在现实场景中优于传统的LLM方法。

吴恩达分享过一个案例，以突出自主智能体工作流程在编码任务中的强大功能。他的团队使用HumanEval编码基准测试了两种方法。任务是：“给定一个整数列表，返回所有偶数位置元素的总和。” 在第一种方法零样本提示 (opens new window)中，AI被简单地要求直接解决问题，无需任何额外步骤。例如，GPT-3.5的准确率为48%，GPT-4的表现更好，为67%。这些结果不错，但并不出色。

快速术语：

零样本提示: 要求AI解决问题，而无需提供额外指导或将其分解为更小的步骤。
自主智能体工作流程: 一种将任务分解成更小阶段的方法，例如理解、编码、测试和调试，允许AI迭代并随着时间的推移改进。

然而，当团队应用Agentic workflow时，即将任务分解成更小的步骤，如理解问题、分部分编写代码、测试和修复错误，GPT-3.5的表现甚至优于GPT-4。吴恩达指出，GPT-4在使用Agentic workflow时也显示出更强的结果。这表明，通过采取循序渐进的方法，AI模型，尤其是较旧的模型，可以胜过使用传统方法（如零样本提示）的更先进的模型。

# 结论

随着AI在我们生活和工作场所中扮演越来越重要的角色，理解Agentic AI和Generative AI之间的区别至关重要。Generative AI在文本生成等任务中非常有用，通过生成文本或图像来响应提示。但它仅限于遵循指令，没有真正的自主性。另一方面，Agentic AI则更进一步——它可以自主设定目标、做出决策并适应不断变化的情况，从而承担复杂的的任务而无需持续的人工指导。

通过使用自主智能体工作流程等方法，AI系统可以变得更加有效，通过迭代步骤提高性能，并从每个阶段中学习。这种转变为高级应用开辟了机会，并使即使是较旧的模型也能不断发展并保持相关性。在本系列的后续文章中，我们将探讨Agentic AI如何在实践中运作，以及它在重塑行业和推动新创新方面的潜力。

Agentic AI

Generative AI

Agentic AI和Generative AI的特征

案例研究：自主智能体工作流程的实际应用

结论