Sign In
Free Sign Up
  • English
  • Español
  • 简体中文
  • Deutsch
  • 日本語
Sign In
Free Sign Up
  • English
  • Español
  • 简体中文
  • Deutsch
  • 日本語

Agentic AI vs. Generative AI:理解关键差异和影响

GPT (opens new window) 这样的大型语言模型 (LLM) (opens new window) 可以生成文本、回答问题并协助完成许多任务。然而,它们是被动的,这意味着它们只会根据学到的模式对接收到的输入做出反应。LLM 不能自己做决定;除此之外,它们无法计划或适应不断变化的情况。

Agentic AI (opens new window) 的出现解决了这个问题。 与Generative AI (opens new window) LLM 不同,Agentic AI可以主动行动,设定目标,并从经验中学习。它是能够主动随着时间的推移调整其行为,并且可以处理需要持续解决问题和决策的更复杂的任务。这种从被动到主动AI的转变为许多行业的科技发展开辟了新的可能性。

在本博客系列中,我们将分析Agentic AI和Generative AI之间的区别,探讨它们如何影响各个行业和技术的未来。在第一篇文章中,我们将首先探讨这两种类型的AI的不同之处。

# Agentic AI

Agentic AI是指能够自主做出决策并采取行动以完成特定目标的AI系统。这些AI模型不是简单地生成内容,而是可以与其周围环境互动,响应变化,并在人工指导最小的情况下完成任务。例如,具有自主智能体功能的虚拟助手不仅可以提供信息,还可以安排约会、管理提醒或执行其他操作来帮助用户实现其目标。同样,自动驾驶汽车也是Agentic AI的主要应用场景,因为它们可以实时做出决策,以便安全地在道路上行驶并独立到达目的地。

# Generative AI

Generative AI是一种专注于创造新内容的人工智能,例如文本、图像、音乐甚至视频。它的工作原理是从大量数据中学习以理解模式、风格或结构,然后根据学到的内容生成原创内容。例如,像ChatGPT这样的Generative AI可以对问题产生独特的文本回复,而像DALL-E这样的图像生成模型可以根据文本描述创建图像。从本质上讲,Generative AI就像一位数字艺术家或作家,根据其所学到的知识创作作品。

上图突出显示了Agentic AI如何通过包括“思考/研究”和“修订”阶段的迭代循环工作流程来工作。这种自适应过程涉及持续的自我评估和改进,使Agentic AI能够产生更高质量、优化的输出。我们可以采取多个步骤来测试和改进其工作,Agentic AI可以独立运行,从每个阶段中学习,并处理需要持续评估和调整的任务。

上图展示了Generative AI如何遵循一个直接的、单步骤的工作流程:它一次性地从“开始”直接移动到“完成”。这意味着AI会提供即时响应,而无需重新审视或改进其输出。该过程是线性的,产生的基本结果符合初始提示,但不考虑边缘情况或迭代测试。这说明了Generative AI在处理更复杂或自适应任务方面的局限性。

# Agentic AI和Generative AI的特征

本节探讨Agentic AI和Generative AI的独特特征,重点介绍它们在智能、自主性和决策方面的不同方法。

  • 自主性: Agentic AI可以在不需要人类持续输入的情况下独立运行。它自主做出决策并执行任务。把它想象成一个无需人工控制就能运行的机器人,它根据周围环境决定下一步做什么。
  • 目标导向行为: Agentic AI的运作以明确的目标为导向。它不是随机地对世界做出反应,而是积极地朝着特定目标努力。例如,自动驾驶汽车努力安全地将您送达目的地,它采取的每一个行动,从转向到刹车,都服务于这一目标。
  • 适应和学习: Agent从其行动和经验中学习。当它遇到问题或失败时,它会进行调整。例如,推荐电影的AI会了解您喜欢的电影,并随着时间的推移改进,以便为您提供更好的建议。
  • 复杂决策: Agentic AI不仅仅做出简单的选择,还会评估许多选项并考虑结果。想象一下一个控制股票交易算法的AI:它分析大量数据,预测趋势,并根据这些信息决定是否买卖股票。
  • 环境感知: 为了使LLM做出明智的选择,它需要了解其环境。它通过传感器或数据来做到这一点。例如,机器人使用摄像头“看到”障碍物,然后绕过它们。
  • 有限的自主性: Generative AI自主性有限。它不能独立行动,需要人工输入才能生成响应。它处理接收到的输入,并根据学习到的模式生成输出,但它不能启动行动或在没有外部提示的情况下运行。
  • 面向任务的行为: Generative AI面向任务的,但仅限于被动意义上。它通过生成相关内容(例如文本或图像)来响应特定提示或任务,但它不会追求长期目标或没有总体目标。每个任务都是根据即时输入完成的。
  • 基本决策: Generative AI进行基本决策。它根据学习到的模式选择输出,但它不会评估多个备选方案或考虑后果。例如,在生成文本时,它会根据训练选择最可能的下一个单词或短语,但它不会做出复杂的、多层次的决策。
  • 无学习或适应: Generative AI不会实时学习或适应。一旦经过训练,它就会根据在训练期间学习到的模式进行操作,但它不会根据新的交互改变或改进其性能,除非使用更新的数据重新训练。
  • 无环境感知: Generative AI没有环境感知。它处理数据(例如,文本、图像),但不能感知或解释物理环境。它无法理解周围环境,只能对给定的输入做出反应,而没有任何外部感知。

# 案例研究:自主智能体工作流程的实际应用

虽然Generative AI和Agentic AI之间的理论区别很明显,但在实际应用中看到这些概念才能真正体现Agentic AI的潜力。为了展示其实际价值,让我们探讨一个案例研究,展示Agentic AI如何在现实场景中优于传统的LLM方法。

吴恩达分享过一个案例,以突出自主智能体工作流程在编码任务中的强大功能。他的团队使用HumanEval编码基准测试了两种方法。任务是:“给定一个整数列表,返回所有偶数位置元素的总和。” 在第一种方法零样本提示 (opens new window)中,AI被简单地要求直接解决问题,无需任何额外步骤。例如,GPT-3.5的准确率为48%,GPT-4的表现更好,为67%。这些结果不错,但并不出色。

快速术语:

  • 零样本提示: 要求AI解决问题,而无需提供额外指导或将其分解为更小的步骤。
  • 自主智能体工作流程: 一种将任务分解成更小阶段的方法,例如理解、编码、测试和调试,允许AI迭代并随着时间的推移改进。

然而,当团队应用Agentic workflow时,即将任务分解成更小的步骤,如理解问题、分部分编写代码、测试和修复错误,GPT-3.5的表现甚至优于GPT-4。吴恩达指出,GPT-4在使用Agentic workflow时也显示出更强的结果。这表明,通过采取循序渐进的方法,AI模型,尤其是较旧的模型,可以胜过使用传统方法(如零样本提示)的更先进的模型。

# 结论

随着AI在我们生活和工作场所中扮演越来越重要的角色,理解Agentic AI和Generative AI之间的区别至关重要。Generative AI在文本生成等任务中非常有用,通过生成文本或图像来响应提示。但它仅限于遵循指令,没有真正的自主性。另一方面,Agentic AI则更进一步——它可以自主设定目标、做出决策并适应不断变化的情况,从而承担复杂的的任务而无需持续的人工指导。

通过使用自主智能体工作流程等方法,AI系统可以变得更加有效,通过迭代步骤提高性能,并从每个阶段中学习。这种转变为高级应用开辟了机会,并使即使是较旧的模型也能不断发展并保持相关性。在本系列的后续文章中,我们将探讨Agentic AI如何在实践中运作,以及它在重塑行业和推动新创新方面的潜力。

Keep Reading
images
使用重新排序函数和MyScale的两阶段检索

正如我们之前的一篇博文所探讨的,向量搜索通过将文本转换为数值向量,突破了传统关键词匹配的局限,为信息检索带来了革命性的进展。这种方法能够捕捉文本的上下文信息,从而提高搜索结果的相关性。然而,向量搜索并非完美无缺。从文本到向量的转换过程不可避免地会导致信息丢失,进而影响搜索的准确性。 为了解 ...

images
使用MyScaleDB和LlamaIndex构建高级RAG应用程序

大型语言模型(LLM)以其理解和生成类似人类的文本的能力带来了巨大的价值。然而,这些模型也面临着显著的挑战。它们是在需要大量成本和时间的庞大数据集上进行训练的。在大规模数据集上训练这些模型所需的巨大成本和时间几乎不可能定期重新训练它们。这个限制意味着它们经常缺乏最新数据的更新,导致在查询不熟悉的主题时可能出现不准确的情况。这种现象被称为“幻觉”,它可能会降低应用程序的性能,并引发对其可靠性和真实性 ...

images
选择矢量数据库前需要了解的一切

随着数据量和复杂性的不断增长,可扩展的NoSQL数据库解决方案正成为传统关系型数据库的热门替代方案。其中一种备受关注的类型是矢量数据库。矢量数据库承诺通过高维矢量搜索而不是传统的SQL查询来组织和检索数据,从而提供先进的语义搜索能力,根据数据的含义和相似性进行操作。 在选择矢量数据库之前,您需要仔细考虑一些关键因素,以确保它能够满足您当前和未来的应用和分析需求。这就是我们将在本博客中讨论的内容。 ...

Start building your Al projects with MyScale today

Free Trial
Contact Us