跳到主要内容

数据框操作 (DataFrame Operations)

数据框操作 (DataFrame Operations) 组件对 DataFrame (表) 的行和列执行操作,包括模式更改、记录更改、排序和过滤。 有关所有选项,请参阅 数据框操作参数

输出是在运行所选操作后包含修改数据的全新 DataFrame

在工作流中使用数据框操作组件

以下步骤说明了如何在工作流中配置 数据框操作 (DataFrame Operations) 组件。 您可以跟随示例操作或使用您自己的工作流。 唯一的要求是前一个组件必须创建可以传递给 数据框操作 组件的 DataFrame 输出。

  1. 创建一个新工作流或使用现有工作流。

    示例:API 响应提取流

    以下示例工作流使用五个组件从 API 响应中提取 Data,将其转换为 DataFrame,然后使用 数据框操作 组件对表格数据进行进一步处理。 第六个组件 聊天输出 (Chat Output) 在此示例中是可选的。 它仅作为一种方便的方式,让您在 操练场 (Playground) 中查看最终输出,而不是检查组件日志。

    一个摄取 API 响应,使用智能转换组件将其提取到 DataFrame,然后通过数据框操作组件进行处理的工作流

    如果您想使用此示例测试 数据框操作 组件,请执行以下操作:

    1. 创建一个包含以下组件的工作流:

      • API 请求 (API Request)
      • 语言模型 (Language Model)
      • 智能转换 (Smart Transform)
      • 类型转换 (Type Convert)
    2. 配置 智能转换 (Smart Transform) 组件 及其依赖项:

      • API 请求 (API Request):配置 API 请求 组件 以从您选择的端点获取 JSON 数据,然后将 API 响应 (API Response) 输出连接到 智能转换 组件的 数据 (Data) 输入。
      • 语言模型 (Language Model):选择您喜欢的提供商和模型,然后输入有效的 API 密钥。 将输出更改为 语言模型 (Language Model),然后将 LanguageModel 输出连接到 智能转换 组件的 语言模型 (Language Model) 输入。
      • 智能转换 (Smart Transform):在 说明 (Instructions) 字段中,输入自然语言说明以从 API 响应中提取数据。 您的说明取决于响应内容和预期的结果。 例如,如果响应包含一个很大的 result 字段,您可能会提供诸如 将 result 字段展开为 Data 对象 之类的说明。
    3. 智能转换 组件的 Data 输出转换为 DataFrame

      1. 过滤后的数据 (Filtered Data) 输出连接到 类型转换 (Type Convert) 组件的 数据 (Data) 输入。
      2. 类型转换 组件的 输出类型 (Output Type) 设置为 数据框 (DataFrame)

    现在工作流已准备好让您添加 数据框操作 组件。

  2. 向工作流中添加 数据框操作 (DataFrame Operations) 组件,然后将来自另一个组件的 DataFrame 输出连接到 数据框 (DataFrame) 输入。

    数据框操作 组件中的所有操作都需要至少一个来自另一个组件的 DataFrame 输入。 如果组件不产生 DataFrame 输出,您可以使用另一个组件(例如 类型转换 (Type Convert) 组件)在将数据传递给 数据框操作 组件之前重新格式化数据。 或者,您可以考虑使用旨在处理原始数据类型的组件,例如 解析器 (Parser) 组件数据操作 (Data Operations) 组件

    如果您正在跟随示例工作流操作,请将 类型转换 组件的 数据框输出 (DataFrame Output) 端口连接到 数据框 (DataFrame) 输入。

  3. 操作 (Operations) 字段中,选择您想要在传入的 DataFrame 上执行的操作。 例如,过滤 (Filter) 操作根据指定的列和值过滤行。

    提示

    您只能选择一个操作。 如果您需要对数据执行多个操作,可以将多个 数据框操作 组件链接在一起,按顺序执行每个操作。 对于更复杂的、多步骤的操作(如剧烈的模式更改或透视),请考虑使用 LLM 驱动的组件(如 结构化输出 (Structured Output) 组件智能转换 (Smart Transform) 组件)作为 数据框操作 组件的替代或准备。

    如果您正在跟随示例工作流操作,请选择您想要应用于由 智能转换 组件提取的数据的任何操作。 要查看传入 DataFrame 的内容,请在 类型转换 组件上单击 运行组件 (Run component),然后单击 检查输出 (Inspect output)。 如果 DataFrame 似乎格式有误,请在每个上游组件上单击 检查输出 (Inspect output) 以确定错误发生的位置,然后根据需要修改工作流的配置。 例如,如果 智能转换 组件没有提取预期的字段,请修改您的说明或验证 API 响应 输出中是否存在给定字段。

  4. 配置操作的参数。 具体的参数取决于所选的操作。 例如,如果您选择 过滤 (Filter) 操作,您必须使用 列名 (Column Name)过滤值 (Filter Value)过滤运算符 (Filter Operator) 参数定义过滤条件。 有关更多信息,请参阅 数据框操作参数

  5. 要测试工作流,请在 数据框操作 (DataFrame Operations) 组件上单击 运行组件 (Run component),然后单击 检查输出 (Inspect output) 以查看从 过滤 (Filter) 操作创建的新 DataFrame

    如果您想在 操练场 (Playground) 中查看输出,请将 数据框操作 组件的输出连接到 聊天输出 (Chat Output) 组件,重新运行 数据框操作 组件,然后单击 操练场 (Playground)

有关另一个示例,请参阅 条件循环

数据框操作参数

大多数 数据框操作 (DataFrame Operations) 参数都是条件性的,因为它们仅适用于特定操作。

仅有的永久参数是 数据框 (DataFrame) (df)(即 DataFrame 输入)和 操作 (Operation) (operation)(即要在 DataFrame 上执行的操作)。 一旦您选择了一个操作,该操作的条件参数就会出现在 数据框操作 组件上。

添加列 (Add Column) 操作允许您向 DataFrame 添加一个具有常量值的新列。

参数包括 新列名 (New Column Name) (new_column_name) 和 新列值 (New Column Value) (new_column_value)。

Search