跳到主要内容

批量运行 (Batch Run)

批量运行 (Batch Run) 组件对 DataFrame一个文本列的每一行 运行语言模型,然后返回一个新的 DataFrame,其中包含原始文本和 LLM 响应。 输出包含以下列:

  • text_input:来自输入 DataFrame 的原始文本
  • model_response:每个输入的模型响应
  • batch_indexDataFrame 中所有行的从 0 开始的顺序索引
  • metadata (可选):关于处理过程的额外信息

在流中使用批量运行组件

如果您将 批量运行 的输出传递给 解析器 (Parser) 组件,您可以在解析模板中使用变量来引用这些键,例如 {text_input}{model_response}。 以下示例演示了这一点。

连接到 OpenAI 和解析器的批量运行组件

  1. 将任何语言模型组件连接到 批量运行 组件的 语言模型 (Language model) 端口。

  2. 将来自其他组件的 DataFrame 输出连接到 批量运行 组件的 DataFrame 输入。 例如,您可以连接一个带有 CSV 文件的 读取文件 (Read File) 组件。

  3. 批量运行 组件的 列名 (Column Name) 字段中,输入传入 DataFrame 中包含要处理文本的列名。 例如,如果您想从 CSV 文件的 name 列提取文本,请在 列名 字段中输入 name

  4. 批量运行 组件的 批量结果 (Batch Results) 输出连接到 解析器 (Parser) 组件的 DataFrame 输入。

  5. 可选:在 批量运行 组件的页眉菜单 中,点击 控制 (Controls),启用 系统消息 (System Message) 参数,点击 关闭,然后输入关于您希望 LLM 如何处理从文件中提取的每个单元格的指令。 例如,为每个名字创建一张名片。

  6. 解析器 (Parser) 组件的 模板 (Template) 字段中,输入用于处理 批量运行 组件的新 DataFrame 列(text_inputmodel_responsebatch_index)的模板:

    例如,此模板使用了批量处理后的结果 DataFrame 中的三个列:


    _10
    记录编号: {batch_index}, 姓名: {text_input}, 摘要: {model_response}

  7. 要测试处理过程,点击 解析器 (Parser) 组件,点击 运行组件 (Run component),然后点击 检查输出 (Inspect output) 以查看最终的 DataFrame

    如果您想在 游乐场 (Playground) 中查看输出,还可以将 聊天输出 (Chat Output) 组件连接到 解析器 (Parser) 组件。

参数

名称类型描述
modelHandleInput输入参数。连接来自语言模型组件的“语言模型”输出。必填。
system_messageMultilineInput输入参数。针对 DataFrame 中所有行的多行系统指令。
dfDataFrameInput输入参数。其列被视为文本消息的 DataFrame,由“column_name”指定。必填。
column_nameMessageTextInput输入参数。要视为文本消息 of the DataFrame 列的名称。如果为空,所有列都将格式化为 TOML。
output_column_nameMessageTextInput输入参数。存储模型响应的列的名称。默认值为 model_response
enable_metadataBoolInput输入参数。如果为 True,则向输出 DataFrame 添加元数据。
batch_resultsDataFrame输出参数。包含所有原始列以及模型响应列的 DataFrame。
Search