AI 代理如何加速开发人员的工作:数据自动化和知识管理

你好! red_mad_robot 团队的 NDT 已与您联系。我们告诉您我们如何为俄罗斯最大的开发商之一 FGC 集团公司创建一个包含两个 AI 代理的智能平台。该系统实现了数据处理的自动化,并显著减轻了技术支持和商业部门员工的负担。

两个 AI 代理用于不同的任务

FGC 在与交易对手合作和知识管理方面实施了 GenAI,以优化内部流程。现在,AI 代理在单个数据库中收集所有住宅小区的数据,帮助管理人员和支持人员更快地回答客户和承包商的问题。

主要任务之一是防止可能导致声誉和财务风险的错误(幻觉)。例如,客户问:“这套公寓有全景窗户吗?”,AI 代理回答错误,这影响了购买决定。为了避免这种情况,我们实施了一个带有两个 AI 代理的智能平台:

  1. 对于客户 :帮助回答常见问题,减轻技术支持团队的负担。
  2. 面向 员工 :优化内部文档搜索,方便员工访问企业知识库。

预期效果:将支持团队和商业部门的负担减轻 30-40%。

AI 代理如何处理数据

FGC 为我们提供了用于训练模型的文档:带有说明和常见问题解答的 PDF。为了让 AI 代理能够准确地回答问题,必须正确构建数据。

为此,使用了分块——将文本划分为语义片段。在这个项目中,我们使用 了 “滑动窗口” 方法,其中一个片段中的部分数据落入下一个片段。这种方法使我们能够保留上下文并提高答案的准确性。

标记数据后,使用 RAGAS 对代理进行测试,RAGAS 是一种检查模型准确性、识别错误并帮助系统提高知识的工具。

RAG 是智能平台的关键技术

检索增强生成 (RAG) 不仅允许 AI 模型生成响应,还可以在生成结果之前从数据库中提取相关数据。这大大提高了系统的准确性。

运作方式:

  1. 检索 是信息的搜索和检索。
  2. Augmented — 使用找到的数据增强用户的查询。
  3. Generation ― 考虑到收到的信息生成响应。

RAGAS 的工作原理

RAGAS 的工作原理

文档管理服务

文档管理服务是智能平台的关键组成部分。AI 代理处理不同格式(PDF、DOCX、MD)的文档,识别结构,识别关键实体(名称、日期、事件)并将它们转换为矢量表示,从而简化数据搜索和分析。

此外,该系统还能:

  • 为文档编制索引以加快搜索和存储速度。
  • 自动对信息进行分类以便于访问。
  • 它使用 结构化输出 ,您不仅可以获得文本答案,还可以获得给定格式的数据。

用于数据标记的 AI 代理交互图

用于数据标记的 AI 代理交互图

结构化输出不仅允许您接收来自系统的响应,还可以设置其格式,从而简化数据标记。AI 代理会自动分析数千个文档,并在几个小时内将它们转换为所需的结构,无需手动处理。

结构化输出示例

结构化输出示例

如何自动进行数据解析

第一阶段是数据提取。如果数据加载混乱且未检查其结构,则可能会丢失一些信息。因此,AI 代理首先分析文档,突出显示重要元素,并在必要时对其进行规范化。例如,它可以:

  • 将日期转换为单一格式。
  • 识别和补充有关公司和人员的信息。
  • 使用上下文数据扩充文本。

接下来,将数据转换为矢量格式,这样系统就可以快速找到您需要的信息。矢量化模型的选择直接影响搜索的准确性。

提取后,数据被转换为矢量表示,以便 AI 代理可以对其进行分析并找到相关信息。RAG 中搜索的准确性在很大程度上取决于选择将文本转换为神经网络可理解的数字格式的矢量化模型。之后,数据会经历额外的处理阶段,以改进其结构和分析的准确性。

首先,将文本数据转换为嵌入,嵌入是用于分析的向量表示。然后,进行聚类,根据向量特征对数据进行分组,帮助识别隐藏模式并提高搜索准确性。

文本矢量化的工作原理

文本矢量化的工作原理

知识库管理服务

知识库管理服务负责使用 AI 代理对数据进行分类、构建和分析,使您能够有效地应用 RAG,而无需大量资源成本。

运作方式:

  1. 分类和结构化 – 数据被分组到主题域中,从而更容易、更准确地查找信息。
  2. 内容分析和生成 — AI 代理处理大量数据、识别模式并根据这些数据形成相关内容。
  3. 交互式交互 – 聊天界面允许用户获得即时答案、建议和问题帮助。

简化的智能知识库结构

简化的智能知识库结构

基于 RAGAS 构建分析

RAGAS 框架有助于评估模型的准确性并提高响应质量。该系统无需花费数周时间进行手动检查,而是自动分析错误并提出调整建议。

该过程如下所示:

  1. 系统测试 AI 代理 并识别弱点。
  2. 根据错误,形成 改进模型的建议。
  3. 校正后,进行重新测试 ,直到精度达到所需的水平。

这就是我们如何设法减少花在数据处理和内容生成上的时间,而我们花在了改进数据集上。多亏了 RAGAS,AI 代理通过高精度地处理不同类型的数据(文本、PDF、表格)来调整他们的答案。

“在处理数据时,最宝贵的是时间。我们的平台展示了 AI 代理如何在几个小时内完成过去需要数周的任务。内置的 RAGAS 测试系统保证了结果的质量。我们自动化的不是单个作,而是使用企业知识的整个流程。

Alexey Zhdanov,red_mad_robot 无损检测产品官。

结果

在短短一个月的时间里,我们开发并实施了一个 AI 代理系统,该系统可以自动化数据处理并改善公司的知识管理。结果:

  • 由于请求处理的自动化, 支持和商业部门的负担减少了 30-40%。
  • 客户可以获得准确的答案,没有错误 ,从而提高了服务水平。
  • 得益于响应质量控制系统, FGC 在没有声誉风险的情况下实施了 AI

本案例表明,AI 助手不仅仅是一种技术趋势,而是提高业务效率的真正工具。


材料经过处理

文字:Valera Kovalsky, Alexei Zhdanov, Nikita Belov

编辑:Igor Reshetnikov

插图:Petya Galitsky


这是一个博客 red_mad_robot。我们推出数字业务并帮助公司实施 AI。在这里,我们的开发团队使用他们自己的案例来谈论当今 AI 正在发生的事情,而战略分析师则提出了明天会发生什么。我们会订阅。

我们的电报频道(那里的一切都不同,也有事件公告): t.me/redmadnews

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇