AIGC融合RPA会议讨论

AIGC融合RPA会议讨论纪要

结合实例

RPA+信息提取(图像分割与识别)

RPA+ 智能决策(客户情绪分类->自动发送问题问卷)

AI平台 -> 上传自定义数据集进行训练 -> 封装成RPA组件 -> 在RPA中调用

RPA + CV实体信息抽取(例如各种报表图片的数据格式化,OCR)

RPA + 智能屏幕语言理解技术(告别拖拉拽,基于ISSUT技术,识别用户的操作,猜测用户的行为,执行推荐算法,例如直接点选用)

公司落地实践案例

自动弹幕发送

chatGPT 输入prompt -> chatgpt自动生成一段文本 -> 触发RPA自动执行,文本自动发送

自动生成图像、视频、总结、音频

前言研究

AIGC+RPA :基于SAM(segment anything model)的融合拾取技术

​ 鼠标点到图像的摸一个部分 -> prompt -> SAM encoder -> decoder -> 分割出图像 -> RPA自动截取

基于Chatgpt的智能文档审阅技术(Chat-IDP)

​ 读取文档 -> 输入一些校验语句(例如,金额大小写是否一致) -> chat-IDP 语义理解-> RPA校验

基于AIGC的RPA流程自动生成

​ 用户输入需求 -> AIGC 生成需求步骤 -> 组装RPA 组件 -> 生成完整RPA流程工程

部署方式

SAAS: 例如chatgpt web版

胖客户端:带CV识别功能类的应用

使用ChartGPT进行总结

RPA+AI是一种结合了机器人流程自动化(RPA)和人工智能(AI)的技术,可以实现各种复杂的业务场景,提高效率和质量。1

  • RPA+信息提取(图像分割与识别):利用AI平台上传自定义数据集进行训练,封装成RPA组件,在RPA中调用,实现对图像中的目标进行分割和识别。
  • RPA+智能决策(客户情绪分类->自动发送问题问卷):利用AI平台对客户的语音或文本进行情绪分析,根据结果触发RPA发送相应的问题问卷,收集反馈。
  • RPA+CV实体信息抽取(例如各种报表图片的数据格式化,OCR):利用AI平台对报表图片进行OCR识别,提取出文本信息,转换成结构化数据,存储或处理。
  • RPA+智能屏幕语言理解技术(告别拖拉拽,基于ISSUT技术,识别用户的操作,猜测用户的行为,执行推荐算法,例如直接点选用):利用AI平台对用户在屏幕上的操作进行语义理解,根据用户的意图和上下文,推荐最合适的RPA动作,简化流程设计。

公司落地实践案例:

  • 自动弹幕发送:利用chatGPT输入prompt,生成一段文本,触发RPA自动执行,文本自动发送到弹幕平台。
  • 自动生成图像、视频、总结、音频:利用AI平台提供的各种生成模型,输入prompt或参数,生成所需的内容,触发RPA自动保存或分享。
  • 基于SAM(segment anything model)的融合拾取技术:利用AI平台提供的SAM模型,输入prompt或鼠标点选图像中的某个部分,实现图像分割和截取。
  • 基于Chatgpt的智能文档审阅技术(Chat-IDP) :利用AI平台提供的Chat-IDP模型,输入一些校验语句(例如,金额大小写是否一致),对文档进行语义理解和校验。
  • 基于AIGC的RPA流程自动生成:利用AI训练平台提供的AIGC模型,输入用户需求,生成需求步骤和RPA组件,组装成完整的RPA流程工程。

部署方式:

  • SAAS: 例如chatgpt web版,通过网页访问AI平台提供的服务和接口。
  • 胖客户端:带CV识别功能类的应用,需要在本地安装RPA软件和AI平台客户端。