DocPrompt代码实现与模型微调
admin
2024-05-14 02:11:16

数据预处理阶段

PaddleOCR

PP-Structure:这个库其实是用于版面分析的一个开源库,参见:github: Layout-Parser/layout-parserhttps://github.com/Layout-Parser/layout-parser

代码推理阶段

 Paddle-Inferencehttps://paddle-inference.readthedocs.io/en/master/index.html

采用create_predictor 方法创建Predictor-预测执行器

# 引用 paddle inference 预测库
import paddle.inference as paddle_infer# 创建 config
config = paddle_infer.Config("./mobilenet_v1.pdmodel", "./mobilenet_v1.pdiparams")# 根据 config 创建 predictor
predictor = paddle_infer.create_predictor(config)

对应的类 DocPromptTask,

参数下载地址:

URLS = {"docprompt": ["https://bj.bcebos.com/paddlenlp/taskflow/document_intelligence/docprompt/docprompt_params.tar","8eae8148981731f230b328076c5a08bf",],
}
#执行推理任务
self.predictor.run()#获取输入与输出特征向量
self.predictor = paddle.inference.create_predictor(self._config)
self.input_names = [name for name in self.predictor.get_input_names()]
self.input_handles = [self.predictor.get_input_handle(name) for name in self.predictor.get_input_names()]
self.output_handle = [self.predictor.get_output_handle(name) for name in self.predictor.get_output_names()]

DocPrompt模型微调(基于ERNIE-Layout的文档视觉问答)

基于多语言跨模态布局增强的文档智能大模型ERNIE-Layout(ernie-layoutx-base-uncased),通过paddlenlp.transformers提供的阅读理解模型AutoModelForQuestionAnswering构建文档视觉问答模型。

 model = AutoModelForQuestionAnswering.from_pretrained(model_args.model_name_or_path, num_classes=num_labels)

同时可以基于ERNIE-Layout做“文档信息抽取任务”、“文档视觉问答任务”、“文档图像分类任务”,具体代码:http://PaddleNLP/README_ch.md%20at%20develop%20%C2%B7%20PaddlePaddle/PaddleNLP%20%C2%B7%20GitHub

基于预训练模型ERNIE 3.0 的阅读理解任务 icon-default.png?t=MBR7https://aistudio.baidu.com/aistudio/projectdetail/4944851

相关内容

热门资讯

穿越天山遇见四季童话:新疆深度... 穿越天山遇见四季童话:新疆深度旅行指南与秘境故事 序章:一封来自西域的情书 每年六月,当伊犁河谷的薰...
从戈壁到花海:一位新疆本地向导... 从戈壁到花海:一位新疆本地向导的四季旅行手记 在新疆生活了近二十年,我依然记得第一次被这片土地震撼的...
穿越军 - 穿越中国亲子挑战赛... 以前总带孩子去各地旅游,打卡景点、吃美食,回来之后孩子除了照片,什么都没留下,直到带他参加穿越军亲子...
2026最新山东旅行社综合实力... 随着 2026 年旅游市场持续升温,山东凭借 "一山一水一圣人" 的独特魅力和丰富的文旅资源,成为国...
二十年,再赴大熊山 人间忽晚,山河已秋。一别大熊山,已是整整二十载。 那时我匆匆登临,步履轻快,眼里只有山川壮阔、林木葱...