如何在GPU上并行化PDF到HTML的转换

How to Parallelize PDF to HTML conversion on GPU?

本文关键字:HTML 转换 PDF 并行化 GPU      更新时间:2023-10-16

我想并行化PDF到HTML的转换。不是在文件级别,而是在页面级别或对象级别。对于并行化来说,这是一个明智的选择吗?如果是这样的话,怎么做呢?与CPU中的速度相比,GPU中的速度是否可观??

我最简单的答案是——这可能不可行。

基本上——这里最重要的分类是问题是任务并行还是数据并行。粗略地说,第一个是指几个线程或多或少独立地处理自己的任务的问题。第二个问题是指许多线程都在做相同的事情,但在数据的不同部分。后者是GPU擅长的问题:它们有很多核心,所有核心都做同样的事情,但对输入数据的不同部分进行操作。

下一个问题是移动数据。

GPU编程是一门艺术,要把它做好可能非常具有挑战性。

所以问题是——你能并行化格式转换吗?我以前做过一些转换,几乎没有一个可以用于并行处理。