合合信息技术能力

体验中心网址：

https://www.textin.com/TextIn体验中心 - 在线免费体验中心https://www.textin.com/

合合技术团队CSDN：

合合技术团队的博客_CSDN博客-基于深度学习的文本检测与识别技术白皮书,【通用文本信息抽取技术白皮书】,【技术应用】领域博主

下文记录部分服务的使用感受及技术方案推断

通用文字识别

https://www.textin.com/experience/text_recognize_3d1

TextIn - API中心 - 通用文字识别

接受多种语言、360度方向、竖排、手写、手写和印刷判断、字符候选集、字符中心点

通用表格识别

TextIn - 在线免费体验中心 - 通用表格识别

TextIn - API中心 - 通用表格识别

非表格区域可自动分块，或组成一个非表格区域、每行高度宽度、线段坐标、无边框or实线

可以处理不同换行方式的大表格，列位置有优先和其他区域强行对齐的意思

推断：肯定开发了对线段的分割

“基于分治思想，合合信息引入深度学习技术，将表格识别分为有线表识别和无线表识别两种方案。有线表识别中，合合信息利用语义分割、角点回归等技术方案还原有线表，在财报相关表格识别测试中，有线表识别单元格结构准确率高于98%。

合合信息无线表识别采用序列模型、规则匹配等方案，通过自研模型直接预测表格的逻辑结构，再得到表格的物理结构，在保证表格区域内容的完整性的同时，检测准确率较传统方法显著提升。”

印章检测识别

TextIn - 在线免费体验中心 - 印章检测识别

https://www.textin.com/document/recognize_stamp

支持识别颜色、形状、内容、抠印章整体图片、展平

推断：下文介绍了检测+矫正+识别、端到端检测识别、img2seq 三种方案【技术新趋势】合合信息：复杂环境下ocr与印章识别技术理解及研发趋势_印章文字识别_合合技术团队的博客-CSDN博客

通用NLP信息抽取

没demo，只有文档。支持多页、用户自定义keys

推断：用k-v对做的？

办公文档识别

https://www.textin.com/experience/document

TextIn - API中心 - 办公文档识别

版面分析

paragraph(段落)

list(列表)

edge(页眉页脚)

image(图像)

stamp(印章)

formula(公式)

watermark(水印)

table(有线表格)

borderless_table(无线表格)

文档图像切边矫正

TextIn - 在线免费体验中心 - 文档图像切边矫正

可在没有纸张边缘的情况下进行矫正，不是简单透视变换，把纸张文字拉直了，有局部的处理，用一张网络上的清单实测很强

测试网图

http://img.zol.com.cn/group/107/a1069086.jpg

方案：

“以弯曲矫正为例，丁凯博士介绍了基于文本行线拟合和坐标变换、基于文本行线优化矫正的方法原理和优缺点，并提到合合信息采用的基于位移场网络学习的方法的系统架构”

Marior去除边距和迭代内容矫正用于自然文档矫正_合合技术团队的博客-CSDN博客

智能文字识别技术-弯曲矫正概述_document image dewarping using deep learning_合合技术团队的博客-CSDN博客

是一种编解码的网络学习位移场

智能图像处理：基于边缘去除和迭代式内容矫正的复杂文档图像校正_合合技术团队的博客-CSDN博客

角点检测+边缘均分初步矫正+迭代式偏移场预测，迭代次数自适应确定

图片切边增强

https://www.textin.com/experience/crop_enhance_image

判断照片中主体文档的边缘进行切边，同时增强图像突出文字，支持识别背景复杂的文字内容，返回切边后的图像。

增强模式

1 增亮

2 增亮并锐化

3 黑白

4 灰度

5 去阴影增强

6 点阵图

-1 禁用增强。

推断：边缘检测+透视变换+图像增强，这里压缩率默认95，可能也是cv2方法的直接使用

PS检测

TextIn - 在线免费体验中心 - PS检测

TextIn - API中心 - PS检测

主要针对证件、发票、合同，返回疑似篡改的坐标、置信度及exitif信息。检测出复制粘贴、拼接、擦除等多种篡改形式

方案：【论文解读】不和谐区域定位_合合技术团队的博客-CSDN博客

“不和谐问题主要是由于图像编辑技术产生的颜色和照明不一致。在本研究中，作者倾向于将输入的图像转换到另一个颜色空间，以放大不和谐区域与背景之间的域差异，从而使模型更容易地识别不和谐区域。为此，作者提出了一种由一个颜色映射模块和一个不和谐的区域定位网络组成的新框架，其中前者配备了一种新的域差异放大损失，后者可以是一个任意的定位网络
”

前端提示文案是可疑字段