识别
评价
视图
编辑
布局
下载
信息
向前翻
向后翻
页面:
/
-
+
发现
0
/
0
布局元素
Add Region:
Order
Toggle Dropdown
Order
Exclude
Add Data Table
Delete
Delete Region/Table
Set Overlap Rules
Majority
Left
Word
Line
当前布局
应用到页面
-
Apply
字体
默认
Sans
Serif
Carlito
Century
Courier
Garamond
Palatino
Times
Nimbus Sans
-
+
风格
斜体
粗体
大写
上标
添加/删除文字
删除
删除文字
识别
识别文字
切换下拉菜单
识别区域
手工添加文字
基线
调整基线
基线校正
选项
智能引号
连字
字符间距
导入字体
文本识别
速度
质量
语言
语言: 中文
Models
引擎:
组合
Tesseract LSTM
Tesseract Legacy
LSTM + Legacy 组合
构建:
Scribe
Scribe Tesseract
Vanilla Tesseract
参数
划分:
自动
自动
单列
附加参数
选项
Upscale Images
Update Conf Only
加泰罗尼亚语
简体中文
丹麦语
荷兰语
英文
芬兰语
法语
德语
意大利语
波兰语
葡萄牙语
西班牙语
俄罗斯语
乌克兰语
瑞典语
识别文本
激活OCR数据
无
上传 OCR 数据
名称
上载
评价
设定基本事实
评估选项
忽略标点符号
忽略大写
忽略多余单词
公制
Page
Doc
词错误率
总字数
正确的单词
Low Conf
不正确的单词
High Conf
遗漏的单词
额外的单词
载入文件
显示模式
校对模式(图像+彩色文本)
OCR模式(图像+不可见文本)
电子书模式(无图像+黑色文本)
图像颜色深度
颜色
灰度
二进制
选择
自动旋转图片
优化字体
展示
显示词汇轮廓
显示行线
显示段落轮廓
不透明度
不透明度
叠加不透明度
文件名称
下载
选项
类型:
格式:
PDF
PDF
HOCR
Text
Docx
Xlsx [Tables]
页面: 全部
-
PDF选项
规范页面大小
添加文本以导入PDF
文本选项
回流文本
Docx Options
回流文本
Xlsx选项
添加文件名列
添加页码列
正在生成文件
查看代码
查看文档
可选功能
文本识别
高级识别选项
准确性评估
编辑布局
提取表格
高级选项
信心阈值
高
中
PDF文本
用作主要数据
用作补充数据
渲染时省略
可视化调试
启用滚动视图
显示滚动视图图例
隐藏页面
滚动视图可视化:
不
调试输出
将所选单词打印到控制台
OCR对象
画布对象
下载调试输出
原始图像
画布
PDF源文件
调试CSV
静态视觉
PDF字体
其他
评估线
打印坐标
调试选项
可读 PDF 输出
中间 PDF 输出
生成 单词 比较
显示 单词 比较
启用 初始 优化字体
显示 中间OCR识别版本
从PDF中 提取字体
加载文件中……
图片上传工具
在虚线区域内拖放入文件
或者
选择文件上传
需要帮助? 请查看
手册
.
本工具由开源项目
scribeocr
,
scribe.js
,
scribe-ui
提供代码,长城小站汉化、调试、部署于2025年2月3日。供长城志愿者开展长城相关文献、知识库整理使用。