Screen PDF

桌面版半自动图片矫正、压缩、OCR 叠层与 PDF 导出工具。

本仓库已经按“程序 / 模型 / 研究资产 / 文档”拆分，目标是让运行时、训练试验和文档沉淀分层清晰，便于持续迭代和代理协作。

program/desktop: Tauri + Vite 桌面程序源码。
program/engine: Python 检测、OCR、导出、训练与评估代码。
- runtime: 运行时主链路
- training: 训练与调参
- eval: 评估与回归
data: 原始数据、清洗数据、拆分数据、派生任务数据与 benchmark。
training: 训练配置、runs、checkpoint、报告与模型注册。
models/runtime: 当前运行时使用的模型。
research/experiments: 历史训练、评估、实验产物和大体量资料。
docs: 架构说明、执行计划、当前状态、代理协作入口。

兼容入口：

docs/plans 是到 research/experiments 的兼容链接，旧脚本仍可继续访问原有实验目录。

快速开始

1. 前端和桌面壳

cd /Users/gcssloop/WorkSpace/AIGC/screen-pdf/program/desktop
pnpm install
pnpm tauri dev

2. Python 引擎

cd /Users/gcssloop/WorkSpace/AIGC/screen-pdf
PYTHONPATH=program/engine python program/engine/detect_frame.py --help

3. 运行时模型

默认从下面目录读取：

/Users/gcssloop/WorkSpace/AIGC/screen-pdf/models/runtime

也可以通过环境变量覆盖：

export SCREEN_PDF_MODEL_DIR=/absolute/path/to/models/runtime

当前运行时链路

global coarse 先给出全局四边形。
roi refine 在粗框基础上收紧 ROI。
local corner refine 在 ROI 结果上做四角精修。
OCR、压缩、PDF 导出在导出链路中执行。

当前建议的运行时组合：

coarse/global：r3
local corner refine：当前保留候选 v28

说明：

r3 负责把轮廓先找对。
v28 只适合作为局部角点精修候选，不应单独主导全局结果。

关键指标

当前必须持续盯住的目标：

平均点位偏差 < 0.5%
四点全部 < 1% 命中率 > 80%
单张识别耗时 < 500 ms

详见：

阅读顺序

说明

这次迁移默认保留源码、运行时模型、训练与实验资料。
构建缓存未迁入新仓库，例如 node_modules、dist、src-tauri/target、__pycache__。
旧仓库仍保留，便于校验和回滚；后续确认无误后再清理。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Screen PDF

目录

快速开始

1. 前端和桌面壳

2. Python 引擎

3. 运行时模型

当前运行时链路

关键指标

阅读顺序

说明

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
data		data
docs		docs
models		models
program		program
research		research
training		training
.gitignore		.gitignore
AGENTS.md		AGENTS.md
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

Screen PDF

目录

快速开始

1. 前端和桌面壳

2. Python 引擎

3. 运行时模型

当前运行时链路

关键指标

阅读顺序

说明

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages