Tio Boot DocsTio Boot Docs
Home
  • java-db
  • api-table
  • jooq
  • mysql
  • postgresql
  • oceanbase
  • Enjoy
  • Tio Boot Admin
  • LLM
  • voice-agent
  • knowlege_base
  • ai_agent
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
Home
  • java-db
  • api-table
  • jooq
  • mysql
  • postgresql
  • oceanbase
  • Enjoy
  • Tio Boot Admin
  • LLM
  • voice-agent
  • knowlege_base
  • ai_agent
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
  • 01_tio-boot 简介

    • 01_tio-boot 简介
    • tio-boot:新一代高性能 Java Web 开发框架
    • tio-boot 入门示例
    • Tio-Boot 配置 : 现代化的配置方案
    • tio-boot 整合 Logback
    • tio-boot 整合 hotswap-classloader 实现热加载
    • 自行编译 tio-boot
    • 最新版本
    • 开发规范
  • 02_部署

    • 02_部署
    • 使用 Maven Profile 实现分环境打包 tio-boot 项目
    • Maven 项目配置详解:依赖与 Profiles 配置
    • tio-boot 打包成 FatJar
    • 使用 GraalVM 构建 tio-boot Native 程序
    • 使用 Docker 部署 tio-boot
    • 部署到 Fly.io
    • 部署到 AWS Lambda
    • 到阿里云云函数
    • 使用 Deploy 工具部署
    • 使用Systemctl启动项目
    • 使用 Jenkins 部署 Tio-Boot 项目
    • 使用 Nginx 反向代理 Tio-Boot
    • 使用 Supervisor 管理 Java 应用
    • 已过时
    • 胖包与瘦包的打包与部署
  • 03_配置

    • 03_配置
    • 配置参数
    • 服务器监听器
    • 内置缓存系统 AbsCache
    • 使用 Redis 作为内部 Cache
    • 静态文件处理器
    • 基于域名的静态资源隔离
    • DecodeExceptionHandler
    • 开启虚拟线程(Virtual Thread)
    • 框架级错误通知
  • 04_原理

    • 04_原理
    • 生命周期
    • 请求处理流程
    • 重要的类
  • 05_json

    • 05_json
    • Json
    • 接受 JSON 和响应 JSON
    • 响应实体类
  • 06_web

    • 06_web
    • 概述
    • 接收请求参数
    • 接收日期参数
    • 接收数组参数
    • 返回字符串
    • 返回文本数据
    • 返回网页
    • 请求和响应字节
    • 文件上传
    • 文件下载
    • 返回视频文件并支持断点续传
    • http Session
    • Cookie
    • 重定向和转发
    • HttpRequest
    • HttpResponse
    • Resps
    • RespBodyVo
    • Controller拦截器
    • 请求拦截器
    • LoggingInterceptor
    • 全局异常处理器
    • 异步处理
    • 动态 返回 CSS 实现
    • 返回图片
    • 跨域
    • 添加 Controller
    • Transfer-Encoding: chunked 实时音频播放
    • Server-Sent Events (SSE)
    • handler入门
    • 返回 multipart
    • 待定
    • 自定义 Handler 转发请求
    • 使用 HttpForwardHandler 转发所有请求
    • 常用工具类
    • HTTP Basic 认证
    • Http响应加密
    • 使用零拷贝发送大文件
    • 分片上传
    • 接口访问统计
    • 接口请求和响应数据记录
    • WebJars
    • JProtobuf
    • 测速
    • Gzip Bomb:使用压缩炸弹防御恶意爬虫
  • 07_validate

    • 07_validate
    • 数据紧校验规范
    • 参数校验
  • 08_websocket

    • 08_websocket
    • 使用 tio-boot 搭建 WebSocket 服务
    • WebSocket 聊天室项目示例
  • 09_java-db

    • 09_java-db
    • Db 工具类
    • java‑db
    • 操作数据库入门示例
    • SQL 模板 (SqlTemplates)
    • 数据源配置与使用
    • ActiveRecord
    • Db 工具类
    • 批量操作
    • Model
    • Model生成器
    • 注解
    • 异常处理
    • 数据库事务处理
    • Cache 缓存
    • Dialect 多数据库支持
    • 表关联操作
    • 复合主键
    • Oracle 支持
    • Enjoy SQL 模板
    • 整合 Enjoy 模板最佳实践
    • 多数据源支持
    • 独立使用 ActiveRecord
    • 调用存储过程
    • java-db 整合 Guava 的 Striped 锁优化
    • 生成 SQL
    • 通过实体类操作数据库
    • java-db 读写分离
    • Spring Boot 整合 Java-DB
    • like 查询
    • 常用操作示例
    • Druid 监控集成指南
    • SQL 统计
  • 10_api-table

    • 10_api-table
    • ApiTable 概述
    • 使用 ApiTable 连接 SQLite
    • 使用 ApiTable 连接 Mysql
    • 使用 ApiTable 连接 Postgres
    • 使用 ApiTable 连接 TDEngine
    • 使用 api-table 连接 oracle
    • 使用 api-table 连接 mysql and tdengine 多数据源
    • EasyExcel 导出
    • EasyExcel 导入
    • 预留
    • 预留
    • ApiTable 实现增删改查
    • 数组类型
    • 单独使用 ApiTable
    • TQL(Table SQL)前端输入规范
  • 11_aop

    • 11_aop
    • JFinal-aop
    • Aop 工具类
    • 配置
    • 独立使用 JFinal Aop
    • @AImport
    • 自定义注解拦截器
    • 原理解析
  • 12_cache

    • 12_cache
    • Caffine
    • Jedis-redis
    • hutool RedisDS
    • Redisson
    • Caffeine and redis
    • CacheUtils 工具类
    • 使用 CacheUtils 整合 caffeine 和 redis 实现的两级缓存
    • 使用 java-db 整合 ehcache
    • 使用 java-db 整合 redis
    • Java DB Redis 相关 Api
    • redis 使用示例
    • 和 RedisTemplate 协作
  • 13_认证和权限

    • 13_认证
    • FixedTokenInterceptor
    • TokenManager
    • 数据表
    • 匿名登录
    • 注册和登录
    • 个人中心
    • 重置密码
    • Google 登录
    • 短信登录
    • 移动端微信登录
    • 移动端重置密码
    • 微信登录
    • 移动端微信登录
    • 权限校验注解
    • Sa-Token
    • sa-token 登录注册
    • StpUtil.isLogin() 源码解析
  • 14_i18n

    • 14_i18n
    • i18n
  • 15_enjoy

    • 15_enjoy
    • tio-boot 整合 Enjoy 模版引擎文档
    • Tio-Boot 整合 Java-DB 与 Enjoy 模板引擎示例
    • 引擎配置
    • 表达式
    • 指令
    • 注释
    • 原样输出
    • Shared Method 扩展
    • Shared Object 扩展
    • Extension Method 扩展
    • Spring boot 整合
    • 独立使用 Enjoy
    • tio-boot enjoy 自定义指令 localeDate
    • PromptEngine
    • Enjoy 入门示例-擎渲染大模型请求体
    • Tio Boot + Enjoy:分页与 SEO 实战指南
    • TioBoot + Enjoy 生成 robots.txt 与 sitemap.xml:实战与SEO指南
    • Enjoy 使用示例
  • 16_定时任务

    • 16_定时任务
    • Quartz 定时任务集成指南
    • 分布式定时任务 xxl-jb
    • cron4j 使用指南
  • 17_tests

    • 17_tests
    • TioBootTest 类
  • 18_tio

    • 18_tio
    • TioBootServer
    • 独立端口启动 TCP 服务器
    • 内置 TCP 处理器
    • 独立启动 UDPServer
    • 使用内置 UDPServer
    • t-io 消息处理流程
    • tio-运行原理详解
    • TioConfig
    • ChannelContext
    • Tio 工具类
    • 业务数据绑定
    • 业务数据解绑
    • 发送数据
    • 关闭连接
    • Packet
    • 监控: 心跳
    • 监控: 客户端的流量数据
    • 监控: 单条 TCP 连接的流量数据
    • 监控: 端口的流量数据
    • 单条通道统计: ChannelStat
    • 所有通道统计: GroupStat
    • 资源共享
    • 成员排序
    • SSL
    • DecodeRunnable
    • 使用 AsynchronousSocketChannel 响应数据
    • 拉黑 IP
    • 深入解析 Tio 源码:构建高性能 Java 网络应用
    • Https建立连接过程
  • 19_aio

    • 19_aio
    • ByteBuffer
    • AIO HTTP 服务器
    • 自定义和线程池和池化 ByteBuffer
    • AioHttpServer 应用示例 IP 属地查询
    • 手写 AIO Http 服务器
    • Java 21 中的虚拟线程与 AIO
  • 20_netty

    • 20_netty
    • Netty TCP Server
    • Netty Web Socket Server
    • 使用 protoc 生成 Java 包文件
    • Netty WebSocket Server 二进制数据传输
    • Netty 组件详解
  • 21_netty-boot

    • 21_netty-boot
    • Netty-Boot
    • 原理解析
    • 整合 Hot Reload
    • 整合 数据库
    • 整合 Redis
    • 整合 Elasticsearch
    • 整合 Dubbo
    • Listener
    • 文件上传
    • 拦截器
    • Spring Boot 整合 Netty-Boot
    • SSL 配置指南
    • ChannelInitializer
    • Reserve
  • 22_MQ

    • 22_MQ
    • Mica-mqtt
    • EMQX
    • Disruptor
    • kafaka
    • AWS MSK
  • 23_tio-utils

    • 23_tio-utils
    • tio-utils
    • EnvUtils 配置工具
    • Notification
    • Email
    • JSON
    • File
    • Base64
    • 上传和下载
    • Http
    • Telegram
    • RsaUtils
    • HttpUtils
    • ByteBufferUtils
    • 系统监控
    • 线程
    • 虚拟线程
    • 毫秒并发 ID (MCID) 生成方案
  • 24_tio-http-server

    • 24_tio-http-server
    • 使用 Tio-Http-Server 搭建简单的 HTTP 服务
    • tio-boot 添加 HttpRequestHandler
    • 在 Android 上使用 tio-boot 运行 HTTP 服务
    • tio-http-server-native
    • handler 常用操作
    • /zh/24_tio-http-server/06.html
  • 25_tio-websocket

    • 25_tio-websocket
    • WebSocket 服务器
    • WebSocket Client
    • TCP数据转发
  • 26_tio-im

    • 26_tio-im
    • 通讯协议文档
    • ChatPacket.proto 文档
    • java protobuf
    • 数据表设计
    • 创建工程
    • 登录
    • 历史消息
    • 发消息
  • 27_mybatis

    • 27_mybatis
    • Tio-Boot 整合 MyBatis
    • 使用配置类方式整合 MyBatis
    • 整合数据源
    • 使用 mybatis-plus 整合 tdengine
    • 整合 mybatis-plus
  • 28_mongodb

    • 28_mongodb
    • tio-boot 使用 mongo-java-driver 操作 mongodb
  • 29_elastic-search

    • 29_elastic-search
    • Elasticsearch
    • JavaDB 整合 ElasticSearch
    • Elastic 工具类使用指南
    • Elastic-search 注意事项
    • ES 课程示例文档
  • 30_magic-script

    • 30_magic-script
    • tio-boot 与 magic-script 集成指南
  • 31_groovy

    • 31_groovy
    • tio-boot 整合 Groovy
    • 调试常用脚本
  • 32_firebase

    • 32_firebase
    • 整合 google firebase
    • Firebase Storage
    • Firebase Authentication
    • 使用 Firebase Admin SDK 进行匿名用户管理与自定义状态标记
    • 导出用户
    • 登录注册
    • 注册回调
  • 34_spider

    • 34_spider
    • jsoup
    • 爬取 z-lib.io 数据
    • 整合 WebMagic
    • WebMagic 示例:爬取学校课程数据
    • Playwright
    • Flexmark (Markdown 处理器)
    • tio-boot 整合 Playwright
    • 缓存网页数据
  • 36_integration_thirty_party

    • 36_integration_thirty_party
    • 整合 okhttp
    • 整合 GrpahQL
    • 集成 Mailjet
    • 整合 ip2region
    • 整合 GeoLite 离线库
    • 整合 Lark 机器人指南
    • 集成 Lark Mail 实现邮件发送
    • Thymeleaf
    • Swagger
    • Clerk 验证
    • 集成datadog
  • 37_dubbo

    • 37_dubbo
    • 概述
    • dubbo 2.6.0
    • dubbo 2.6.0 调用过程
    • dubbo 3.2.0
  • 38_spring

    • 38_spring
    • Spring Boot Web 整合 Tio Boot
    • spring-boot-starter-webflux 整合 tio-boot
    • tio-boot 整合 spring-boot-starter
    • Tio Boot 整合 Spring Boot Starter db
    • Tio Boot 整合 Spring Boot Starter Data Redis 指南
  • 39_spring-cloud

    • 39_spring-cloud
    • tio-boot spring-cloud
  • 40_quarkus

    • 40_quarkus
    • Quarkus(无 HTTP)整合 tio-boot(有 HTTP)
    • tio-boot + Quarkus + Hibernate ORM Panache
    • tio-boot + Quarkus + Hibernate ORM Panache + jOOQ 整合方案
  • 41_postgresql

    • 41_postgresql
    • PostgreSQL 安装
    • PostgreSQL 主键自增
    • PostgreSQL 日期类型
    • Postgresql 金融类型
    • PostgreSQL 数组类型
    • 索引
    • PostgreSQL 查询优化
    • 获取字段类型
    • PostgreSQL 全文检索
    • PostgreSQL 向量
    • PostgreSQL 优化向量查询
    • PostgreSQL 其他
  • 42_mysql

    • 42_mysql
    • 使用 Docker 运行 MySQL
    • 常见问题
  • 43_oceanbase

    • 43_oceanbase
    • 快速体验 OceanBase 社区版
    • 快速上手 OceanBase 数据库单机部署与管理
    • 诊断集群性能
    • 优化 SQL 性能指南
    • 待定
  • 49_jooq

    • 49_jooq
    • 使用配置类方式整合 jOOQ
    • tio-boot + jOOQ 事务管理
    • 批量操作与性能优化
    • 整合agroal
    • 代码生成与类型安全
    • 基于 Record / POJO 增删改查
    • UPSERT、批量更新、返回主键与高级 SQL
    • 的多表关联查询、DTO 投影、聚合统计与视图封装
    • 的窗口函数、CTE、JSON 查询与 PostgreSQL 高级 SQL 实战
    • tio-boot + jOOQ 的审计字段、乐观锁、数据权限与企业级 Repository 设计
    • 测试策略、SQL 日志、性能诊断与生产排障
    • 多租户、读写分离与多数据源设计
    • 代码生成治理、数据库迁移与团队协作规范实战
  • 50_media

    • 50_media
    • JAVE 提取视频中的声音
    • Jave 提取视频中的图片
    • 待定
  • 51_asr

    • 51_asr
    • Whisper-JNI
  • 52_tts

    • 52_tts
  • 53_ocr

    • 53_ocr
  • 54_native-media

    • 54_native-media
    • java-native-media
    • JNI 入门示例
    • mp3 拆分
    • mp4 转 mp3
    • 使用 libmp3lame 实现高质量 MP3 编码
    • Linux 编译
    • macOS 编译
    • 从 JAR 包中加载本地库文件
    • 支持的音频和视频格式
    • 任意格式转为 mp3
    • 通用格式转换
    • 通用格式拆分
    • 视频合并
    • VideoToHLS
    • split_video_to_hls 支持其他语言
    • 持久化 HLS 会话
    • 获取视频长度
    • 保存视频的最后一帧
    • 添加水印
    • linux版本
  • 55_cv

    • 55_cv
    • 使用 Java 运行 YOLOv8 ONNX 模型进行目标检测
    • tio-boot整合yolo
    • ONNX Runtime 推理说明
    • Paddle Structure
    • tio-boot 整合 Paddle Structure
    • Paddle Structure 提取图片
  • 58_telegram4j

    • 58_telegram4j
    • 数据库设计
    • 基于 HTTP 协议开发 Telegram 翻译机器人
    • 基于 MTProto 协议开发 Telegram 翻译机器人
    • 过滤旧消息
    • 保存机器人消息
    • 定时推送
    • 增加命令菜单
    • 使用 telegram-Client
    • 使用自定义 StoreLayout
    • 延迟测试
    • Reactor 错误处理
    • Telegram4J 常见错误处理指南
    • 处理回调查询
    • Reactor
    • 文档翻译
    • 使用 Tio-Boot 整合 tdlight
    • tio-boot 整合 TelegramBots
    • tio-boot 整合 Telegram-Bot-Utils
    • Telegram-Bot-Utils 使用指南
  • 59_telegram-bots

    • 59_telegram-bots
    • TelegramBots 入门指南
    • 使用工具库 telegram-bot-base 开发翻译机器人
  • 60_LLM

    • 60_LLM
    • 简介
    • 流式生成
    • 图片多模态输入
    • Google Gemini接入
    • google Vertex AI 接入
    • 请求记录
    • 限流和错误处理
    • 增强检索(RAG)
    • 结构化数据检索
    • AI 问答
    • 连接代码执行器
    • 待定
    • 模型编程能力评测
    • /zh/60_LLM/17.html
  • 61_voice-agent

    • 61_voice-agent
    • 整合Gemini realtime模型
    • Voice Agent 前端接入接口文档
    • 整合千问realtime模型
    • 打断支持
    • 主动介入
    • eleven labs
    • 基于 tio-boot + ElevenLabs 构建实时语音 Agent(支持打断与主动介入)
  • 63_knowlege_base

    • 63_knowlege_base
    • 学术论文
    • 数据库设计
    • 用户登录实现
    • 模型管理
    • 知识库管理
    • 文档拆分
    • 片段向量
    • 命中测试
    • 文档管理
    • 片段管理
    • 问题管理
    • 应用管理
    • 向量检索
    • 推理问答
    • 问答模块
    • 统计分析
    • 用户管理
    • api 管理
    • 存储文件到 S3
    • 文档解析优化
    • 片段汇总
    • 段落分块与检索
    • 多文档解析
    • 对话日志
    • 检索性能优化
    • Milvus
    • 文档解析方案和费用对比
    • 离线运行向量模型
    • 爬取网页数据
  • 64_ai_agent

    • 64_ai_agent
    • 数据库设计
    • 示例问题管理
    • 会话管理
    • 历史记录
    • Perplexity API
    • 意图识别
    • 智能问答
    • 文件上传与解析文档
    • 翻译
    • 名人搜索功能实现
    • Ai studio gemini youbue 问答使用说明
    • 自建 YouTube 字幕问答系统
    • 自建 获取 youtube 字幕服务
    • 使用 OpenAI ASR 实现语音识别接口(Java 后端示例)
    • 定向搜索
    • 16
    • 17
    • 18
    • 在 tio-boot 应用中整合 ai-agent
    • 接口文档
    • 自定义 ChatAskService
  • 65_ai-search

    • 65_ai-search
    • ai-search 项目简介
    • ai-search 数据库文档
    • ai-search SearxNG 搜索引擎
    • ai-search Jina Reader API
    • ai-search Jina Search API
    • ai-search 搜索、重排与读取内容
    • ai-search PDF 文件处理
    • ai-search 推理问答
    • Google Custom Search JSON API
    • ai-search 意图识别
    • ai-search 问题重写
    • ai-search 系统 API 接口 WebSocket 版本
    • ai-search 搜索代码实现 WebSocket 版本
    • ai-search 生成建议问
    • ai-search 生成问题标题
    • ai-search 历史记录
    • Discover API
    • 翻译
    • Tavily Search API 文档
    • 对接 Tavily Search
    • 火山引擎 DeepSeek
    • 对接 火山引擎 DeepSeek
    • ai-search 搜索代码实现 SSE 版本
    • jar 包部署
    • Docker 部署
    • 爬取一个静态网站的所有数据
    • 网页数据预处理
    • 网页数据检索与问答流程整合
  • 66_ai-coding

    • 66_ai-coding
    • Cline 提示词
    • Cline 提示词-中文版本
  • 67_java-uni-ai-server

    • 67_java-uni-ai-server
    • 语音合成系统
    • Fish.audio TTS 接口说明文档与 Java 客户端封装
    • 整合 fishaudio 到 java-uni-ai-server 项目
    • 待定
  • 68_java-llm-proxy

    • 68_java-llm-proxy
    • 使用tio-boot搭建多模型LLM代理服务
  • 69_java-kit-server

    • 69_java-kit-server
    • Java 执行 python 代码
    • 通过大模型执行 Python 代码
    • 执行 Python (Manim) 代码
    • 待定
    • 待定
    • 待定
    • 视频下载增加水印说明文档
  • 70_ai-brower

    • 70_ai-brower
    • AI Browser:基于用户指令的浏览器自动化系统
    • 提示词
    • dom构建- buildDomTree.js
    • dom构建- 将网页可点击元素提取与可视化
    • 提取网内容
    • 启动浏览器
    • 操作浏览器指令
  • 71_tio-boot-admin

    • 71_tio-boot-admin
    • 入门指南
    • 初始化数据
    • token 存储
    • 与前端集成
    • 文件上传
    • 网络请求
    • 单图片管理(只读模式)
    • 多图片管理
    • 布尔值管理
    • 字段联动
    • Word 管理
    • PDF 管理
    • 文章管理
    • 富文本编辑器
    • 整合 Enjoy 模版引擎
  • 72_文件存储

    • 72_文件存储
    • 文件上传数据表
    • 本地存储
    • 存储到 亚马逊 S3
    • 存储到 Cloudflare R2
    • 存储到 腾讯 COS
    • 存储到 阿里云 OSS
  • 73_tio-mail-wing

    • 73_tio-mail-wing
    • tio-mail-wing简介
    • 任务1:实现POP3系统
    • 使用 getmail 验证 tio-mail-wing POP3 服务
    • 任务2:实现 SMTP 服务
    • 数据库初始化文档
    • 用户管理
    • 邮件管理
    • 任务3:实现 SMTP 服务 数据库版本
    • 任务4:实现 POP3 服务(数据库版本)
    • IMAP 协议
    • 拉取多封邮件
    • 任务5:实现 IMAP 服务(数据库版本)
    • IMAP实现讲解
    • IMAP 手动测试脚本
    • IMAP 认证机制
    • 主动推送
    • namesapce
    • CONDSTORE and QRESYNC
  • 74_tio-mcp-server

    • 74_tio-mcp-server
    • 实现 MCP Server 开发指南
    • MCP 协议
    • /zh/74_tio-mcp-server/11.html
  • 75_tio-sip

    • 75_tio-sip
    • SIP Server 第一版原理说明
    • SIP Server 第一版实战
    • 一、Windows 平台测试
    • SIP Server 第二版实战
    • SIP Server 第三版实战
    • 性能优化
    • 基于 MediaProcessor 对接 Realtime 模型说明
    • 对接大语言模型
    • 支持 G722 宽带语音
    • G722编码和解码
    • 会话级采样率转换
    • 增加 9196 回声测试分机
    • 语音系统链路说明
    • 一、Gemini Realtime 的打断机制
  • 76_tio-log-server

    • 76_tio-log-server
    • 简介
    • 收集 docker 日志
    • 入库
  • 77_manim

    • 77_manim
    • Teach me anything - 基于大语言的知识点讲解视频生成系统
    • Manim 开发环境搭建
    • 生成场景提示词
    • 生成代码
    • 完整脚本示例
    • TTS服务端
    • 废弃
    • 废弃
    • 废弃
    • 使用 SSE 流式传输生成进度的实现文档
    • 整合全流程完整文档
    • HLS 动态推流技术文档
    • manim 分场景生成代码
    • 分场景运行代码及流式播放支持
    • 分场景业务端完整实现流程
    • Maiim布局管理器
    • 仅仅生成场景代码
    • 使用 modal 运行 manim 代码
    • Python 使用 Modal GPU 加速渲染
    • Modal 平台 GPU 环境下运行 Manim
    • Modal Manim OpenGL 安装与使用
    • 优化 GPU 加速
    • 生成视频封面流程
    • Java 调用 manim 命令 执行代码 生成封面
    • Manim 图像生成服务客户端文档
    • manim render help
    • 显示 中文公式
    • ManimGL(manimgl)
    • Manim 实战入门:用代码创造数学动画
    • 欢迎
  • 78_mainim_demos

    • 78_mainim_demos
    • 01
    • 02
    • 02
    • 02
    • Chemistry - Kjeldahl Method
    • Physics - Geometric Brownian Motion
    • Computer Science - Gradient Descent
    • Math - Properties of Kites
    • Math - Rational Zero Theorem
    • /zh/78_mainim_demos/10.html
    • /zh/78_mainim_demos/11.html
    • /zh/78_mainim_demos/12.html
    • /zh/78_mainim_demos/13.html
    • /zh/78_mainim_demos/14.html
    • generate a video from unit circle to cos
    • 什么是向量
    • 生成一个三角函数讲解视频
    • /zh/78_mainim_demos/18.html
    • 欧拉公式的几何意义
    • /zh/78_mainim_demos/20.html
    • PYPH 151 homework 1 Quesiton 1
    • PYPH 151 homework 1 Quesiton 2
    • PYPH 151 homework 1 Quesiton 1
    • PYPH 151 homework 1 Quesiton 1
    • PYPH 151 homework 1 Quesiton 1
    • PYPH 151 homework 1 Quesiton 1
    • PYPH 151 homework 1 Quesiton 1
    • PYPH 151 homework 1 Quesiton 1
    • PYPH 151 homework 1 Quesiton 1
    • PYPH 151 homework 1 Quesiton 1
  • 80_性能测试

    • 80_性能测试
    • 压力测试 - tio-http-serer
    • 压力测试 - tio-boot
    • 压力测试 - tio-boot-native
    • 压力测试 - netty-boot
    • 性能测试对比
    • TechEmpower FrameworkBenchmarks
    • 压力测试 - tio-boot 12 C 32G
    • HTTP/1.1 Pipelining 性能测试报告
    • tio-boot vs Quarkus 性能对比测试报告
  • 81_tio-boot

    • 81_tio-boot
    • 简介
    • Swagger 整合到 Tio-Boot 中的指南
    • 待定
    • 待定
    • 高性能网络编程中的 ByteBuffer 分配与回收策略
    • TioBootServerHandler 源码解析
  • 99_案例

    • 99_案例
    • 封装 IP 查询服务
    • tio-boot 案例 - 全局异常捕获与企业微信群通知
    • tio-boot 案例 - 文件上传和下载
    • tio-boot 案例 - 整合 ant design pro 增删改查
    • tio-boot 案例 - 流失响应
    • tio-boot 案例 - 增强检索
    • tio-boot 案例 - 整合 function call
    • tio-boot 案例 - 定时任务 监控 PostgreSQL、Redis 和 Elasticsearch
    • Tio-Boot 案例:使用 SQLite 整合到登录注册系统
    • tio-boot 案例 - 执行 shell 命令
    • /zh/99_%E6%A1%88%E4%BE%8B/11.html
    • /zh/99_%E6%A1%88%E4%BE%8B/12.html
    • /zh/99_%E6%A1%88%E4%BE%8B/13.html

Paddle Structure

一、背景与目标

下载模型 https://www.paddleocr.ai/latest/version3.x/pipeline_usage/PP-StructureV3.html#1-pp-structurev3

目标是将 PaddleOCR 中的文档布局分析模型:

PP-DocLayout_plus-L

从 Paddle 推理格式:

  • inference.pdiparams
  • inference.json
  • inference.yml

转换为:

  • ONNX 模型(用于 Java 推理)
  • 使用 ONNX Runtime 在 Java 中完成推理
  • 最终接入 tio-boot 提供 HTTP 服务

二、整体流程

完整链路如下:

Paddle模型
   ↓
Paddle2ONNX
   ↓
ONNX模型
   ↓
ONNX Runtime(Java)
   ↓
前处理(对齐 Paddle)
   ↓
推理
   ↓
后处理(boxes解析)
   ↓
HTTP服务(tio-boot)

三、模型转换(Paddle → ONNX)

1. 推荐方式

使用 paddlex 提供的转换能力:

conda create --name paddlex python=3.12
conda activate paddlex
# 先按官方说明装 dev/nightly paddle
python -m pip install --pre paddlepaddle -i https://www.paddlepaddle.org.cn/packages/nightly/cpu/

# 再装 PaddleX
python -m pip install paddlex

# 再装插件
paddlex --install paddle2onnx

这是 PaddleOCR 官方给 Windows 的推荐路径。

然后再转:

paddlex --paddle2onnx --paddle_model_dir PP-DocLayout_plus-L_infer --onnx_model_dir PP-DocLayout_plus-L_infer-onnx

2. 成功标志

  • 输出 inference.onnx
  • 自动复制 inference.yml
  • 日志包含 constant folding

inference.yml

mode: paddle
draw_threshold: 0.5
metric: COCO
use_dynamic_shape: false
Global:
  model_name: PP-DocLayout_plus-L
arch: DETR
min_subgraph_size: 3
Preprocess:
- interp: 2
  keep_ratio: false
  target_size:
  - 800
  - 800
  type: Resize
- mean:
  - 0.0
  - 0.0
  - 0.0
  norm_type: none
  std:
  - 1.0
  - 1.0
  - 1.0
  type: NormalizeImage
- type: Permute
label_list:
- paragraph_title
- image
- text
- number
- abstract
- content
- figure_title
- formula
- table
- reference
- doc_title
- footnote
- header
- algorithm
- footer
- seal
- chart
- formula_number
- aside_text
- reference_content
Hpi:
  backend_configs:
    paddle_infer:
      trt_dynamic_shapes: &id001
        im_shape:
        - - 1
          - 2
        - - 1
          - 2
        - - 8
          - 2
        image:
        - - 1
          - 3
          - 800
          - 800
        - - 1
          - 3
          - 800
          - 800
        - - 8
          - 3
          - 800
          - 800
        scale_factor:
        - - 1
          - 2
        - - 1
          - 2
        - - 8
          - 2
      trt_dynamic_shape_input_data:
        im_shape:
        - - 800
          - 800
        - - 800
          - 800
        - - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
          - 800
        scale_factor:
        - - 2
          - 2
        - - 1
          - 1
        - - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
          - 0.67
    tensorrt:
      dynamic_shapes: *id001

3. 关键参数

  • 默认使用 opset=16
  • 通常不需要手动指定

四、labels 获取方式

从:

inference.yml → label_list

读取

特点:

  • 顺序即 cls_id
  • 必须用于映射结果
package nexus.io.cv.paddle.utils;

import org.yaml.snakeyaml.Yaml;

import java.io.IOException;
import java.io.InputStream;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.ArrayList;
import java.util.LinkedHashMap;
import java.util.List;
import java.util.Map;
import java.util.stream.Collectors;

public class ModelLabelUtils {

  public static List<String> loadLabelsFromYaml(String yamlPath) throws IOException {
    Yaml yaml = new Yaml();
    try (InputStream in = Files.newInputStream(Paths.get(yamlPath))) {
      Map<String, Object> root = yaml.load(in);
      Object labelsObj = root.get("label_list");
      if (labelsObj instanceof List<?>) {
        return ((List<?>) labelsObj).stream().map(String::valueOf).collect(Collectors.toList());
      }
      return new ArrayList<>();
    }
  }

  public static List<String> loadLabels(Path yamlPath) throws IOException {
    if (!Files.exists(yamlPath)) {
      throw new IllegalArgumentException("inference.yml 不存在: " + yamlPath);
    }

    Yaml yaml = new Yaml();
    try (InputStream in = Files.newInputStream(yamlPath)) {
      Map<String, Object> root = yaml.load(in);
      if (root == null) {
        return new ArrayList<>();
      }

      Object labelsObj = root.get("label_list");
      if (labelsObj instanceof List<?>) {
        List<String> labels = new ArrayList<>();
        for (Object o : (List<?>) labelsObj) {
          labels.add(String.valueOf(o));
        }
        return labels;
      }

      return new ArrayList<>();
    }
  }

  public static Map<Integer, String> loadLabelMap(Path yamlPath) throws IOException {
    List<String> labels = loadLabels(yamlPath);
    Map<Integer, String> map = new LinkedHashMap<>();
    for (int i = 0; i < labels.size(); i++) {
      map.put(i, labels.get(i));
    }
    return map;
  }
}
package nexus.io.cv.paddle.utils;

import java.io.IOException;
import java.nio.file.Paths;
import java.util.Map;

import org.junit.Test;

import nexus.io.tio.utils.json.JsonUtils;

public class ModelLabelUtilsTest {

  @Test
  public void test() {
    String path = "F:\\code\\python\\python-study\\11_python_ai-study\\python-pp-structure-study\\PP-DocLayout_plus-L_infer-onnx\\inference.yml";
    try {
      Map<Integer, String> map = ModelLabelUtils.loadLabelMap(Paths.get(path));
      System.out.println(JsonUtils.toJson(map));
    } catch (IOException e) {
      e.printStackTrace();
    }
  }

}

output

{
    "0": "paragraph_title",
    "1": "image",
    "2": "text",
    "3": "number",
    "4": "abstract",
    "5": "content",
    "6": "figure_title",
    "7": "formula",
    "8": "table",
    "9": "reference",
    "10": "doc_title",
    "11": "footnote",
    "12": "header",
    "13": "algorithm",
    "14": "footer",
    "15": "seal",
    "16": "chart",
    "17": "formula_number",
    "18": "aside_text",
    "19": "reference_content"
}

五、推理


1、模型输入输出结构(核心)

1. 输入

该模型不是单输入,而是 三输入结构:

image         [N, 3, H, W]
im_shape      [N, 2]
scale_factor  [N, 2]

简要说明:

im_shape      = 输入给模型的图像尺寸(H, W)
scale_factor  = 原图 → 输入图 的缩放比例(scaleY, scaleX)

对应你代码:

im_shape = [800, 800];           // resize 后尺寸
scale_factor = [scaleY, scaleX]; // 缩放比例

作用:

让模型知道:
1. 当前图有多大(im_shape)
2. 是从原图怎么缩放来的(scale_factor)

模型不仅要看图,还要知道这张图是“怎么被缩放来的”

否则:

检测框坐标会错乱

2. 输出

fetch_name_0  → 检测框
fetch_name_1  → 每张图的框数量

2、最关键问题:前处理对齐 Paddle

这是整个项目最重要的坑点。

1. Paddle inference.yml 本质

关键配置:

NormalizeImage:
  is_scale: true
  mean: [0,0,0]
  std: [1,1,1]

2. 实际含义

不是“不处理”,而是:

必须做:像素 / 255

3. 如果不除 255 会发生什么?

你已经遇到:

  • boxes = []
  • 可视化无框
  • 模型看起来“正常运行但没结果”

本质是:

输入分布错了 → 模型置信度全崩

3、推理输出结构解析

1. fetch_name_0

二维数组:

[cls_id, score, x1, y1, x2, y2]

2. fetch_name_1

每张图的检测框数量

例如:

[3, 1, 4]

表示:

  • 第1张:3个框
  • 第2张:1个框
  • 第3张:4个框

3. 必须做的事情

用 cursor 按 batch 切分

否则:

多图结果混在一起 → 框位置错乱

3、结果验证

你最终结果已经与 Python 对齐:

Java:
score≈0.902

Python:
score≈0.900

说明:

推理完全正确

完整推理代码

package nexus.io.cv.paddle.demo;

import java.io.IOException;
import java.nio.FloatBuffer;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collections;
import java.util.HashMap;
import java.util.LinkedHashMap;
import java.util.List;
import java.util.Locale;
import java.util.Map;
import java.util.Random;
import java.util.TreeMap;

import org.opencv.core.Mat;
import org.opencv.core.Point;
import org.opencv.core.Scalar;
import org.opencv.core.Size;
import org.opencv.imgcodecs.Imgcodecs;
import org.opencv.imgproc.Imgproc;

import com.alibaba.fastjson2.JSON;
import com.alibaba.fastjson2.JSONWriter;

import ai.onnxruntime.OnnxTensor;
import ai.onnxruntime.OrtEnvironment;
import ai.onnxruntime.OrtException;
import ai.onnxruntime.OrtSession;
import nexus.io.cv.model.DetectionResult;
import nexus.io.cv.model.PreprocessResult;
import nexus.io.cv.model.ProcessResult;

public class PPDocLayoutOnnxDemo {

  private static final int INPUT_W = 800;
  private static final int INPUT_H = 800;

  /**
   * 该模型通常已经输出原图坐标
   */
  private static final boolean OUTPUT_ALREADY_ORIGINAL_COORDS = true;

  private static final boolean DEBUG_LOG = true;
  // ======================================

  // ================= 主流程:单张 =================

  public static ProcessResult processSingleImage(OrtEnvironment env, OrtSession session, Path imgPath,
      List<String> labels, float confThres) throws Exception {

    Mat bgr = Imgcodecs.imread(imgPath.toString());
    if (bgr.empty()) {
      throw new IllegalArgumentException("无法读取图片: " + imgPath);
    }

    Mat original = bgr.clone();
    PreprocessResult pre = null;

    try {
      pre = preprocess(env, bgr);
      List<DetectionResult> detections = infer(session, pre, labels, confThres);

      if (!OUTPUT_ALREADY_ORIGINAL_COORDS) {
        remapBoxesToOriginal(detections, pre.origW, pre.origH, pre.scaleX, pre.scaleY);
      } else {
        clampBoxes(detections, pre.origW, pre.origH);
      }

      ProcessResult result = new ProcessResult();
      result.imgPath = imgPath;
      result.originalImage = original;
      result.detections = detections;
      return result;

    } finally {
      if (pre != null) {
        closeQuietly(pre.imageTensor);
        closeQuietly(pre.imShapeTensor);
        closeQuietly(pre.scaleFactorTensor);
      }
      bgr.release();
    }
  }

  // ================= 前处理:单张 =================

  private static PreprocessResult preprocess(OrtEnvironment env, Mat bgr) throws OrtException {
    int origH = bgr.rows();
    int origW = bgr.cols();

    float scaleY = (float) INPUT_H / (float) origH;
    float scaleX = (float) INPUT_W / (float) origW;

    Mat resized = new Mat();
    Imgproc.resize(bgr, resized, new Size(INPUT_W, INPUT_H), 0, 0, Imgproc.INTER_LINEAR);

    Mat rgb = new Mat();
    Imgproc.cvtColor(resized, rgb, Imgproc.COLOR_BGR2RGB);

    float[] imageData = new float[3 * INPUT_H * INPUT_W];

    for (int y = 0; y < INPUT_H; y++) {
      for (int x = 0; x < INPUT_W; x++) {
        double[] px = rgb.get(y, x);
        imageData[0 * INPUT_H * INPUT_W + y * INPUT_W + x] = (float) px[0] / 255.0f;
        imageData[1 * INPUT_H * INPUT_W + y * INPUT_W + x] = (float) px[1] / 255.0f;
        imageData[2 * INPUT_H * INPUT_W + y * INPUT_W + x] = (float) px[2] / 255.0f;
      }
    }

    float[] imShapeData = new float[] { INPUT_H, INPUT_W };
    float[] scaleFactorData = new float[] { scaleY, scaleX };

    if (DEBUG_LOG) {
      System.out.printf(Locale.US, "preprocess file=%s orig=(%d,%d) scaleFactor=[%.6f, %.6f]%n", "single", origW, origH,
          scaleY, scaleX);
    }

    PreprocessResult r = new PreprocessResult();
    r.imageTensor = OnnxTensor.createTensor(env, FloatBuffer.wrap(imageData), new long[] { 1, 3, INPUT_H, INPUT_W });
    r.imShapeTensor = OnnxTensor.createTensor(env, FloatBuffer.wrap(imShapeData), new long[] { 1, 2 });
    r.scaleFactorTensor = OnnxTensor.createTensor(env, FloatBuffer.wrap(scaleFactorData), new long[] { 1, 2 });
    r.origW = origW;
    r.origH = origH;
    r.scaleX = scaleX;
    r.scaleY = scaleY;

    resized.release();
    rgb.release();

    return r;
  }

  // ================= 推理 + 后处理:单张 =================

  private static List<DetectionResult> infer(OrtSession session, PreprocessResult pre, List<String> labels,
      float confThres) throws OrtException {

    Map<String, OnnxTensor> inputs = new HashMap<>();
    inputs.put("image", pre.imageTensor);
    inputs.put("im_shape", pre.imShapeTensor);
    inputs.put("scale_factor", pre.scaleFactorTensor);

    try (OrtSession.Result outputs = session.run(inputs)) {
      Object out0 = outputs.get("fetch_name_0").orElseThrow().getValue();
      Object out1 = outputs.get("fetch_name_1").orElseThrow().getValue();

      if (DEBUG_LOG) {
        System.out.println("fetch_name_0 class = " + out0.getClass().getName());
        System.out.println("fetch_name_1 class = " + out1.getClass().getName());
      }

      float[][] boxes = as2DFloatArray(out0);
      int[] boxesNum = as1DIntArray(out1);

      if (boxes == null) {
        throw new IllegalStateException("fetch_name_0 不是预期二维数组");
      }

      if (DEBUG_LOG) {
        System.out
            .println("fetch_name_0 rows = " + boxes.length + ", cols = " + (boxes.length > 0 ? boxes[0].length : 0));
        System.out.println("fetch_name_1 = " + Arrays.toString(boxesNum));

        for (int i = 0; i < Math.min(10, boxes.length); i++) {
          System.out.println("row[" + i + "] = " + Arrays.toString(boxes[i]));
        }
      }

      List<DetectionResult> detections = new ArrayList<>();
      int validRows = (boxesNum != null && boxesNum.length > 0) ? boxesNum[0] : boxes.length;
      validRows = Math.min(validRows, boxes.length);

      for (int i = 0; i < validRows; i++) {
        DetectionResult d = parseDetectionRow(boxes[i], labels, confThres);
        if (d != null) {
          detections.add(d);
        }
      }

      return detections;
    }
  }

  private static DetectionResult parseDetectionRow(float[] row, List<String> labels, float confThres) {
    if (row == null || row.length < 6) {
      return null;
    }

    int clsId = Math.round(row[0]);
    float score = row[1];
    float x1 = row[2];
    float y1 = row[3];
    float x2 = row[4];
    float y2 = row[5];

    if (clsId < 0) {
      return null;
    }
    if (score < confThres) {
      return null;
    }
    if (x2 <= x1 || y2 <= y1) {
      return null;
    }

    String label = clsId < labels.size() ? labels.get(clsId) : ("class_" + clsId);

    DetectionResult d = new DetectionResult();
    d.clsId = clsId;
    d.label = label;
    d.confidence = score;
    d.bbox = new float[] { x1, y1, x2, y2 };
    return d;
  }

  // ================= 坐标处理 =================

  private static void remapBoxesToOriginal(List<DetectionResult> detections, int origW, int origH, float scaleX,
      float scaleY) {
    for (DetectionResult d : detections) {
      d.bbox[0] = clamp(d.bbox[0] / scaleX, 0, origW - 1);
      d.bbox[1] = clamp(d.bbox[1] / scaleY, 0, origH - 1);
      d.bbox[2] = clamp(d.bbox[2] / scaleX, 0, origW - 1);
      d.bbox[3] = clamp(d.bbox[3] / scaleY, 0, origH - 1);
    }
  }

  private static void clampBoxes(List<DetectionResult> detections, int origW, int origH) {
    for (DetectionResult d : detections) {
      d.bbox[0] = clamp(d.bbox[0], 0, origW - 1);
      d.bbox[1] = clamp(d.bbox[1], 0, origH - 1);
      d.bbox[2] = clamp(d.bbox[2], 0, origW - 1);
      d.bbox[3] = clamp(d.bbox[3], 0, origH - 1);
    }
  }

  // ================= 结果保存 =================
  public static void saveVisualized(Mat original, List<DetectionResult> detections, Path imgPath, String outDir) {
    Mat vis = original.clone();

    for (DetectionResult d : detections) {
      Scalar color = colorOfClass(d.clsId);
      Point p1 = new Point(d.bbox[0], d.bbox[1]);
      Point p2 = new Point(d.bbox[2], d.bbox[3]);

      Imgproc.rectangle(vis, p1, p2, color, 2);

      String text = d.label + " " + String.format(Locale.US, "%.2f", d.confidence);
      double textY = Math.max(15, d.bbox[1] - 5);
      Imgproc.putText(vis, text, new Point(d.bbox[0], textY), Imgproc.FONT_HERSHEY_SIMPLEX, 0.7, color, 2);
    }

    Path out = Paths.get(outDir, "vis", imgPath.getFileName().toString());
    Imgcodecs.imwrite(out.toString(), vis);
    vis.release();
    original.release();
  }

  public static void saveJson(List<DetectionResult> detections, Path imgPath, String outDir) throws IOException {
    List<Map<String, Object>> boxes = new ArrayList<>();
    for (DetectionResult d : detections) {
      Map<String, Object> m = new LinkedHashMap<>();
      m.put("cls_id", d.clsId);
      m.put("label", d.label);
      m.put("score", d.confidence);
      m.put("coordinate", Arrays.asList(d.bbox[0], d.bbox[1], d.bbox[2], d.bbox[3]));
      boxes.add(m);
    }

    Map<String, Object> res = new LinkedHashMap<>();
    res.put("input_path", imgPath.toString());
    res.put("page_index", null);
    res.put("boxes", boxes);

    Map<String, Object> root = new LinkedHashMap<>();
    root.put("res", res);
    root.put("debug_detection_count", detections.size());
    root.put("debug_saved_at", System.currentTimeMillis());

    Path out = Paths.get(outDir, "json", getStem(imgPath) + ".json");
    String json = JSON.toJSONString(root, JSONWriter.Feature.PrettyFormat);
    Files.writeString(out, json);
  }

  public static void saveYoloTxt(List<DetectionResult> detections, Path imgPath, String outDir) throws IOException {
    Mat img = Imgcodecs.imread(imgPath.toString());
    int w = img.cols();
    int h = img.rows();
    img.release();

    List<String> lines = new ArrayList<>();
    for (DetectionResult d : detections) {
      float x1 = clamp(d.bbox[0], 0, w);
      float y1 = clamp(d.bbox[1], 0, h);
      float x2 = clamp(d.bbox[2], 0, w);
      float y2 = clamp(d.bbox[3], 0, h);

      if (x2 <= x1 || y2 <= y1) {
        continue;
      }

      float cx = ((x1 + x2) / 2.0f) / w;
      float cy = ((y1 + y2) / 2.0f) / h;
      float bw = (x2 - x1) / w;
      float bh = (y2 - y1) / h;

      lines.add(String.format(Locale.US, "%d %.6f %.6f %.6f %.6f", d.clsId, cx, cy, bw, bh));
    }

    Path out = Paths.get(outDir, "labels", getStem(imgPath) + ".txt");
    Files.write(out, lines);
  }

  public static void saveClassesTxt(Map<Integer, String> classMap, Path out) throws IOException {
    if (classMap.isEmpty()) {
      Files.write(out, Collections.emptyList());
      return;
    }

    int maxId = classMap.keySet().stream().max(Integer::compareTo).orElse(0);
    List<String> lines = new ArrayList<>();
    for (int i = 0; i <= maxId; i++) {
      lines.add(classMap.getOrDefault(i, "class_" + i));
    }
    Files.write(out, lines);
  }

  public static Map<Integer, String> toClassMap(List<DetectionResult> detections) {
    Map<Integer, String> map = new TreeMap<>();
    for (DetectionResult d : detections) {
      map.put(d.clsId, d.label);
    }
    return map;
  }

  private static String getStem(Path p) {
    String name = p.getFileName().toString();
    int idx = name.lastIndexOf('.');
    return idx >= 0 ? name.substring(0, idx) : name;
  }

  private static float[][] as2DFloatArray(Object val) {
    if (val instanceof float[][]) {
      return (float[][]) val;
    }
    if (val instanceof float[][][]) {
      float[][][] arr = (float[][][]) val;
      return arr.length > 0 ? arr[0] : null;
    }
    return null;
  }

  private static int[] as1DIntArray(Object val) {
    if (val instanceof long[]) {
      long[] src = (long[]) val;
      int[] dst = new int[src.length];
      for (int i = 0; i < src.length; i++) {
        dst[i] = (int) src[i];
      }
      return dst;
    }
    if (val instanceof int[]) {
      return (int[]) val;
    }
    if (val instanceof float[]) {
      float[] src = (float[]) val;
      int[] dst = new int[src.length];
      for (int i = 0; i < src.length; i++) {
        dst[i] = Math.round(src[i]);
      }
      return dst;
    }
    if (val instanceof long[][]) {
      long[][] src = (long[][]) val;
      if (src.length == 0) {
        return new int[0];
      }
      int[] dst = new int[src[0].length];
      for (int i = 0; i < src[0].length; i++) {
        dst[i] = (int) src[0][i];
      }
      return dst;
    }
    if (val instanceof int[][]) {
      int[][] src = (int[][]) val;
      if (src.length == 0) {
        return new int[0];
      }
      return src[0];
    }
    if (val instanceof float[][]) {
      float[][] src = (float[][]) val;
      if (src.length == 0) {
        return new int[0];
      }
      int[] dst = new int[src[0].length];
      for (int i = 0; i < src[0].length; i++) {
        dst[i] = Math.round(src[0][i]);
      }
      return dst;
    }
    return null;
  }

  private static Scalar colorOfClass(int clsId) {
    Random random = new Random(clsId * 2027L + 17);
    return new Scalar(50 + random.nextInt(206), 50 + random.nextInt(206), 50 + random.nextInt(206));
  }

  private static float clamp(float v, float min, float max) {
    return Math.max(min, Math.min(max, v));
  }

  private static void closeQuietly(AutoCloseable c) {
    if (c != null) {
      try {
        c.close();
      } catch (Exception ignored) {
      }
    }
  }
}
package nexus.io.cv.paddle.demo;

import java.io.IOException;
import java.nio.file.DirectoryStream;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.Arrays;
import java.util.HashSet;
import java.util.List;
import java.util.Locale;
import java.util.Map;
import java.util.Set;

import org.junit.Test;

import ai.onnxruntime.OrtEnvironment;
import ai.onnxruntime.OrtSession;
import nexus.io.cv.model.DetectionResult;
import nexus.io.cv.model.ProcessResult;
import nexus.io.cv.paddle.utils.ModelLabelUtils;

public class PPDocLayoutOnnxDemoTest {

  Set<String> SUPPORTED_EXTS = new HashSet<>(Arrays.asList(".jpg", ".jpeg", ".png", ".bmp"));

  @Test
  public void test() throws Exception {

    nu.pattern.OpenCV.loadLocally();
    // ================= 配置 =================
    String MODEL_DIR = "F:\\code\\python\\python-study\\11_python_ai-study\\python-pp-structure-study\\PP-DocLayout_plus-L_infer-onnx";
    String MODEL_PATH = MODEL_DIR + "\\inference.onnx";
    String MODEL_YML = MODEL_DIR + "\\inference.yml";

    String INPUT_DIR = "F:\\code\\project\\project-videotutor\\mc-qa-cv\\mc-qa-cv-base\\upload";
    String OUTPUT_DIR = "F:\\code\\project\\project-videotutor\\mc-qa-cv\\mc-qa-cv-base\\output\\java\\single";

    float CONF_THRESHOLD = 0.35f;
    String DEBUG_FILE_NAME = "2027202380864421888.png";

    ensureDir(Paths.get(OUTPUT_DIR));
    ensureDir(Paths.get(OUTPUT_DIR, "vis"));
    ensureDir(Paths.get(OUTPUT_DIR, "json"));
    ensureDir(Paths.get(OUTPUT_DIR, "labels"));

    List<String> labels = ModelLabelUtils.loadLabelsFromYaml(MODEL_YML);
    System.out.println("labels count = " + labels.size());

    Path imgPath = resolveSingleImage(INPUT_DIR, DEBUG_FILE_NAME);
    if (imgPath == null) {
      System.out.println("没有可处理图片");
      return;
    }

    try (OrtEnvironment env = OrtEnvironment.getEnvironment();
        OrtSession.SessionOptions options = new OrtSession.SessionOptions();
        OrtSession session = env.createSession(MODEL_PATH, options)) {

      System.out.println("load ok");
      System.out.println("inputs: " + session.getInputInfo().keySet());
      System.out.println("outputs: " + session.getOutputInfo().keySet());

      ProcessResult result = PPDocLayoutOnnxDemo.processSingleImage(env, session, imgPath, labels, CONF_THRESHOLD);

      System.out.println("final detections size = " + result.detections.size());
      for (DetectionResult d : result.detections) {
        System.out.printf(Locale.US, "det: cls=%d label=%s score=%.6f box=[%.2f, %.2f, %.2f, %.2f]%n", d.clsId, d.label,
            d.confidence, d.bbox[0], d.bbox[1], d.bbox[2], d.bbox[3]);
      }

      PPDocLayoutOnnxDemo.saveVisualized(result.originalImage, result.detections, imgPath, OUTPUT_DIR);
      PPDocLayoutOnnxDemo.saveJson(result.detections, imgPath, OUTPUT_DIR);
      PPDocLayoutOnnxDemo.saveYoloTxt(result.detections, imgPath, OUTPUT_DIR);
      Map<Integer, String> classMap = PPDocLayoutOnnxDemo.toClassMap(result.detections);
      PPDocLayoutOnnxDemo.saveClassesTxt(classMap, Paths.get(OUTPUT_DIR, "classes.txt"));

      System.out.println();
      System.out.println("========== 处理完成 ==========");
      System.out.println("JSON目录:   " + Paths.get(OUTPUT_DIR, "json"));
      System.out.println("YOLO目录:   " + Paths.get(OUTPUT_DIR, "labels"));
      System.out.println("可视化目录: " + Paths.get(OUTPUT_DIR, "vis"));
    }
  }

  private Path resolveSingleImage(String inputDir, String fileName) throws IOException {
    Path root = Paths.get(inputDir);
    if (!Files.exists(root)) {
      throw new IllegalArgumentException("输入目录不存在: " + inputDir);
    }

    if (fileName != null && !fileName.trim().isEmpty()) {
      Path p = root.resolve(fileName);
      if (!Files.exists(p) || !Files.isRegularFile(p)) {
        throw new IllegalArgumentException("指定文件不存在: " + p);
      }
      String ext = getExtLower(p);
      if (!SUPPORTED_EXTS.contains(ext)) {
        throw new IllegalArgumentException("不支持的图片后缀: " + ext);
      }
      return p;
    }

    try (DirectoryStream<Path> stream = Files.newDirectoryStream(root)) {
      for (Path p : stream) {
        if (!Files.isRegularFile(p)) {
          continue;
        }
        String ext = getExtLower(p);
        if (SUPPORTED_EXTS.contains(ext)) {
          return p;
        }
      }
    }
    return null;
  }

  private static String getExtLower(Path p) {
    String name = p.getFileName().toString();
    int idx = name.lastIndexOf('.');
    return idx >= 0 ? name.substring(idx).toLowerCase(Locale.ROOT) : "";
  }

  private static void ensureDir(Path path) throws IOException {
    if (!Files.exists(path)) {
      Files.createDirectories(path);
    }
  }

}


常见错误

1、ONNX Runtime 版本坑

1. 常见报错

Unsupported model IR version: 10, max supported IR version: 9

2. 原因

  • ONNX 模型 IR version 较新
  • Java ONNX Runtime 版本过旧

3. 解决方案

升级 ONNX Runtime:

>= 1.19.x(推荐)

2、Windows DLL 初始化失败问题

1. 报错

UnsatisfiedLinkError: onnxruntime.dll 初始化失败

2. 根因

通常是:

  • VC++ 运行库缺失
  • CPU 指令集不兼容
  • 多版本冲突

3. 解决

升级 ONNX Runtime:

>= 1.19.x(推荐)
Edit this page
Last Updated: 4/11/26, 1:03 AM
Contributors: litongjava
Prev
ONNX Runtime 推理说明
Next
tio-boot 整合 Paddle Structure