超越GPT-4o及Qwen2.5-VL，百度超輕量模型PP-OCRv5 Blog持續登頂Hugging Face熱度第一

本文作者： Nemo

2025-09-19 17:55

導語：最新信息顯示，飛槳團隊發布的技術Blog已連續一周登頂Hugging Face博客熱度榜首，受到開發者社區的廣泛關注。

近日，百度在海外官方賬號介紹了最新輕量級文字識別模型 PP-OCRv5。該模型僅0.07B參數，以千分之一參數量實現與700億參數大模型相媲美的OCR精度。在多項 OCR 場景測試中，PP-OCRv5 的表現超越GPT-4o、Qwen2.5-VL-72B等通用視覺大模型。最新信息顯示，飛槳團隊發布的技術Blog已連續一周登頂Hugging Face博客熱度榜首，受到開發者社區的廣泛關注。

據了解，2025年5月，飛槳團隊推出PaddleOCR 3.0版本，文字識別方案PP-OCRv5與通用文檔解析方案PP-StructureV3，以及原生支持文心大模型4.5的智能文檔理解方案PP-ChatOCRv4共同構成其三大特色能力。自2020年開源以來，PaddleOCR累計下載量突破900萬，被超過5.9k開源項目直接或間接使用，是GitHub 社區中唯一一個 Star數超過50k的中國OCR項目。

超越GPT-4o及Qwen2.5-VL，百度超輕量模型PP-OCRv5 Blog持續登頂Hugging Face熱度第一

9月18日晚，Paddle OCR項目登上了GitHub全球總榜 trending榜，位于python榜第5，總榜第13。

超越GPT-4o及Qwen2.5-VL，百度超輕量模型PP-OCRv5 Blog持續登頂Hugging Face熱度第一

Blog指出，在OCR場景中，通用視覺大模型（VLM）在精確文本定位和邊框精度上仍面臨挑戰，同時容易帶來高計算開銷和“幻覺”輸出。相較于VLM，PP-OCRv5采用了模塊化雙階段檢測與識別方案，能夠實現輕量高效推理與更精準的文本邊界框輸出。

Benchmark數據顯示，PP-OCRv5在 Printed Chinese、Printed English、Handwritten English 等核心任務上與百億級大模型 Qwen2.5-VL-72B 精度持平甚至更優；在Handwritten Chinese、Chinese Pinyin等復雜場景中，仍穩居前列，表現出強泛化能力。

超越GPT-4o及Qwen2.5-VL，百度超輕量模型PP-OCRv5 Blog持續登頂Hugging Face熱度第一

?作為百度飛槳團隊推出的全場景文字識別模型，PP-OCRv5是業界首個單模型支持5 種文字類型的超輕量級（<100M）開源模型，且支持復雜手寫體識別，可廣泛應用于教育行業的試卷作業批改、醫療行業的病歷數字化、法律行業的合同筆錄數字化等多場景業務需求。

雷峰網版權文章，未經授權禁止轉載。詳情見轉載須知。

0人收藏

Nemo

編輯

發私信

當月熱門文章