PDF Data Extractor(PDF數(shù)據(jù)提取軟件)是一款非常不錯的PDF數(shù)據(jù)提取軟件,用戶能夠使用這款軟件對pdf文件的文本信息進行提取,在軟件中用戶能夠設置信息提取規(guī)則,可自定義信息提取范圍,并且支持對文字進行過濾處理等。
PDF Data Extractor 可以提取 PDF 中的某些文本信息,如果您有例如需要提取帳號、姓名、地址等數(shù)據(jù)并將這些信息輸出到 Excel CSV 文件的 PDF 語句,這是一個理想的產(chǎn)品。它使用水平、垂直文本位置匹配,對于更高級的匹配,它具有用于條件匹配的規(guī)則系統(tǒng),例如僅當帳號:文本在同一頁面上時才匹配。不同的字段也可以合并為一個,因此可以將名字和姓氏作為一個字段輸出到 CSV 文件中。許多選項可用:數(shù)據(jù)提取、OCR pdf 選項、OCR 數(shù)字校正、調整傾斜的 pdf 頁面選項、對其他語言文件的完整 Uni code 支持,例如希伯來語,從右到左閱讀順序選項,頁面上的單詞偏移,用于處理切碎的掃描 PDF,數(shù)字、日期和貨幣過濾,數(shù)據(jù)列順序分配,在命令行上運行,標題輸出,頁碼字段,文件名字段, 批處理文件列表,32 位和 64 位版本。
現(xiàn)在還可以根據(jù)提取的數(shù)據(jù)重命名文件或將文件復制到新位置。
支持 Windows XP、2003、2008、2012、2016、2019、Windows 7、Vista、8 和 Windows 10
32 位和 64 位版本用于更快的處理
對所有語言的 Uni code 支持,例如文件名和文本中的英語、日語、中文、希伯來語
子彈從多頁pdf中提取數(shù)據(jù)
來自源pdf的多個輸出字段,通過文本之前,位置,第一次匹配和最后一次匹配向下和向上匹配選項。
bullet 條件匹配規(guī)則系統(tǒng)
項目符號輸出字段,例如:總頁數(shù)、匹配的頁碼、文件名
項目符號列輸出位置選項
子彈 OCR pdf 第一個選項
項目符號日期/金錢/字母/數(shù)字輸出過濾
項目符號 將文本復制到剪貼板選項以放入其他軟件
用于處理掃描的 pdf 文件的偏移位置開始,例如標題被切斷或傾斜,因此可以從某個穩(wěn)定的文本點計算所有位置
項目符號修復略微傾斜的掃描位置的垂直文本選項四舍五入到最接近的 5 點
用于向后鏡像掃描的項目符號反向文本選項
對希伯來語等語言的從右到左單詞選項支持
使用批處理列表處理處理 pdf 的批處理列表
可選在命令行上運行以實現(xiàn)自動化
根據(jù)提取的數(shù)據(jù)將文件重命名或復制到新位置
項目符號 支持除加密和保護之外的所有 pdf 類型。
項目符號 自動保存設置以備后用
項目符號 完整記錄已處理、錯誤和移動的文件。
子彈安裝程序
完整的 HTML 和 PDF 幫助
直觀的圖形界面,帶有大量工具
該應用程序的安裝時間并不長,并且沒有復雜的設置,您在實際使用它的功能之前就需要完成該設置。它具有一個真正直觀的圖形界面,并帶有大量工具和功能。
該應用程序允許您從PDF文檔中提取某些文本信息。例如,如果您有一個PDF語句,您需要提取諸如帳號,名稱,地址之類的數(shù)據(jù)并將此信息輸出到Excel csv文件中,則它將是一個有用的程序。
從PDF文檔中提取文本
啟動應用程序后,您需要做的第一件事是瀏覽計算機并找到您要處理的PDF文檔。然后,您必須選擇頁碼,應用程序將在記事本中顯示文本,以便您可以提取它。
它使用水平,垂直文本位置匹配,并且對于更高級的匹配,它具有用于條件匹配的規(guī)則系統(tǒng)。
更多功能和工具
您可以根據(jù)提取的數(shù)據(jù)將文件重命名或復制到新位置。它帶有更多選項,例如數(shù)據(jù)提取,在命令行上運行,標頭輸出,頁碼字段,文件名字段,要處理的文件批處理列表等等。
總而言之,PDF Data Extractor是一個非常不錯的應用程序,您可以使用它來從各種PDF文檔中提取文本。
1.修復掃描ocr問題。
2. 修復了在一行和批處理中全部輸出的問題,現(xiàn)在每個文件后都會自動添加換行符。
3. 對每個文件和位置一行處理的一些改進。
4. 修復潛在的換行問題。
騰訊視頻官方版 | 45.34MB
愛奇藝視頻官方正式版 | 35.10MB
暴風影音最新版下載 | 50.3MB
QQ音樂官方正式版 | 24.2MB
酷狗音樂2022下載 | 37MB