使用运行PowerGUI的Powershell &。我有一个需要搜索的PDF文件,以便查找是否在特定页面的内容中引用了附件。或者,或者我需要搜索图像,例如文档中的Microsoft Word或Excel图标或PDF图标。Powershell - 解析文件或图像的PDF文件
我使用下面的代码在页面阅读:
Add-Type -Path "c:\itextsharp-all-5.4.5\itextsharp-dll-core\itextsharp.dll"
$reader = New-Object iTextSharp.text.pdf.pdfreader -ArgumentList "c:\files\searchfile.pdf"
for ($page = 1; $page -le 3; $page++) {
$lines = [char[]]$reader.GetPageContent($page) -join "" -split "`n"
foreach ($line in $lines) {
if ($line -match "^\[") {
$line = $line -replace "\\([\S])", $matches[1]
$line -replace "^\[\(|\)\]TJ$", "" -split "\)\-?\d+\.?\d*\(" -join ""
}
}
}
然而,上面给出了文本的几个位,但大多是不可打印的字符。
如何使用Powershell搜索文本(如“.doc”或“.xlsx”)来搜索PDF文件?是否可以搜索PDF图像(如Excel或Word图标)?
联系客服