ব্যাচ রূপান্তর পিডিএফ এর অনুসন্ধানযোগ্য পিডিএফ এর রূপান্তর


3

আমি হাজার হাজার পিডিএফ এর অনুসন্ধানযোগ্য পিডিএফ এর রূপান্তর করার উপায় খুঁজছি। আমি Nuance এর সাথে আসা "পিডিএফ তৈরি সহকারী" নামক একটি প্রোগ্রাম ব্যবহার করেছি ecopy সফটওয়্যার. তবে, আপনি একটি ফোল্ডার নির্বাচন করতে পারবেন না, আপনাকে প্রতিটি সাব ফোল্ডারে যেতে হবে, রূপান্তর করতে ফাইলগুলি নির্বাচন করুন এবং তারপরে পরবর্তী ফোল্ডারে যান।

পিডিএফ এর একটি বৃহৎ সংখ্যা রূপান্তরযোগ্য পিডিএফ এর রূপান্তর করার আরেকটি উপায় কী?

কোন পরামর্শ ছিল না। অবশ্যই পিডিএফ এর (?) রূপান্তর ব্যাচ করার একটি উপায় হতে হবে।


আমি সাইটে একটি ব্যবহারকারী গাইড খুঁজে পাচ্ছি না। আপনি কমান্ড লাইন থেকে ecopy ব্যবহার করতে পারেন, অথবা আপনি একটি GUI ব্যবহার করতে হবে? আপনি যদি কমান্ড লাইন থেকে এটি কল করতে পারেন তবে আপনি সহজেই একটি স্ক্রিপ্ট তৈরি করতে পারেন যা আপনার সমস্ত নথির মাধ্যমে ট্র্যাক্স করে এবং প্রতিটিকে রূপান্তর করার জন্য অ্যাপ্লিকেশনটিকে কল করে।

আপনি GUI ব্যবহার করতে হবে। অন্তত, আমি কমান্ড লাইন থেকে এটি কল করার একটি উপায় খুঁজে পাওয়া যায় নি। কেউ যদি কমান্ড লাইন থেকে এটি ব্যবহার করতে জানে, আমাকে জানাতে। ধন্যবাদ!

কোথাও একটি ecopy ব্যবহারকারী ম্যানুয়াল বা অন্যান্য প্রযুক্তিগত তথ্য আছে? কমান্ড লাইন কার্যকারিতা, যদি এটি বিদ্যমান, সম্ভবত সেখানে বর্ণনা করা হবে। যদি আপনি আমাকে একটি পয়েন্টার দিতে পারেন, আমি একটি চেহারা নিতে হবে।

আমি খুঁজে পেয়েছি যে না।

উত্তর:


2

বিআইএন ফোল্ডারে CPYCONVERTER.EXE ফাইলটি একটি কমান্ড লাইন হিসাবে ব্যবহার করুন (ওয়াইককার্ডগুলি eCopy Ver.9-paperworks সমর্থিত) এটি 8.5 ইকপি ডেস্কটপের জন্য।

Command Line Cpy Converter Version 8.5 (Build 0.116)
 Copyright c 1992 - 2004. All rights reserved.

 Converts CPY to CPY, CPY to TIF or TIF to CPY

Usage:
 cpyconverter.exe [-?] -S=<source path> -D=<dest path> [-P] [-E] [-Q] [-B] [-O]
[-T3/T4/TC/C/U]

Note:
 Wildcards are not supported.  Full paths must be used for source and destinatio
n

Switches:
--------------------
-?                      : This menu
-Q                      : Turn off logging.
-P                      : Converter pauses after conversion.
-E                      : Converter pauses if there is an error.
-B                      : Converter burns-in Blackout/Whiteout markups (if appli
cable).
-O                      : Converter OCRs document and creates searchable text (i
f applicable).
-S="<SOURCE PATH>"      : The path of the file to convert.
-D="<DESTINATION PATH>" : The path of the newly converted file.
-P=<PASSWORD>           : Password for encrypting and decrypting documents.
--------------------
 * If the source document is encrypted CPY converter will attempt to decrypt it
to the destination document with the supplied password.
 * If the source document is not encrypted CPY converter will attempt to encrypt
 the destination document using the supplied password.
 * Please note you cannot encrypt/decrypt tif documents.

-<Conversion Type>      : The type of conversion to be done(T3, T4, TC, C, U)
--------------------
* T4 - Convert CPY to TIF Group4
* T3 - Convert CPY to TIF Group3
* C  - Convert TIF(Any group) to CPY
* U  - Convert CPY to CPY

Ex.1 cpyconverter.exe -S="C:\My Dir\test.tif" -D="C:\My Dir\test.cpy" -C
Convert Tiff to cpy

Ex.2 cpyconverter.exe -S="C:\My Dir\test.cpy" -D="C:\My Dir\test.tif" -T3
Convert Cpy to Tif Group 3

Ex.3 cpyconverter.exe -S="C:\My Dir\test.cpy" -D="C:\My Dir\test.tif" -T4
Convert Cpy to Tif Group 4

0

লিনাক্সে

প্রথম আপনি OCR প্রয়োজন PDF যেগুলি ইতিমধ্যে ওসিআর না, আমি সব পডএফএস অনুসন্ধান করার জন্য একটি সুন্দর সহজ উপায় লিখেছিলাম যা হতে পারে না grep এড এবং ওসিআর তাদের।

আমি যদি লক্ষ্য করেছি একটি pdf ফাইলটি সাধারণত অনুসন্ধানযোগ্য নয় এমন কোন ফন্ট নেই। সুতরাং এই বুদ্ধিমান আমরা ব্যবহার করতে পারেন pdffonts

প্রথম 2 লাইন pdffonts টেবিল হেডার হয়, তাই যখন একটি ফাইল অনুসন্ধানযোগ্য হয় দুই লাইন আউটপুট আছে, এই বুদ্ধিমান আমরা তৈরি করতে পারেন:

gedit check_pdf_searchable.sh

তারপর এই পেস্ট করুন

#!/bin/bash 
#set -vx
if ((`pdffonts "$1" | wc -l` < 3 )); then
echo $1
pypdfocr "$1"
fi

তারপর এটি এক্সিকিউটেবল করা

chmod +x check_pdf_searchable.sh

তারপরে ডিরেক্টরির মধ্যে সমস্ত অ-অনুসন্ধানযোগ্য পিডিএফ তালিকাভুক্ত করুন:

ls -1 ./*.pdf | xargs -L1 -I {} ./check_pdf_searchable.sh {}

অথবা ডিরেক্টরির এবং এর সাবডিরেক্টরিগুলিতে:

tree -fai . | grep -P ".pdf$" | xargs -L1 -I {} ./check_pdf_searchable.sh {}

0

সবচেয়ে সহজ উপায় একটি ব্যবহার করা হয় অনলাইন ocr api । Ocr.space api তৈরি করার জন্য সমর্থন অন্তর্ভুক্ত অনুসন্ধানযোগ্য পিডিএফ । এই সেবাটিতে মাসে প্রতি মাসে 25,000 রূপান্তর বিনামূল্যে।

আপনি তারপর PowerShell, ব্যাচ বা অন্য কোন স্ক্রিপ্টিং ভাষা দিয়ে এটি স্বয়ংক্রিয় করতে পারেন। উদাহরণস্বরূপ, curl সঙ্গে ব্যাচ রূপান্তর ট্রিগার:

curl -H "apikey:helloworld" --form "file=@yourpdf.PDF" --form "language=eng" -form "isOverlayRequired=true" https://api.ocr.space/Parse/Image
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.