সরাসরি একটি পিডিএফ মধ্যে অনেক পৃষ্ঠা স্ক্যান করুন


36

উবুন্টুতে এমন কিছু সহজে ব্যবহারযোগ্য প্রোগ্রাম রয়েছে যা অনেকগুলি পৃষ্ঠাকে সরাসরি পিডিএফ ফাইলে স্ক্যান করতে পারে?


শুধু ভাবছি, স্ক্যানার / প্রিন্টারগুলির জন্য কি আমি উবুন্টুতে ব্যবহার করতে চাই?
জেএফডাব্লু

@ জেএফডাব্লু, এক্সসেনের সমর্থিত ডিভাইসের একটি তালিকা এখানে রয়েছে, বেশিরভাগ উবুন্টু স্ক্যানার দ্বারা ব্যবহৃত ব্যাক-এন্ড। আপনি যদি খুঁজছেন তবে এইচপি প্রিন্টার / স্ক্যানার / কপিয়ারগুলি একটি ভাল নির্ভরযোগ্য পছন্দ বলে মনে হচ্ছে।
পুলি

উত্তর:


38

একটি সাধারণ স্ক্যান ইউটিলিটি থাকার ধারণাটির পিছনে ছিল খুব ভাল, সরল স্ক্যান - স্ক্যানিং সরঞ্জামটি 10.04 থেকে (অ্যাপ্লিকেশন ‣ গ্রাফিকস ‣ সাধারণ স্ক্যান) ডিফল্টরূপে ইনস্টল করা। বিকল্প পাঠ

আপনি যতগুলি পৃষ্ঠাগুলি চান তা কেবল স্ক্যান করুন এবং সংরক্ষণের সময় ফাইল ফর্ম্যাট হিসাবে পিডিএফ চয়ন করুন।

আরেকটি সামান্য কম সহজ প্রোগ্রাম যা পাঠ্য স্বীকৃতির মতো অতিরিক্ত বৈশিষ্ট্যগুলি সরবরাহ করে তা হ'ল gscan2pdf , ভান্ডারগুলিতেও। বিকল্প পাঠ


3
সাধারণ স্ক্যানের জন্য +1 - এটি এত সহজ এবং সহজ তবে খুব শক্তিশালী - এটি আপনার উল্লেখ করা কাজের সাথে বিশেষভাবে উপযুক্ত।
8128

6

"ব্যবহারে সহজ" ব্যবহারকারীর নজরে রয়েছে তবে xsaneএই কার্যকারিতা সরবরাহ করে। মাল্টিপেজটি চয়ন করুন যেখানে এটি ভিউয়ার বলেছে (বা সিটিআরএল-এম চাপুন) এবং সেখান থেকে বের করে আনা খুব অসুবিধা হওয়া উচিত নয়।


1
ব্যক্তিগতভাবে আমি এক্সসেনটি দেখতে যতটা সহজ ব্যবহার থেকে দূরে দেখতে পাই ...
8128

আমি সারাটা সময় এক্সসান ব্যবহার করে আসছি। এটি আমার কাছে কখনও ঘটেনি যে আরও ভাল সরঞ্জাম থাকতে পারে।
আমন্ডা

3

আমি xsaneএই প্রশ্নটি না হওয়া পর্যন্ত ব্যবহার করছি এবং এর ইন্টারফেসের আইডিসিঙ্ক্র্যাটিকটিকে কমপক্ষে, তবে কার্যকর বলে বিবেচনা করেছি।

এই প্রশ্নটি দেখে আমি সন্ধান করতে গিয়ে উবুন্টু লুসিড / মাভেরিক সংগ্রহস্থলগুলিতে বাস করলাম gscan2pdf । এটি একই স্ক্যানিং (লাইবসান) ইঞ্জিন ব্যবহার করে তবে ইউআই আরও বেশি জিনোম-ইশ। একটি ভাল সময়ের জন্য, চেষ্টা করুন:

sudo apt-get install gscan2pdf

3

সরল স্ক্যানের সেভ কথোপকথনে ফাইলের নামটি myfile.jpg থেকে myfile.pdf এ পরিবর্তন করুন

উবুন্টু 14.04, সহজ স্ক্যান 3.12.1 এ পরীক্ষিত।

যদিও ফাইল টাইপ ড্রপ-ডাউন "পিডিএফ" প্রদর্শন করে না, কেবল "চিত্র" থাকে তা এটি কাজ করে। আমি এটি একটি ইউআই বাগ বিবেচনা করি।

এই বৈশিষ্ট্যটি এখানে নথিভুক্ত করা হয় Help > Contents:

"হিসাবে সংরক্ষণ করুন" কথোপকথন বাক্স থেকে, সমর্থিত ফাইল ধরণের একটি চয়ন করুন বা কেবল "নাম" ক্ষেত্রে এক্সটেনশনটি পরিবর্তন করুন।

এটি বলে যে নিম্নলিখিত ফর্ম্যাটগুলি সমর্থিত:

  • পিডিএফ
  • কোন JPEG
  • পিএনজি
  • টিফ

আকর্ষণীয় সত্য: আপনি যদি স্ক্যানের ধরণ ("স্ক্যান" এর পাশাপাশি ড্রপডাউন) "পাঠ্য" এ পরিবর্তন করেন তবে ডিফল্ট ফাইল টাইপটি পিডিএফ হয়ে যায়।


1

ইউএসবি স্ক্যানার থেকে পৃষ্ঠাগুলি স্ক্যান করুন। ওডিআর-তে একটি পিডিএফ-তে পরীক্ষামূলক ব্যবহার করুন। একাধিক পৃষ্ঠাগুলি এক পিডিএফে মার্জ করুন। ব্যবহার: স্ক্যান 2 পিডিএফ আউটপুট ফাইল নাম্বার_পরে_পৃষ্ঠাগুলি

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}

এটি একটি খুব লিনাক্সয়েডাল পদ্ধতি
rt

1

আপনারা যারা XSANE ব্যবহার করতে চান তাদের জন্য For আপনি প্রোগ্রামটিতে সহায়তা> এক্সসেন ডক থেকে লিঙ্কযুক্ত সেটআপ গাইডটি একবার পড়লে এটি খুব শক্তিশালী এবং স্বজ্ঞাত - আপনি এটি দিয়ে কী করতে পারবেন তা জানতে। আপনার সান ব্যাকএন্ড সঠিকভাবে কাজ করছে তা পরীক্ষা করাও খুব বেশি (আর্চ নির্দিষ্ট নয়): https://wiki.archlinux.org/index.php/SANE

আপনি যদি কোনও ফিডার থেকে স্বয়ংক্রিয়ভাবে দস্তাবেজগুলি স্ক্যান করতে চান এবং অবাক হন যে XSane কখন থামবে (এবং খুব তাড়াতাড়ি থামবে না) তা জানতে পারে তবে কেবল উপরের বামে একটি নম্বর ইনপুট করুন (স্ক্যান আইকনের সংখ্যা) যে পৃষ্ঠাগুলির সাথে ফিট করে আপনার ফিডারে অর্থাৎ যদি আপনার ফিডারটি 10 ​​পৃষ্ঠা নিতে পারে তবে 15 টি প্রবেশ করুন (বেধের পরিবর্তনের জন্য অ্যাকাউন্টে)। আপনার যদি দ্বৈত স্ক্যানার থাকে তবে এই সংখ্যাটি দ্বিগুণ করুন।

যখন ফিডার শেষ হয়ে যায়, আপনি "" স্ক্যান করা পৃষ্ঠাগুলি: 0 "বলে সবুজ সতর্কতা ত্রিভুজ সহ একটি ডায়ালগ বক্স পাবেন This এর অর্থ হ'ল ফিডারটি খালি রয়েছে এবং আপনি ডায়ালগটি বন্ধ করতে পারেন you আপনি যদি" ​​ভিউয়ার "বা" সংরক্ষণ "নির্বাচন করেন তবে "এক্সসেনের উপরের ডানদিকে, তখন ফাইলগুলি সমস্ত সেখানে থাকবে - দর্শকের কাছ থেকে সেগুলি সংরক্ষণ করতে ভুলবেন না Now এখন আপনি যেখানে চলে গেছেন সেখানে চালানোর জন্য আবার স্ক্যান টিপতে পারেন, একই পয়েন্ট থেকে সংখ্যা বাড়ানো বা আপনি শুরু করতে পারেন একটি নতুন প্রকল্প There কোনও খালি পৃষ্ঠা যুক্ত হবে না you আপনি যদি "মাল্টিপেজ" নির্বাচন করেন তবে প্রকল্পের ডায়ালগটিতে সমস্ত সম্পূর্ণ স্ক্যান প্রদর্শিত হবে এবং আপনি একটি মাল্টিপেজ পিডিএফ বা টিআইএফএফ বা পোস্টস্ক্রিপ্ট হিসাবে সংরক্ষণ করতে ক্লিক করতে পারেন।

আছে HTH,

ডিসি

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.