প্রশ্ন ট্যাগ «text-processing»

প্রোগ্রামগুলি, স্ক্রিপ্টস ইত্যাদির মাধ্যমে পাঠ্যের হেরফের বা পরীক্ষা করা

6
ফিল্টারিং অবৈধ utf8
আমার অজানা বা মিশ্র এনকোডিংয়ের একটি পাঠ্য ফাইল রয়েছে। আমি লাইনগুলি দেখতে চাই যেগুলিতে একটি বাইট ক্রম রয়েছে যা বৈধ UTF-8 নয় (কিছু প্রোগ্রামে টেক্সট ফাইলটি পাইপ করে)। সমানভাবে, আমি বৈধ ইউটিএফ -8 লাইনগুলি ফিল্টার করতে চাই। অন্য কথায়, আমি তার জন্য দেখছি ।grep [notutf8] একটি আদর্শ সমাধান পোর্টেবল, সংক্ষিপ্ত …

10
কোনও ফাইল কোনও সংশোধন না করেই সিআরএলএফ বা এলএফ ব্যবহার করে কিনা তা কীভাবে পরীক্ষা করবেন?
আমাকে পর্যায়ক্রমে একটি কমান্ড চালানো দরকার যা নিশ্চিত করে যে কিছু পাঠ্য ফাইল লিনাক্স মোডে রাখা আছে। দুর্ভাগ্যক্রমে dos2unixফাইলটি সর্বদা সংশোধন করে, যা ফাইল এবং ফোল্ডারের টাইমস্ট্যাম্পগুলিকে বিশৃঙ্খল করে এবং অপ্রয়োজনীয় লেখার কারণ হয়ে দাঁড়ায়। আমি যে স্ক্রিপ্টটি লিখছি তা বাশ-এ রয়েছে, সুতরাং আমি বাশের উপর ভিত্তি করে উত্তর পছন্দ …

13
ফাইলের শেষ পর্যন্ত ম্যাচের পরে সমস্ত লাইন কীভাবে মুদ্রণ করবেন?
ইনপুট ফাইল 1 হ'ল: dog 123 4335 cat 13123 23424 deer 2131 213132 bear 2313 21313 আমি ম্যাচটি অভ্যন্তরীণ থেকে প্যাটার্নটি দিই other file( dog 123 4335ফাইল 2 থেকে)। আমি লাইনটির প্যাটার্নটি মেলে dog 123 4335এবং ম্যাচ লাইন ছাড়াই সমস্ত লাইন মুদ্রণের পরে আমার আউটপুটটি: cat 13123 23424 deer 2131 …

19
সিএসভি ফাইলগুলি প্রক্রিয়াকরণের জন্য একটি শক্তিশালী কমান্ড লাইন সরঞ্জাম আছে?
আমি সিএসভি ফাইলগুলির সাথে কাজ করি এবং কখনও কখনও কমান্ড লাইন থেকে সারি বা কলামের সামগ্রীগুলি দ্রুত পরীক্ষা করা প্রয়োজন check অনেক ক্ষেত্রে cut, head, tail, এবং বন্ধুদের কাজ করবে; তবে কাটা সহজে যেমন পরিস্থিতি মোকাবেলা করতে পারে না "this, is the first entry", this is the second, 34.5 এখানে, …

3
আমি কীভাবে কোনও পাঠ্য ফাইলের এনকোডিং পরীক্ষা করতে পারি… এটি বৈধ এবং এটি কী?
আমার বেশ কয়েকটি .htmফাইল রয়েছে যা গেডিতে কোনও সতর্কতা / ত্রুটি ছাড়াই খোলে , কিন্তু আমি যখন এই ফাইলগুলি খুলি তখন Jeditএটি আমাকে অবৈধ ইউটিএফ -8 এনকোডিং সম্পর্কে সতর্ক করে ... এইচটিএমএল মেটা ট্যাগে "চরসেট = আইএসও -8859-1" লেখা আছে। জেডিট ফ্যালব্যাক এনকোডিংগুলির একটি তালিকা এবং এনকোডিং অটো-ডিটেক্টরগুলির তালিকাকে (বর্তমানে …

8
টিএক্সটি কীভাবে পিডিএফে রূপান্তর করবেন?
আমি .txtফাইলগুলিতে রূপান্তর করতে চাই .pdf। আমি এটি ব্যবহার করছি: ls | while read ONELINE; do convert -density 400 "$ONELINE" "$(echo "$ONELINE" | sed 's/.txt/.pdf/g')"; done তবে এটি একটি "ত্রুটি" উত্পন্ন করে - যদি পাঠ্য ফাইলে খুব দীর্ঘ লাইন থাকে তবে এটি মোড়ানো হয় না। ইনপুট পাঠ্য আউটপুট পিডিএফ - …

5
ফাইলটি থেকে শেষ লাইনটি মুছুন
আমি sed নির্দিষ্ট অবস্থান হিসাবে দ্রুত লাইনগুলি মুছতে ব্যবহার করি sed '1d' sed '5d' তবে, আমি যদি ফাইলটির শেষ লাইনটি মুছতে চাই এবং লাইনের গণনা জানি না (তবে আমি জানি যে আমি এটি ব্যবহার করতে wcএবং অন্যান্য কৌশলগুলি পেতে পারি )। বর্তমানে, এটির সাথে একত্রিত করে headএবং এটির সাথে tailমিলিত …

5
একটি ফাইলের পরিবেশের ভেরিয়েবলগুলি তাদের আসল মানগুলির সাথে প্রতিস্থাপন করবেন?
কোনও ফাইলের পরিবেশের ভেরিয়েবলগুলি বিকল্প / মূল্যায়ন করার কোন সহজ উপায় আছে? যেমনটি বলি যে আমার কাছে একটি ফাইল config.xmlরয়েছে যা এতে রয়েছে: <property> <name>instanceId</name> <value>$INSTANCE_ID</value> </property> <property> <name>rootPath</name> <value>/services/$SERVICE_NAME</value> </property> ... ইত্যাদি। আমি এনভ ভার্ভের মান সহ এনভায়রনমেন্ট ভেরিয়েবলের $INSTANCE_IDমান সহ ফাইলটিতে প্রতিস্থাপন করতে চাই । কোন পরিবেশের ভারগুলি …

4
ডেটা বাছাই না করে কীভাবে কেবল অনন্য ফলাফল পাবেন?
$ cat data.txt aaaaaa aaaaaa cccccc aaaaaa aaaaaa bbbbbb $ cat data.txt | uniq aaaaaa cccccc aaaaaa bbbbbb $ cat data.txt | sort | uniq aaaaaa bbbbbb cccccc $ আমার যে ফলাফলটি প্রয়োজন তা হ'ল ফাইলে বিবৃতিগুলির মূল ক্রম বজায় রেখে সমস্ত ডুপ্লিকেটগুলি সরিয়ে ফেলা মূল ফাইল থেকে সমস্ত লাইন …

6
শেল: বাইনারি ফাইলের বাইটগুলি কীভাবে পড়বেন এবং হেক্সাডেসিমাল হিসাবে মুদ্রণ করবেন?
শেলের মধ্যে, আমি কীভাবে আমার বাইনারি ফাইলের বাইটগুলি পড়তে পারি এবং আউটপুটটিকে হেক্সাডেসিমাল সংখ্যা হিসাবে মুদ্রণ করতে পারি?

6
টেবিল বিভাজনিত তালিকা সুন্দরভাবে কমান্ড
কখনও কখনও, আমি একটি ইনপুট ট্যাব দ্বারা পৃথক তালিকা হিসাবে পেয়ে যাচ্ছি, উদাহরণস্বরূপ, যা পুরোপুরি সাজানো হয় না var1 var2 var3 var_with_long_name_which_ruins_alignment var2 var3 এগুলি প্রান্তিককরণের জন্য কী কী সহজ উপায় আছে? var1 var2 var3 var_with_long_name_which_ruins_alignment var2 var3

5
শেষ ব্যতীত সমস্ত নিউলাইনগুলিকে স্থানটিতে প্রতিস্থাপন করুন
আমি কীভাবে সর্বশেষ নিউলাইন বাদে স্থানের সাথে সমস্ত নিউলাইনগুলি প্রতিস্থাপন করতে পারি। আমি সমস্ত নিউলাইনটি ব্যবহার করে স্পেসে প্রতিস্থাপন trকরতে পারি তবে কীভাবে আমি কিছু ব্যাতিক্রম করতে পারি?

4
কোনও ফাইলের শেষে থেকে শুরু পর্যন্ত গ্রেপ করুন
আমার প্রায় 30.000.000 লাইন (রেডিয়াস অ্যাকাউন্টিং) সহ একটি ফাইল রয়েছে এবং আমার প্রদত্ত প্যাটার্নের শেষ ম্যাচটি খুঁজে বের করতে হবে। আদেশ: tac accounting.log | grep $pattern আমার যা প্রয়োজন তা দেয় তবে এটি খুব ধীর কারণ ওএসকে প্রথমে পুরো ফাইলটি পড়তে হবে এবং তারপরে পাইপে প্রেরণ করতে হবে। সুতরাং, আমার …

4
কমান্ড লাইনটি ব্যবহার করে নির্দিষ্ট লাইনগুলিকে মন্তব্য করার / সহজতর করার সহজ উপায়
কমান্ড লাইন ব্যবহার করে কোনও শেল / কনফিগার / রুবি স্ক্রিপ্ট মন্তব্য / uncomment করার কোন উপায় আছে? উদাহরণ স্বরূপ: $ comment 14-18 bla.conf $ uncomment 14-18 bla.conf এটি লাইন অন #সাইন যোগ বা মুছে ফেলা হবে । সাধারণত আমি ব্যবহার করি , তবে অবশ্যই আমি অবশ্যই এই লাইনের সামগ্রীগুলি …

1
অ-এসকিআই (ইউনিকোড) অক্ষর সম্পর্কে কীভাবে ট্র সচেতন করবেন?
আমি ফাইল (ইউটিএফ -8) থেকে কিছু অক্ষর সরিয়ে দেওয়ার চেষ্টা করছি। আমি trএই উদ্দেশ্যে ব্যবহার করছি : tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat ফাইলটিতে কিছু বিদেশী অক্ষর রয়েছে (যেমন "Латвийская" বা "àé")। trএগুলি বুঝতে পারে বলে মনে হয় না: এটি তাদের অ-আলফা হিসাবে বিবেচনা করে এবং খুব সরিয়ে দেয়। আমি …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.