প্রশ্ন ট্যাগ «text-processing»

প্রোগ্রামগুলি, স্ক্রিপ্টস ইত্যাদির মাধ্যমে পাঠ্যের হেরফের বা পরীক্ষা করা

2
টেক্সট ফাইলগুলি বিয়োগ করতে ইউনিক্সে সরঞ্জাম?
আমার কাছে একটি বৃহত টেবিলের আকারে সেমিকোলন দ্বারা পৃথক করে পাঠ্য ক্ষেত্রগুলি নিয়ে গঠিত একটি বড় ফাইল রয়েছে। এটি বাছাই করা হয়েছে। আমার কাছে একই পাঠ্য ক্ষেত্রের সমন্বয়ে একটি ছোট ফাইল রয়েছে। এক পর্যায়ে, কেউ এই ফাইলটিকে অন্যের সাথে সম্মতি জানায় এবং তারপরে উপরে বর্ণিত বড় ফাইলটি গঠনের জন্য বাছাই …

3
লিনাক্সের একটি ডিলিমিটারের আগে আমি কীভাবে পাঠ্য মুছতে পারি
ডিলিমিটারের আগে আমাকে একটি লাইন থেকে পাঠ্য মুছতে হবে। উদাহরণ স্বরূপ: (123434): hello::{apple,orange,mango}. আমার প্রথমে পাঠ্য মুছতে হবে :। অর্থাত (123434)। এই কাজটি করার জন্য লিনাক্সটিতে কোনও আদেশ রয়েছে?

8
বিশাল ফাইলগুলিতে স্ট্রিংকে নতুন লাইন যুক্ত করুন
"বাইনারি" অনুসন্ধান / স্ট্রিংগুলিকে কিছুটা মেমোরি-দক্ষ উপায়ে প্রতিস্থাপন করার জন্য কোনও লাইন-ভিত্তিক সরঞ্জাম সম্পর্কে কেউ জানেন? এই প্রশ্নটি দেখুন । আমার কাছে একটি + 2GB টেক্সট ফাইল রয়েছে যা আমি এটি করতে যা প্রদর্শিত হবে তার অনুরূপ প্রক্রিয়া করতে চাই: sed -e 's/>\n/>/g' এর অর্থ, আমি ক এর পরে ঘটে …

4
দুটি ফাইলের দুটি কলামের তুলনা করুন এবং এটি মেলে তবে মুদ্রণ করুন
আমি সোলারিস 10 ব্যবহার করছি এবং তাই গ্রাফিক অপশনগুলি কাজ করে না - আমার কাছে দুটি পাইপ-বিচ্ছিন্ন ফাইল রয়েছে: file1: abc|123|BNY|apple| cab|234|cyx|orange| def|kumar|pki|bird| ফাইল 2: abc|123| kumar|pki| cab|234 আমি ফাইল 2 এর প্রথম দুটি কলামকে ফাইল 1 এর সাথে তুলনা করতে চাই (প্রথম দুটি কলামে ফাইল 1 এর পুরো বিষয়বস্তু …

2
দুটি নিদর্শনগুলির মধ্যে (এবং সহ) লাইনগুলি মুদ্রণ করুন
আমি লাইনের CKশেষে থাকা রেখাগুলি থেকে গ্রেপিং শুরু করতে চাই এবং লাইনটি যখন Dশেষ হয় তখন গ্রেপিং বন্ধ করতে চাই । আমি চেষ্টা করেছি grep "$CK" "$D" file..txt, কিন্তু কাজ হয়নি। ইনপুট: kkkkkkkkkkk jjjjjjjjjjjjjjjjjj gggggggggggg/CK JHGHHHHHHHH HJKHKKLKLLL JNBHBHJKJJLKKL JLKKKLLKJLKJ/D GGGGGGGGGGGGGG GGGGGGGGGGGGGG কাঙ্ক্ষিত আউটপুট: gggggggggggg/CK JHGHHHHHHHH HJKHKKLKLLL JNBHBHJKJJLKKL JLKKKLLKJLKJ/D

11
আমি কীভাবে কোনও পাঠ্য ফাইলকে একাধিক পাঠ্য ফাইলগুলিতে বিভক্ত করতে পারি?
আমার কাছে একটি পাঠ্য ফাইল entry.txtরয়েছে যার মধ্যে নিম্নলিখিত রয়েছে: [ entry1 ] 1239 1240 1242 1391 1392 1394 1486 1487 1489 1600 1601 1603 1657 1658 1660 2075 2076 2078 2322 2323 2325 2740 2741 2743 3082 3083 3085 3291 3292 3294 3481 3482 3484 3633 3634 3636 3690 …

1
একটি বৃহত মাল্টি-জিবি পাঠ্য ফাইলটিতে নকল লাইনগুলি কীভাবে সরাবেন?
আমার প্রশ্নটি এই প্রশ্নের অনুরূপ তবে কয়েকটি পৃথক বাধা সহ: আমার কাছে একটি বড় \nসীমিত শব্দ-তালিকা রয়েছে - প্রতি লাইনে একটি শব্দ। ফাইলগুলির আকার 2GB থেকে 10GB পর্যন্ত বৃহত্তর। আমার যে কোনও সদৃশ লাইন সরানো দরকার। প্রক্রিয়াটি ডুপ্লিকেটগুলি অপসারণের সময় তালিকাকে সাজিয়ে তুলতে পারে তবে প্রয়োজনীয় নয়। নতুন অনন্য ওয়ার্ডলিস্ট …

5
ফাইলের যে কোনও জায়গায় একাধিক কীওয়ার্ডযুক্ত ফাইলগুলি সন্ধান করুন
আমি ফাইলের যে কোনও জায়গায় যে সন্ধানের কীওয়ার্ডগুলির পুরো সেট ধারণ করে এমন একটি ডিরেক্টরিতে সমস্ত ফাইল তালিকাভুক্ত করার উপায় খুঁজছি। সুতরাং, কীওয়ার্ডগুলির একই লাইনে উপস্থিত হওয়ার দরকার নেই। এটি করার একটি উপায় হ'ল: grep -l one $(grep -l two $(grep -l three *)) তিনটি কীওয়ার্ড কেবল একটি উদাহরণ, এটি …

4
একটি কমান্ডের আউটপুট একটি রিং-বাফারে সংরক্ষণ করুন
আমি একটি দীর্ঘ-চলমান কমান্ড পেয়েছি যা স্টডআউটে প্রচুর আউটপুট উত্পন্ন করে। আমি উদাহরণস্বরূপ, কেবলমাত্র শেষ তিন দিন বা শেষ গিবিবাইট (মাঝখানে রেখাগুলি কাটা এড়ানো) সংরক্ষণ করতে সক্ষম হব এবং যদি সম্ভব হয় তবে ফাইল মাইন্ডে 20 এমআইবি-র চেয়ে বেশি নয়। প্রতিটি ফাইল অংশের নাম সংখ্যাসূচক প্রত্যয় বা একটি টাইমস্ট্যাম্পের সাথে …

3
প্রথম ক্ষেত্রটি যদি লিনাক্স 1 হিসাবে স্ট্রিং দিয়ে শুরু হয় কেবল তখনই awk + মুদ্রণ লাইন
লিনাক্স 1 দিয়ে প্রথম ক্ষেত্রটি শুরু করার ক্ষেত্রে কীভাবে লাইনটি মুদ্রণ করা যায় উদাহরণ স্বরূপ: echo Linux1_ver2 12542 kernel-update | awk '{if ($1 ~ Linux1 ) print $0;}' লক্ষ্যটি হ'ল লাইনটি মুদ্রণ করা হবে, যখন প্রথম ক্ষেত্রটি লিনাক্স 1 দিয়ে শুরু হবে লাইনের উদাহরণ: Linux1-new 36352 Version:true Linux1-1625543 9847 Linux1:16254 …

5
সিএসভি-ফাইল স্থানান্তর করার জন্য কি কোনও কমান্ড লাইন ইউটিলিটি রয়েছে?
এর মত একটি ফাইল দেওয়া হয়েছে First,Last,Age Cory,Klein,27 John Jacob,Smith,30 বিষয়বস্তু স্থানান্তর করার জন্য একটি কমান্ড লাইন ইউটিলিটি রয়েছে যাতে আউটপুটটি এর মতো প্রদর্শিত হয় First,Cory,John Jacob Last,Klein,Smith Age,27,30

5
Sed ব্যবহার না করে স্ট্রিংটি কীভাবে সন্ধান এবং প্রতিস্থাপন করতে পারি?
আমরা সব জানি, sedউদাহরণস্বরূপ খুঁজুন 'একটি' জন্য, ব্যাপকভাবে খুঁজে পেতে এবং স্ট্রিং প্রতিস্থাপন করতে কার্যকরী এবং 'খ' থেকে এটি প্রতিস্থাপন: sed 's/a/b/g'। এর পরিবর্তে অন্য কমান্ড বা শেল স্ক্রিপ্ট দিয়ে এটি করা সম্ভব sed? এটি এমন টিভির জন্য ক্রপযুক্ত লিনাক্স সিস্টেমের জন্য যাতে sedকমান্ড নেই। সুতরাং এর পরিবর্তে আমাকে অন্যান্য …

3
মাথা অতিরিক্ত অক্ষর খায়
নিম্নলিখিত শেল কমান্ডটি কেবল ইনপুট স্ট্রিমের বিজোড় লাইনগুলি মুদ্রণ করবে বলে আশা করা হয়েছিল: echo -e "aaa\nbbb\nccc\nddd\n" | (while true; do head -n 1; head -n 1 >/dev/null; done) কিন্তু এর পরিবর্তে এটি শুধু প্রথম লাইন ছাপে: aaa। যখন এটি -c( --bytes) বিকল্পের সাথে ব্যবহৃত হয় তখন একই হয় না …

5
প্রচুর পরিমাণে ফাইলের সংমিশ্রণ
আমার কাছে 10,000 ডলার ফাইল ( res.1- res.10000) রয়েছে যার মধ্যে একটি কলাম এবং সমান সংখ্যক সারি রয়েছে। আমি যা চাই তা হ'ল সংক্ষেপে; কলাম অনুসারে সমস্ত ফাইল এক নতুন ফাইলে মার্জ করুন final.res। আমি ব্যবহার করে চেষ্টা করেছি: paste res.* তবে (যদিও এই ফলাফলের ফাইল একটি ছোট উপশাখা জন্য …

5
আমি কীভাবে একটি কলামে টাইমস্ট্যাম্পগুলিকে একটি তারিখে রূপান্তর করতে পারি?
আমার এতে একটি ফাইল রয়েছে: 1415602803,LOGIN SUCCESS,AUTH,user2,192.168.203.63,10.146.124.73,59996,22 1415602807,LOGIN SUCCESS,AUTH,user1,172.24.31.10,172.32.1.1,48191,22 1415602811,LOGIN FAILED,AUTH,root,172.24.166.153,10.146.124.73,52506,22 1415602815,LOGIN FAILED,AUTH,user3,192.168.123.55,10.146.32.99,55750,22 আমি এই বিন্যাসে টাইমস্ট্যাম্পকে একটি তারিখে রূপান্তর করতে চাই: 2014-11-10 02:00:03,LOGIN SUCCESS,AUTH,user2,192.168.203.63,10.146.124.73,59996,22 2014-11-10 02:00:07,LOGIN SUCCESS,AUTH,user1,172.24.31.10,172.32.1.1,48191,22 2014-11-10 02:00:11,LOGIN FAILED,AUTH,root,172.24.166.153,10.146.124.73,52506,22 2014-11-10 02:00:15,LOGIN FAILED,AUTH,user3,192.168.123.55,10.146.32.99,55750,22 আমি এটা কিভাবে করবো? আমি জানি এটি কাজ করে: perl -pe 's/(\d+)/localtime($1)/e'( এই প্রশ্ন থেকে ) …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.