জাভাতে একটি সরল পাঠ্য ফাইল পড়া


933

জাভাতে ফাইলের ডেটা পড়ার এবং লেখার বিভিন্ন উপায় রয়েছে বলে মনে হয়।

আমি একটি ফাইল থেকে ASCII ডেটা পড়তে চাই। সম্ভাব্য উপায়গুলি এবং তাদের পার্থক্যগুলি কী কী?


24
"গঠনমূলক নয়" হিসাবে বন্ধ হওয়ার সাথেও আমি একমত নই। ভাগ্যক্রমে, এটি নকল হিসাবে ভালভাবে বন্ধ করা যেতে পারে । ভাল উত্তর যেমন একটি ফাইলের বিষয়বস্তু থেকে একটি স্ট্রিং তৈরি করতে? , স্ট্রিংয়ে কোনও ফাইল পড়ার সহজ উপায় কী? , ফাইল পড়ার জন্য সহজ ক্লাসগুলি কী কী?
জোনিক

লুপ ছাড়াই: {{{স্ক্যানার sc = নতুন স্ক্যানার (ফাইল, "ইউটিএফ -8"); sc.useDelimiter ( "$ ^"); // রিজেক্স কিছু মিলছে না স্ট্রিং টেক্সট = sc.next (); sc.close (); }}}
আইভর

3
এটি এত আকর্ষণীয় যে পুরো ফাইলটি স্ট্রিংয়ে পড়ার জন্য পাইথনে "রিড ()" এর মতো কিছুই নেই
kommradHomer

2
এটি করার সবচেয়ে সহজ উপায়: এমকইং.com
জাভা

উত্তর:


567

ASCII একটি Readersপাঠ্য ফাইল তাই আপনি পড়ার জন্য ব্যবহার করবেন। জাভা ব্যবহার করে বাইনারি ফাইল থেকে পড়াও সমর্থন করে InputStreams। যদি পড়া ফাইলগুলি বিশাল হয় তবে আপনি পড়ার কর্মক্ষমতা উন্নত করতে BufferedReaderএকটি শীর্ষে একটি ব্যবহার করতে চান toFileReader

কীভাবে এটি ব্যবহার করবেন সে সম্পর্কে এই নিবন্ধটির মাধ্যমে যানReader

আমি আপনাকে থিংকিং ইন জাভা নামে এই দুর্দান্ত (এখনও নিখরচায়) বইটি ডাউনলোড এবং পড়ার পরামর্শ দিচ্ছি

জাভা 7 এ :

new String(Files.readAllBytes(...))

(ডক্স) বা

Files.readAllLines(...)

(দস্তাবেজ)

জাভা 8 তে :

Files.lines(..).forEach(...)

(দস্তাবেজ)


14
একটি পাঠককে বাছাই করা আপনার পক্ষে ফাইলের সামগ্রীর কী প্রয়োজন তা নির্ভর করে। ফাইলটি যদি ছোট (ইশ) হয় এবং আপনার সমস্ত প্রয়োজন হয় তবে কেবল একটি ফাইলরেডার ব্যবহার করতে এবং সমস্ত কিছু (বা কমপক্ষে বড় পরিমাণে) পড়তে দ্রুত (আমাদের দ্বারা বেঞ্চমার্ক করা: 1.8-2x) faster যদি আপনি এটি লাইন লাইন প্রক্রিয়াকরণ করে থাকেন তবে বুফার্ডরিডারের জন্য যান।
ভ্লাদ

3
"ফাইল.লাইনস (..)। ForEach (...)" ব্যবহার করার সময় কি লাইন ক্রম সংরক্ষণ করা হবে? আমার বোঝাটি এই ক্রিয়াকলাপের পরে আদেশটি নির্বিচারে হবে।
ড্যানিল শেভলেভ

38
Files.lines(…).forEach(…)লাইনের ক্রম সংরক্ষণ করে না তবে সমান্তরালে মৃত্যুদন্ড কার্যকর করা হয়, @ ড্যাশ। যদি অর্ডারটি গুরুত্বপূর্ণ হয় তবে আপনি ব্যবহার করতে পারেন Files.lines(…).forEachOrdered(…)যা আদেশটি সংরক্ষণ করা উচিত (যদিও তা যাচাই করা হয়নি)।
প্লেক

2
@ প্লেক এটি আকর্ষণীয়, তবে আপনি যে ডক্স থেকে বলেছেন যে Files.lines(...).forEach(...)সমান্তরালভাবে মৃত্যুদন্ড কার্যকর করা হয়েছে তা থেকে আপনি কী উদ্ধৃতি দিতে পারেন ? আমি ভাবলাম এটি তখনই ঘটেছিল যখন আপনি স্পষ্টভাবে ব্যবহার করে স্ট্রিমটিকে সমান্তরাল করে তুলবেন Files.lines(...).parallel().forEach(...)
ক্লিটোস কিরিয়াকু

3
আমার মূল সূত্রটি বুলেটপ্রুফ নয়, @ ক্লিটোস ক্যারিয়াকৌ। forEachমুল বক্তব্যটি হ'ল কোনও আদেশের গ্যারান্টি নেই এবং কারণটি সহজেই সমান্তরালকরণ। অর্ডার সংরক্ষণ করতে হয়, ব্যবহার করুন forEachOrdered
প্লেকে

687

একটি ছোট ফাইল পড়ার জন্য আমার প্রিয় উপায়টি হল একটি বুফার্ডারিডার এবং একটি স্ট্রিংবিল্ডার ব্যবহার করা। এটি খুব সহজ এবং বিষয়টির কাছে (যদিও বিশেষভাবে কার্যকর না হলেও বেশিরভাগ ক্ষেত্রে এটি যথেষ্ট ভাল):

BufferedReader br = new BufferedReader(new FileReader("file.txt"));
try {
    StringBuilder sb = new StringBuilder();
    String line = br.readLine();

    while (line != null) {
        sb.append(line);
        sb.append(System.lineSeparator());
        line = br.readLine();
    }
    String everything = sb.toString();
} finally {
    br.close();
}

কেউ কেউ উল্লেখ করেছেন যে জাভা after এর পরে আপনার চেষ্টা করা উচিত রিসোর্স উইথ রিসোর্স (অর্থাত্ অটো ক্লোজ) বৈশিষ্ট্য:

try(BufferedReader br = new BufferedReader(new FileReader("file.txt"))) {
    StringBuilder sb = new StringBuilder();
    String line = br.readLine();

    while (line != null) {
        sb.append(line);
        sb.append(System.lineSeparator());
        line = br.readLine();
    }
    String everything = sb.toString();
}

আমি যখন এর মতো স্ট্রিংগুলি পড়ি, আমি সাধারণত যেভাবেই লাইন প্রতি কিছু স্ট্রিং হ্যান্ডলিং করতে চাই, তাই আমি এই বাস্তবায়নের জন্য যাই।

যদিও আমি যদি কেবল একটি স্ট্রিংয়ে কেবল একটি ফাইলটি পড়তে চাই তবে আমি সর্বদা আইওউটিলস.টোস্ট্রিং () পদ্ধতিটি সহ অ্যাপাচি কমন্স আইও ব্যবহার করি । আপনি উত্সটি এখানে দেখতে পারেন:

http://www.docjar.com/html/api/org/apache/commons/io/IOUtils.java.html

FileInputStream inputStream = new FileInputStream("foo.txt");
try {
    String everything = IOUtils.toString(inputStream);
} finally {
    inputStream.close();
}

এমনকি জাভা 7 এর সাথে আরও সহজ:

try(FileInputStream inputStream = new FileInputStream("foo.txt")) {     
    String everything = IOUtils.toString(inputStream);
    // do something with everything string
}

6
শেষ লাইনটি পৌঁছে গেলে আমি একটি নতুন লাইন যুক্ত করা বন্ধ করতে একটি সামঞ্জস্য করেছি \। code যখন (রেখা! = নাল) b sb.append (লাইন); লাইন = br.readLine (); // কার্লাইন শেষ লাইন না হলে কেবল নতুন লাইন যুক্ত করুন .. যদি (লাইন! = নাল) b sb.append ("\ n"); }}code
রামন ফিনকেন

2
অ্যাপাচি কমন আইও আইওইটিস-এর সাথে সমান # টু স্ট্রিং () হ'ল সান.মিসিক I
gb96

3
পারফরম্যান্সের জন্য সর্বদা sb.append ('\ n') কে sb.append ("\ n") এর পছন্দ হিসাবে কল করুন স্ট্রিংবিল্ডারে একটি স্ট্রিংয়ের চেয়ে দ্রুত যুক্ত হয়
gb96

2
ফাইলআরডার ফাইলনটফাউন্ডএক্সসেপশন নিক্ষেপ করতে পারে এবং বাফারড্রেড আইওএক্সেপশন নিক্ষেপ করতে পারে যাতে আপনার সেগুলি ধরতে হয়।
কামাচি

4
পাঠকদের সরাসরি ব্যবহার করার প্রয়োজন নেই এবং আইউটিলেরও প্রয়োজন নেই। জাভা 7 একটি সম্পূর্ণ ফাইল / সমস্ত লাইন পড়তে পদ্ধতিতে তৈরি করেছে: ডকস.ওরাকল.com / javase /7/ docs / api / java / nio /file/ এবং docs.oracle.com/javase/7/docs/api দেখুন / java / nio / file /…
kritzikratzi

142

সবচেয়ে সহজ উপায় Scannerজাভা এবং ফাইলরেডার অবজেক্টে ক্লাস ব্যবহার করা । সাধারণ উদাহরণ:

Scanner in = new Scanner(new FileReader("filename.txt"));

Scanner স্ট্রিং, সংখ্যা ইত্যাদি পড়ার বিভিন্ন পদ্ধতি রয়েছে ... আপনি জাভা ডকুমেন্টেশন পৃষ্ঠাতে আরও তথ্যের জন্য এটি দেখতে পারেন।

উদাহরণস্বরূপ সম্পূর্ণ কন্টেন্টটি একটিতে পড়া String:

StringBuilder sb = new StringBuilder();
while(in.hasNext()) {
    sb.append(in.next());
}
in.close();
outString = sb.toString();

এছাড়াও আপনার যদি একটি নির্দিষ্ট এনকোডিং প্রয়োজন হয় তবে আপনি এটির পরিবর্তে এটি ব্যবহার করতে পারেন FileReader:

new InputStreamReader(new FileInputStream(fileUtf8), StandardCharsets.UTF_8)

28
যখন (in.hasNext ())। System.out.println (in.next ()); }
জিন বো বো

16
@ হিশাইন তবে এর থেকে ব্যবহার করা আরও সহজBufferedReader
যিশু রামোস

3
এটিকে অবশ্যই চারপাশে চেষ্টা করে দেখুন
রাহাল কনিষ্ক

@ জেসুসামোস আসলেই নয়, আপনি কেন এমনটি ভাবেন? এর চেয়ে সহজ আর while ((line = br.readLine()) != null) { sb.append(line); }কি?
ব্যবহারকারী 207421


57

বাহ্যিক গ্রন্থাগার ব্যবহার না করে এটি করার আরও একটি উপায় এখানে রয়েছে:

import java.io.File;
import java.io.FileReader;
import java.io.IOException;

public String readFile(String filename)
{
    String content = null;
    File file = new File(filename); // For example, foo.txt
    FileReader reader = null;
    try {
        reader = new FileReader(file);
        char[] chars = new char[(int) file.length()];
        reader.read(chars);
        content = new String(chars);
        reader.close();
    } catch (IOException e) {
        e.printStackTrace();
    } finally {
        if(reader != null){
            reader.close();
        }
    }
    return content;
}

10
বা "রিসোর্স-উইথ রিসোর্স" ট্রাই ব্যবহার করুন (ফাইলআরডার রিডার = নতুন ফাইলরেডার (ফাইল))
হার্নান এচে

3
আমি ফাইল.মর্যাদা লক্ষ্য করেছি (), এটি utf-16 ফাইলের সাথে কতটা ভাল কাজ করে?
ওয়েইন

5
এই কৌশলটি ধরে নেয় যে পড়ুন () বাফার পূরণ করে; অক্ষরের সংখ্যা সমান বাইটের সমান; বাইট সংখ্যা মেমরি ফিট করে যে; এবং যে বাইট সংখ্যাটি একটি পূর্ণসংখ্যার সাথে ফিট করে। -1
ব্যবহারকারী 207421

1
@ হার্মিসট্রিসমেগিস্টাস এটিকে ভুল হওয়ার কারণ হিসাবে আমি চারটি কারণ সরবরাহ করেছি। আমার সাথে একমত হওয়ার জন্য স্টেফানরিচ পুরোপুরি সঠিক।
ব্যবহারকারী 207421

34

আমাকে বিভিন্নভাবে বেনমার্ক করতে হয়েছিল। আমি আমার অনুসন্ধানগুলিতে মন্তব্য করব তবে সংক্ষেপে, সবচেয়ে দ্রুততম উপায় হল একটি ফাইলআইপুট স্ট্রিমের মাধ্যমে একটি সরল পুরাতন বাফারডাইনপুট স্ট্রিম ব্যবহার করা। যদি অনেকগুলি ফাইল অবশ্যই পড়তে হয় তবে তিনটি থ্রেড মোট কার্যকরকরণের সময়কে প্রায় অর্ধেকে কমিয়ে দেবে, তবে আরও থ্রেড যুক্ত করা ক্রমশ কর্মক্ষমতা হ্রাস করবে যতক্ষণ না এটি কেবল একটি থ্রেডের চেয়ে বিশ থ্রেডের সাথে শেষ হতে তিনগুণ বেশি সময় নেয়।

অনুমানটি হ'ল আপনাকে অবশ্যই একটি ফাইল পড়তে হবে এবং এর বিষয়বস্তুগুলির সাথে অর্থপূর্ণ কিছু করতে হবে। এখানে উদাহরণগুলিতে একটি লগ থেকে লাইনগুলি পড়া এবং একটি নির্দিষ্ট প্রান্তিকের বেশি হওয়া মানগুলিকে গণনা করা হয়। সুতরাং আমি ধরে নিচ্ছি যে ওয়ান-লাইনার জাভা 8 Files.lines(Paths.get("/path/to/file.txt")).map(line -> line.split(";"))কোনও বিকল্প নয়।

আমি জাভা 1.8, উইন্ডোজ 7 এবং এসএসডি এবং এইচডিডি ড্রাইভ উভয়ই পরীক্ষা করেছিলাম।

আমি ছয়টি পৃথক বাস্তবায়ন লিখেছি:

কাঁচা পার্স : একটি ফাইলআইপুট স্ট্রিমের উপরে বাফারডিনপুট স্ট্রিম ব্যবহার করুন এবং তারপরে বাইট দ্বারা পাঠ্য লাইনগুলি কেটে দিন। এটি অন্য কোনও একক থ্রেড পদ্ধতির চেয়ে বেশি কার্যকর হয়েছে তবে এটি ASCII নন ফাইলের জন্য খুব অসুবিধাগ্রস্থ হতে পারে।

LineReaderParse : একটি ফাইলরেডার উপর একটি বাফারড্রিডার ব্যবহার করুন, স্ট্রিং.স্প্লিট () কল করে লাইন দ্বারা রেখা, বিভক্ত লাইন পড়ুন। এটি কাঁচা পার্সের আনুমানিক 20% ধীর।

লাইনরেডারপারসপ্যারালাল : এটি লাইনরেডারপার্সের সমান, তবে এটি বেশ কয়েকটি থ্রেড ব্যবহার করে। এটি সব ক্ষেত্রেই দ্রুততম বিকল্প।

nioFilesParse : java.nio.files.Files.lines ব্যবহার করুন ()

nioAsyncParse : একটি সমাপ্তি হ্যান্ডলার এবং একটি থ্রেড পুল সহ একটি অ্যাসিনক্রোনাসফিল চ্যানেল ব্যবহার করুন।

nioMemoryMappedParse : একটি মেমরি- ম্যাপযুক্ত ফাইল ব্যবহার করুন। অন্য বাস্তবায়নের চেয়ে কমপক্ষে তিনগুণ বেশি সময় কার্যকর করার ফলস্বরূপ এটি একটি খারাপ ধারণা।

কোয়াড-কোর আই 7 এবং এসএসডি ড্রাইভে প্রতিটি 4 এমবি এর 204 ফাইল পড়ার জন্য এ গড় বার। ডিস্ক ক্যাচিং এড়ানোর জন্য ফ্লাইগুলিতে ফাইলগুলি তৈরি করা হয়।

rawParse                11.10 sec
lineReaderParse         13.86 sec
lineReaderParseParallel  6.00 sec
nioFilesParse           13.52 sec
nioAsyncParse           16.06 sec
nioMemoryMappedParse    37.68 sec

এসএসডি বা একটি এইচডিডি ড্রাইভের এসএসডি হয়ে প্রায় 15% দ্রুত গতিতে চলার মধ্যে আমার যে প্রত্যাশা ছিল তার চেয়ে কম পার্থক্য পেয়েছি। এটি হতে পারে কারণ ফাইলগুলি একটি অবিবাহিত এইচডিডি-তে উত্পন্ন এবং সেগুলি যথাক্রমে পড়া হয়, সুতরাং স্পিনিং ড্রাইভটি প্রায় এসএসডি হিসাবে সম্পাদন করতে পারে।

NioAsyncParse বাস্তবায়নের নিম্ন ਪ੍ਰਦਰਸ਼ਨ দ্বারা আমি অবাক হয়েছি। হয় আমি ভুল উপায়ে কিছু প্রয়োগ করেছি বা এনআইও ব্যবহার করে মাল্টি-থ্রেড প্রয়োগকরণ এবং একটি পরিসমাপ্তি হ্যান্ডলার জাভা.আইপিআইপি দিয়ে একক থ্রেড প্রয়োগের চেয়ে একই (বা আরও খারাপ) সম্পাদন করে। তবুও কমপ্লিটহ্যান্ডলার সহ অ্যাসিঙ্ক্রোনাস পার্স পুরানো স্ট্রিমগুলির উপর সরাসরি প্রয়োগের চেয়ে সঠিকভাবে প্রয়োগ করার কোডের লাইনে অনেক বেশি দীর্ঘ এবং জটিল।

এখন ছয়টি বাস্তবায়নের পরে একটি শ্রেণি রয়েছে যার মধ্যে রয়েছে সেগুলি একটি প্লাস একটি প্যারামিট্রাইজেবল মেইন () পদ্ধতি যা ফাইলের সংখ্যা, ফাইলের আকার এবং সম্মতি ডিগ্রি নিয়ে খেলতে দেয়। নোট করুন যে ফাইলগুলির আকারের সাথে মাইনাস 20% পরিবর্তিত হয়। সমস্ত ফাইল হুবহু একই আকারের হওয়ার কারণে এটি কোনও প্রভাব এড়ানোর জন্য।

rawParse

public void rawParse(final String targetDir, final int numberOfFiles) throws IOException, ParseException {
    overrunCount = 0;
    final int dl = (int) ';';
    StringBuffer lineBuffer = new StringBuffer(1024);
    for (int f=0; f<numberOfFiles; f++) {
        File fl = new File(targetDir+filenamePreffix+String.valueOf(f)+".txt");
        FileInputStream fin = new FileInputStream(fl);
        BufferedInputStream bin = new BufferedInputStream(fin);
        int character;
        while((character=bin.read())!=-1) {
            if (character==dl) {

                // Here is where something is done with each line
                doSomethingWithRawLine(lineBuffer.toString());
                lineBuffer.setLength(0);
            }
            else {
                lineBuffer.append((char) character);
            }
        }
        bin.close();
        fin.close();
    }
}

public final void doSomethingWithRawLine(String line) throws ParseException {
    // What to do for each line
    int fieldNumber = 0;
    final int len = line.length();
    StringBuffer fieldBuffer = new StringBuffer(256);
    for (int charPos=0; charPos<len; charPos++) {
        char c = line.charAt(charPos);
        if (c==DL0) {
            String fieldValue = fieldBuffer.toString();
            if (fieldValue.length()>0) {
                switch (fieldNumber) {
                    case 0:
                        Date dt = fmt.parse(fieldValue);
                        fieldNumber++;
                        break;
                    case 1:
                        double d = Double.parseDouble(fieldValue);
                        fieldNumber++;
                        break;
                    case 2:
                        int t = Integer.parseInt(fieldValue);
                        fieldNumber++;
                        break;
                    case 3:
                        if (fieldValue.equals("overrun"))
                            overrunCount++;
                        break;
                }
            }
            fieldBuffer.setLength(0);
        }
        else {
            fieldBuffer.append(c);
        }
    }
}

lineReaderParse

public void lineReaderParse(final String targetDir, final int numberOfFiles) throws IOException, ParseException {
    String line;
    for (int f=0; f<numberOfFiles; f++) {
        File fl = new File(targetDir+filenamePreffix+String.valueOf(f)+".txt");
        FileReader frd = new FileReader(fl);
        BufferedReader brd = new BufferedReader(frd);

        while ((line=brd.readLine())!=null)
            doSomethingWithLine(line);
        brd.close();
        frd.close();
    }
}

public final void doSomethingWithLine(String line) throws ParseException {
    // Example of what to do for each line
    String[] fields = line.split(";");
    Date dt = fmt.parse(fields[0]);
    double d = Double.parseDouble(fields[1]);
    int t = Integer.parseInt(fields[2]);
    if (fields[3].equals("overrun"))
        overrunCount++;
}

lineReaderParseParallel

public void lineReaderParseParallel(final String targetDir, final int numberOfFiles, final int degreeOfParalelism) throws IOException, ParseException, InterruptedException {
    Thread[] pool = new Thread[degreeOfParalelism];
    int batchSize = numberOfFiles / degreeOfParalelism;
    for (int b=0; b<degreeOfParalelism; b++) {
        pool[b] = new LineReaderParseThread(targetDir, b*batchSize, b*batchSize+b*batchSize);
        pool[b].start();
    }
    for (int b=0; b<degreeOfParalelism; b++)
        pool[b].join();
}

class LineReaderParseThread extends Thread {

    private String targetDir;
    private int fileFrom;
    private int fileTo;
    private DateFormat fmt = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
    private int overrunCounter = 0;

    public LineReaderParseThread(String targetDir, int fileFrom, int fileTo) {
        this.targetDir = targetDir;
        this.fileFrom = fileFrom;
        this.fileTo = fileTo;
    }

    private void doSomethingWithTheLine(String line) throws ParseException {
        String[] fields = line.split(DL);
        Date dt = fmt.parse(fields[0]);
        double d = Double.parseDouble(fields[1]);
        int t = Integer.parseInt(fields[2]);
        if (fields[3].equals("overrun"))
            overrunCounter++;
    }

    @Override
    public void run() {
        String line;
        for (int f=fileFrom; f<fileTo; f++) {
            File fl = new File(targetDir+filenamePreffix+String.valueOf(f)+".txt");
            try {
            FileReader frd = new FileReader(fl);
            BufferedReader brd = new BufferedReader(frd);
            while ((line=brd.readLine())!=null) {
                doSomethingWithTheLine(line);
            }
            brd.close();
            frd.close();
            } catch (IOException | ParseException ioe) { }
        }
    }
}

nioFilesParse

public void nioFilesParse(final String targetDir, final int numberOfFiles) throws IOException, ParseException {
    for (int f=0; f<numberOfFiles; f++) {
        Path ph = Paths.get(targetDir+filenamePreffix+String.valueOf(f)+".txt");
        Consumer<String> action = new LineConsumer();
        Stream<String> lines = Files.lines(ph);
        lines.forEach(action);
        lines.close();
    }
}


class LineConsumer implements Consumer<String> {

    @Override
    public void accept(String line) {

        // What to do for each line
        String[] fields = line.split(DL);
        if (fields.length>1) {
            try {
                Date dt = fmt.parse(fields[0]);
            }
            catch (ParseException e) {
            }
            double d = Double.parseDouble(fields[1]);
            int t = Integer.parseInt(fields[2]);
            if (fields[3].equals("overrun"))
                overrunCount++;
        }
    }
}

nioAsyncParse

public void nioAsyncParse(final String targetDir, final int numberOfFiles, final int numberOfThreads, final int bufferSize) throws IOException, ParseException, InterruptedException {
    ScheduledThreadPoolExecutor pool = new ScheduledThreadPoolExecutor(numberOfThreads);
    ConcurrentLinkedQueue<ByteBuffer> byteBuffers = new ConcurrentLinkedQueue<ByteBuffer>();

    for (int b=0; b<numberOfThreads; b++)
        byteBuffers.add(ByteBuffer.allocate(bufferSize));

    for (int f=0; f<numberOfFiles; f++) {
        consumerThreads.acquire();
        String fileName = targetDir+filenamePreffix+String.valueOf(f)+".txt";
        AsynchronousFileChannel channel = AsynchronousFileChannel.open(Paths.get(fileName), EnumSet.of(StandardOpenOption.READ), pool);
        BufferConsumer consumer = new BufferConsumer(byteBuffers, fileName, bufferSize);
        channel.read(consumer.buffer(), 0l, channel, consumer);
    }
    consumerThreads.acquire(numberOfThreads);
}


class BufferConsumer implements CompletionHandler<Integer, AsynchronousFileChannel> {

        private ConcurrentLinkedQueue<ByteBuffer> buffers;
        private ByteBuffer bytes;
        private String file;
        private StringBuffer chars;
        private int limit;
        private long position;
        private DateFormat frmt = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

        public BufferConsumer(ConcurrentLinkedQueue<ByteBuffer> byteBuffers, String fileName, int bufferSize) {
            buffers = byteBuffers;
            bytes = buffers.poll();
            if (bytes==null)
                bytes = ByteBuffer.allocate(bufferSize);

            file = fileName;
            chars = new StringBuffer(bufferSize);
            frmt = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
            limit = bufferSize;
            position = 0l;
        }

        public ByteBuffer buffer() {
            return bytes;
        }

        @Override
        public synchronized void completed(Integer result, AsynchronousFileChannel channel) {

            if (result!=-1) {
                bytes.flip();
                final int len = bytes.limit();
                int i = 0;
                try {
                    for (i = 0; i < len; i++) {
                        byte by = bytes.get();
                        if (by=='\n') {
                            // ***
                            // The code used to process the line goes here
                            chars.setLength(0);
                        }
                        else {
                                chars.append((char) by);
                        }
                    }
                }
                catch (Exception x) {
                    System.out.println(
                        "Caught exception " + x.getClass().getName() + " " + x.getMessage() +
                        " i=" + String.valueOf(i) + ", limit=" + String.valueOf(len) +
                        ", position="+String.valueOf(position));
                }

                if (len==limit) {
                    bytes.clear();
                    position += len;
                    channel.read(bytes, position, channel, this);
                }
                else {
                    try {
                        channel.close();
                    }
                    catch (IOException e) {
                    }
                    consumerThreads.release();
                    bytes.clear();
                    buffers.add(bytes);
                }
            }
            else {
                try {
                    channel.close();
                }
                catch (IOException e) {
                }
                consumerThreads.release();
                bytes.clear();
                buffers.add(bytes);
            }
        }

        @Override
        public void failed(Throwable e, AsynchronousFileChannel channel) {
        }
};

সমস্ত ক্ষেত্রে সম্পূর্ণরূপে প্রয়োগযোগ্য

https://github.com/sergiomt/javaiobenchmark/blob/master/FileReadBenchmark.java


24

এখানে তিনটি কার্যক্ষম এবং পরীক্ষিত পদ্ধতি রয়েছে:

ব্যবহার BufferedReader

package io;
import java.io.*;
public class ReadFromFile2 {
    public static void main(String[] args)throws Exception {
        File file = new File("C:\\Users\\pankaj\\Desktop\\test.java");
        BufferedReader br = new BufferedReader(new FileReader(file));
        String st;
        while((st=br.readLine()) != null){
            System.out.println(st);
        }
    }
}

ব্যবহার Scanner

package io;

import java.io.File;
import java.util.Scanner;

public class ReadFromFileUsingScanner {
    public static void main(String[] args) throws Exception {
        File file = new File("C:\\Users\\pankaj\\Desktop\\test.java");
        Scanner sc = new Scanner(file);
        while(sc.hasNextLine()){
            System.out.println(sc.nextLine());
        }
    }
}

ব্যবহার FileReader

package io;
import java.io.*;
public class ReadingFromFile {

    public static void main(String[] args) throws Exception {
        FileReader fr = new FileReader("C:\\Users\\pankaj\\Desktop\\test.java");
        int i;
        while ((i=fr.read()) != -1){
            System.out.print((char) i);
        }
    }
}

Scannerক্লাস ব্যবহার করে লুপ ছাড়াই পুরো ফাইলটি পড়ুন

package io;

import java.io.File;
import java.io.FileNotFoundException;
import java.util.Scanner;

public class ReadingEntireFileWithoutLoop {

    public static void main(String[] args) throws FileNotFoundException {
        File file = new File("C:\\Users\\pankaj\\Desktop\\test.java");
        Scanner sc = new Scanner(file);
        sc.useDelimiter("\\Z");
        System.out.println(sc.next());
    }
}

1
ফোল্ডারগুলি প্রকল্পের ভিতরে উপস্থিত থাকলে কীভাবে পথ দেওয়া যায়?
কবিপ্রিয়া

2
কি হবে java.nio.file.Files? এখন আমরা শুধু ব্যবহার করতে পারেন readAllLines, readAllBytesএবং lines
ক্লোড মার্টিন

21

এর মধ্যে থাকা পদ্ধতিগুলি org.apache.commons.io.FileUtilsখুব সহজেই কার্যকর হতে পারে, যেমন:

/**
 * Reads the contents of a file line by line to a List
 * of Strings using the default encoding for the VM.
 */
static List readLines(File file)

অথবা আপনি যদি পেয়ারা (আরও আধুনিক, সক্রিয়ভাবে রক্ষণাবেক্ষণ করা গ্রন্থাগার) পছন্দ করেন তবে এর ফাইল ক্লাসে এর অনুরূপ উপযোগিতা রয়েছে । এই উত্তরের সহজ উদাহরণ
জোনিক

1
বা আপনি সমস্ত লাইন পাওয়ার জন্য বিল্ট ইন পদ্ধতিটি কেবল ব্যবহার করুন: ডকস.ওরকল
জাভ্যাস

অ্যাপাচি কমনের লিঙ্কটি মারা গেছে বলে মনে হচ্ছে।
kebs

17

পাঠ্যটি দিয়ে আপনি কী করতে চান? ফাইলটি কি মেমরির সাথে ফিট করার পক্ষে যথেষ্ট ছোট? আপনার প্রয়োজনের জন্য আমি ফাইলটি হ্যান্ডেল করার সহজ উপায়টি খুঁজতে চেষ্টা করব। ফাইলUtils গ্রন্থাগার এটির জন্য খুব হ্যান্ডেল is

for(String line: FileUtils.readLines("my-text-file"))
    System.out.println(line);

2
এটি java7- এও নির্মিত হয়েছে: ডকস.অরাকল.
/ /

@ পিটারলাউয়ের সম্ভবত এর অর্থ org.apache.commons.io.FileUtils। গুগল লিঙ্কটি সময়ের সাথে সাথে সামগ্রিক পরিবর্তন করতে পারে, সর্বাধিক বিস্তৃত অর্থের শিফট হিসাবে, তবে এটি তার প্রশ্নের সাথে মেলে এবং সঠিক দেখাচ্ছে।
প্যালেক

2
দুর্ভাগ্যক্রমে, আজকাল নেই readLines(String)এবং readLines(File)পক্ষে আছে এবং হ্রাস করা হয় readLines(File, Charset)। এনকোডিং একটি স্ট্রিং হিসাবে সরবরাহ করা যেতে পারে।
প্লেক


12

আমি জাভাতে একটি ফাইল পড়ার 15 টি উপায় নথিভুক্ত করেছি এবং তারপরে বিভিন্ন ফাইল আকারের সাথে গতির জন্য তাদের পরীক্ষা করেছিলাম - 1 কেবি থেকে 1 জিবি পর্যন্ত এবং এখানে এটি করার জন্য শীর্ষ তিনটি উপায় রয়েছে:

  1. java.nio.file.Files.readAllBytes()

    জাভা 7, 8, এবং 9 এ কাজ করার জন্য পরীক্ষিত।

    import java.io.File;
    import java.io.IOException;
    import java.nio.file.Files;
    
    public class ReadFile_Files_ReadAllBytes {
      public static void main(String [] pArgs) throws IOException {
        String fileName = "c:\\temp\\sample-10KB.txt";
        File file = new File(fileName);
    
        byte [] fileBytes = Files.readAllBytes(file.toPath());
        char singleChar;
        for(byte b : fileBytes) {
          singleChar = (char) b;
          System.out.print(singleChar);
        }
      }
    }
  2. java.io.BufferedReader.readLine()

    জাভা 7, 8, 9 এ কাজ করার জন্য পরীক্ষিত।

    import java.io.BufferedReader;
    import java.io.FileReader;
    import java.io.IOException;
    
    public class ReadFile_BufferedReader_ReadLine {
      public static void main(String [] args) throws IOException {
        String fileName = "c:\\temp\\sample-10KB.txt";
        FileReader fileReader = new FileReader(fileName);
    
        try (BufferedReader bufferedReader = new BufferedReader(fileReader)) {
          String line;
          while((line = bufferedReader.readLine()) != null) {
            System.out.println(line);
          }
        }
      }
    }
  3. java.nio.file.Files.lines()

    জাভা 8 এবং 9 এ কাজ করার জন্য এটি পরীক্ষা করা হয়েছিল তবে ল্যাম্বডা এক্সপ্রেশন প্রয়োজনীয়তার কারণে জাভা 7 তে কাজ করবে না।

    import java.io.File;
    import java.io.IOException;
    import java.nio.file.Files;
    import java.util.stream.Stream;
    
    public class ReadFile_Files_Lines {
      public static void main(String[] pArgs) throws IOException {
        String fileName = "c:\\temp\\sample-10KB.txt";
        File file = new File(fileName);
    
        try (Stream linesStream = Files.lines(file.toPath())) {
          linesStream.forEach(line -> {
            System.out.println(line);
          });
        }
      }
    }

9

নীচে এটি জাভা 8 উপায়ে করার একটি ওয়ান-লাইনার রয়েছে। ধরে নেওয়া text.txtফাইলটি গ্রহনের প্রকল্প ডিরেক্টরিটির মূলের মধ্যে রয়েছে।

Files.lines(Paths.get("text.txt")).collect(Collectors.toList());

7

বাফার্ডারিডার ব্যবহার:

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;

BufferedReader br;
try {
    br = new BufferedReader(new FileReader("/fileToRead.txt"));
    try {
        String x;
        while ( (x = br.readLine()) != null ) {
            // Printing out each line in the file
            System.out.println(x);
        }
    }
    catch (IOException e) {
        e.printStackTrace();
    }
}
catch (FileNotFoundException e) {
    System.out.println(e);
    e.printStackTrace();
}

7

এটি মূলত যিশু রামোসের জবাব হিসাবে ঠিক একই রকম, ফাইলের পরিবর্তে ফাইলের বিষয়বস্তু থেকে পদক্ষেপ নেওয়ার জন্য ফাইলরাইডার প্লাস পুনরাবৃত্তির পরিবর্তে ফাইল ব্যতীত same

Scanner in = new Scanner(new File("filename.txt"));

while (in.hasNext()) { // Iterates each line in the file
    String line = in.nextLine();
    // Do something with line
}

in.close(); // Don't forget to close resource leaks

... ছুড়ে ফেলে FileNotFoundException


3
ফাইল বনাম ফাইলরেডার: ফাইলআরডার দিয়ে ফাইলটি অবশ্যই উপস্থিত থাকে এবং অপারেটিং সিস্টেমের অনুমতি অবশ্যই অ্যাক্সেসের অনুমতি দেয়। কোনও ফাইলের সাহায্যে সেই অনুমতিগুলি পরীক্ষা করা বা ফাইলটি ডিরেক্টরি কিনা তা পরীক্ষা করা সম্ভব। ফাইলটিতে দরকারী ফাংশন রয়েছে: isFile (), isDirectory (), listFiles (), canExecute (), canRead (), canWrite (), বিদ্যমান (), mkdir (), মুছুন ()। File.createTempFile () সিস্টেম ডিফল্ট অস্থায়ী ডিরেক্টরিতে লিখেছে। এই পদ্ধতিটি এমন কোনও ফাইল অবজেক্ট ফিরিয়ে দেবে যা ফাইলআউটপুট স্ট্রিম অবজেক্ট ইত্যাদির উত্স
ThisClark

7

বাফার স্ট্রিম ক্লাসগুলি অনুশীলনে অনেক বেশি পারফরম্যান্ট, এত বেশি যে NIO.2 এপিআইতে এমন পদ্ধতি রয়েছে যা নির্দিষ্টভাবে এই স্ট্রিম ক্লাসগুলি ফিরিয়ে দেয়, অংশে আপনাকে সর্বদা আপনার অ্যাপ্লিকেশনটিতে বাফার স্ট্রিম ব্যবহার করতে উত্সাহিত করে।

এখানে একটি উদাহরণ:

Path path = Paths.get("/myfolder/myfile.ext");
try (BufferedReader reader = Files.newBufferedReader(path)) {
    // Read from the stream
    String currentLine = null;
    while ((currentLine = reader.readLine()) != null)
        //do your code here
} catch (IOException e) {
    // Handle file I/O exception...
}

আপনি এই কোডটি প্রতিস্থাপন করতে পারেন

BufferedReader reader = Files.newBufferedReader(path);

সঙ্গে

BufferedReader br = new BufferedReader(new FileReader("/myfolder/myfile.ext"));

আমি জাভা এনআইও এবং আইও এর প্রধান ব্যবহারগুলি শিখতে এই নিবন্ধটি সুপারিশ করছি ।


6

সম্ভবত বাফার্ড আই / ও এর সাথে তত দ্রুত নয়, তবে বেশ ছিটে:

    String content;
    try (Scanner scanner = new Scanner(textFile).useDelimiter("\\Z")) {
        content = scanner.next();
    }

\Zপ্যাটার্ন বলে Scannerযে বিভেদক ফাইলের শেষে হয়।


1
খুব সম্পর্কিত, ইতিমধ্যে বিদ্যমান উত্তরটি হলেন যিশু রামোস।
প্লেকে

1
সত্য, হওয়া উচিত: if(scanner.hasNext()) content = scanner.next();
ডেভিড সোরোকো

1
এটি অ্যান্ড্রয়েড ৪.৪ এ আমার জন্য ব্যর্থ। কেবলমাত্র 1024 বাইট পঠিত। YMMV।
রজার কীগুলি

3

আমি এখনও পর্যন্ত অন্যান্য উত্তরে এটি উল্লেখ করা দেখতে পাচ্ছি না। তবে যদি "সেরা" এর অর্থ গতি হয় তবে নতুন জাভা আই / ও (এনআইও) দ্রুততম পারফরম্যান্স সরবরাহ করতে পারে তবে শেখার জন্য কারও পক্ষে খুঁজে পাওয়া সবচেয়ে সহজ নয়।

http://download.oracle.com/javase/tutorial/essential/io/file.html


এটি কীভাবে করা হয়েছে এবং অনুসরণের জন্য কোনও লিঙ্ক না দেওয়া উচিত তা আপনার বলা উচিত ছিল
ওড়ায়

3

জাভা একটি ফাইল থেকে ডেটা পড়তে সবচেয়ে সহজ উপায় ব্যবহার করছে ফাইল ফাইল এবং পড়তে বর্গ স্ক্যানার ফাইলের সামগ্রী পড়তে বর্গ।

public static void main(String args[])throws Exception
{
   File f = new File("input.txt");
   takeInputIn2DArray(f);
}

public static void takeInputIn2DArray(File f) throws Exception
{
    Scanner s = new Scanner(f);
    int a[][] = new int[20][20];
    for(int i=0; i<20; i++)
    {
        for(int j=0; j<20; j++)
        {
            a[i][j] = s.nextInt();
        }
    }
}

PS: java.util। * আমদানি করতে ভুলবেন না; স্ক্যানার কাজ করার জন্য।



2

এটি প্রশ্নের সঠিক উত্তর নাও হতে পারে। এটি কেবল কোনও ফাইল পড়ার অন্য একটি উপায় যেখানে আপনি নিজের জাভা কোডটিতে আপনার ফাইলের পথ স্পষ্টভাবে নির্দিষ্ট করে না এবং পরিবর্তে, আপনি এটি একটি কমান্ড-লাইন আর্গুমেন্ট হিসাবে পড়েন।

নিম্নলিখিত কোড সহ,

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.io.IOException;

public class InputReader{

    public static void main(String[] args)throws IOException{
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        String s="";
        while((s=br.readLine())!=null){
            System.out.println(s);
        }
    }
}

শুধু এগিয়ে যান এবং এটি দিয়ে চালান:

java InputReader < input.txt

এটি এর সামগ্রীগুলি পড়ে input.txtআপনার কনসোলে মুদ্রণ করবে।

আপনি System.out.println()নিম্নলিখিত কমান্ড লাইনের মাধ্যমে একটি নির্দিষ্ট ফাইলে লিখতে পারেন:

java InputReader < input.txt > output.txt

এটি থেকে পড়তে input.txtএবং লিখতে হবে output.txt


2

আপনি joinএক লাইনে পুরো ফাইল সামগ্রী পেতে রিডএললাইন এবং পদ্ধতিটি ব্যবহার করতে পারেন :

String str = String.join("\n",Files.readAllLines(Paths.get("e:\\text.txt")));

এটি ইউটিএফ -8 এনকোডিংটি ডিফল্টরূপে ব্যবহার করে, যা ASCII ডেটা সঠিকভাবে পড়ে।

এছাড়াও আপনি পড়ুন সমস্ত বাইট ব্যবহার করতে পারেন:

String str = new String(Files.readAllBytes(Paths.get("e:\\text.txt")), StandardCharsets.UTF_8);

আমি মনে করি রিডএলবাইটগুলি দ্রুত এবং আরও সুনির্দিষ্ট, কারণ এটি নতুন লাইনের সাথে প্রতিস্থাপন করে না \nএবং নতুন লাইনও হতে পারে \r\n। এটি আপনার প্রয়োজনগুলির উপর নির্ভর করে কোনটি উপযুক্ত।


1

জেএসএফ-ভিত্তিক মাভেন ওয়েব অ্যাপ্লিকেশনগুলির জন্য, Resourcesআপনি চান যে কোনও ফাইল পড়তে কেবল ক্লাসলুডার এবং ফোল্ডারটি ব্যবহার করুন:

  1. আপনি যে ফাইলটি পড়তে চান তা রিসোর্স ফোল্ডারে রাখুন।
  2. অ্যাপাচি কমন্স আইও নির্ভরতা আপনার POM এর মধ্যে রাখুন:

    <dependency>
        <groupId>org.apache.commons</groupId>
        <artifactId>commons-io</artifactId>
        <version>1.3.2</version>
    </dependency>
  3. এটি পড়ার জন্য নীচের কোডটি ব্যবহার করুন (উদাহরণস্বরূপ নীচে একটি .json ফাইলে পড়া হচ্ছে):

    String metadata = null;
    FileInputStream inputStream;
    try {
    
        ClassLoader loader = Thread.currentThread().getContextClassLoader();
        inputStream = (FileInputStream) loader
                .getResourceAsStream("/metadata.json");
        metadata = IOUtils.toString(inputStream);
        inputStream.close();
    }
    catch (FileNotFoundException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    return metadata;

আপনি পাঠ্য ফাইল, .poperties ফাইল, এক্সএসডি স্কিমা ইত্যাদি জন্য একই কাজ করতে পারেন


আপনি এটি 'আপনার পছন্দসই কোনও ফাইল' ব্যবহার করতে পারবেন না। আপনি এটিকে কেবল সেই সংস্থানগুলির জন্য ব্যবহার করতে পারেন যা জেআর বা ওয়ার ফাইলটিতে প্যাকেজ করা হয়েছে।
ব্যবহারকারী 207421



0
import java.util.stream.Stream;
import java.nio.file.*;
import java.io.*;

class ReadFile {

 public static void main(String[] args) {

    String filename = "Test.txt";

    try(Stream<String> stream = Files.lines(Paths.get(filename))) {

          stream.forEach(System.out:: println);

    } catch (IOException e) {

        e.printStackTrace();
    }

 }

 }

কেবল জাভা 8 স্ট্রিম ব্যবহার করুন।



0

সর্বাধিক স্বজ্ঞাত পদ্ধতি জাভা 11 এ চালু করা হয়েছে Files.readString

import java.io.*;
import java.nio.file.Files;
import java.nio.file.Paths;

public class App {
    public static void main(String args[]) throws IOException {
        String content = Files.readString(Paths.get("D:\\sandbox\\mvn\\my-app\\my-app.iml"));
        System.out.print(content);
    }
}

কয়েক দশক আগে পিএইচপি এই বিলাসিতা আছে ! ☺


-3

আমি প্রোগ্রাম করা এই কোডটি খুব বড় ফাইলগুলির জন্য খুব দ্রুত:

public String readDoc(File f) {
    String text = "";
    int read, N = 1024 * 1024;
    char[] buffer = new char[N];

    try {
        FileReader fr = new FileReader(f);
        BufferedReader br = new BufferedReader(fr);

        while(true) {
            read = br.read(buffer, 0, N);
            text += new String(buffer, 0, read);

            if(read < N) {
                break;
            }
        }
    } catch(Exception ex) {
        ex.printStackTrace();
    }

    return text;
}

10
আরও দ্রুত, আমি সন্দেহ করি, আপনি যদি স্ট্রিংবিল্ডারের পরিবর্তে সরল স্ট্রিং কনটেনটেশন ব্যবহার করেন ...
ফিলিহো

6
আমি মনে করি মূল গতি অর্জন 1MB (1024 * 1024) ব্লকে পড়া থেকে। তবে আপনি বাফারড্রেডার কনস্ট্রাক্টরের কাছে দ্বিতীয় আরগ হিসাবে 1024 * 1024 কেটে কেবল একই কাজটি করতে পারেন।
gb96

3
আমি বিশ্বাস করি না এটি মোটেই পরীক্ষিত। +=এই পদ্ধতিতে ব্যবহার আপনাকে লিনিয়ার জটিলতা হওয়া উচিত এমন কোনও কাজের জন্য চতুর্ভুজ (!) জটিলতা দেয়। এটি কয়েক এমবিতে ফাইলের জন্য ক্রল করা শুরু করবে। এটি ঘুরে দেখার জন্য আপনার হয় টেক্সটব্লকগুলি তালিকার একটি তালিকায় রাখা উচিত <স্ট্রিং> অথবা উপরোক্ত স্ট্রিংবিল্ডারটি ব্যবহার করুন।
কিতজিক্রতজি

5
এর চেয়ে অনেক দ্রুত? এটি সম্ভবত স্ট্রিংবফারের সাথে যুক্ত হওয়ার চেয়ে দ্রুত নয় । -1
ব্যবহারকারী 207421

1
@ gb96 আমি বাফার আকারগুলি সম্পর্কেও একই চিন্তা করেছি, তবে এই প্রশ্নের বিশদ পরীক্ষাটি একইরকম প্রসঙ্গে বিস্ময়কর ফলাফল দিয়েছে: একটি 16 কেবি বাফার ধারাবাহিকভাবে এবং লক্ষণীয়ভাবে দ্রুত ছিল।
চিস্টিক-সুরক্ষা

-3
String fileName = 'yourFileFullNameWithPath';
File file = new File(fileName); // Creates a new file object for your file
FileReader fr = new FileReader(file);// Creates a Reader that you can use to read the contents of a file read your file
BufferedReader br = new BufferedReader(fr); //Reads text from a character-input stream, buffering characters so as to provide for the efficient reading of characters, arrays, and lines.

উপরের রেখার সেটটি 1 টি একক লাইনে লেখা যেতে পারে:

BufferedReader br = new BufferedReader(new FileReader("file.txt")); // Optional

স্ট্রিং বিল্ডারে যুক্ত করা (যদি আপনি ফাইলটি বিশাল করেন তবে স্ট্রিং बिल्डरকে অন্য স্ট্রিং অবজেক্ট ব্যবহার করার পরামর্শ দেওয়া হয়)

try {
        StringBuilder sb = new StringBuilder();
        String line = br.readLine();

        while (line != null) {
        sb.append(line);
        sb.append(System.lineSeparator());
        line = br.readLine();
        }
        String everything = sb.toString();
        } finally {
        br.close();
    }
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.