সময়ের আগে লাইনগুলির দৈর্ঘ্য না জেনে কোনও ফাইলের read_csv
প্রথম n
লাইনগুলি পড়ার জন্য কি অভ্যন্তরীণ কোনও উপায় আছে ? আমার কাছে একটি বড় ফাইল রয়েছে যা পড়তে দীর্ঘ সময় লাগে এবং মাঝে মাঝে কেবলমাত্র তার প্রথম নমুনা পেতে 20 লাইন ব্যবহার করতে চান (এবং পুরো জিনিসটি লোড না করে এটির মাথা নিতে পছন্দ করেন না)।
আমি যদি মোট লাইনগুলির সংখ্যা জানতাম তবে আমি এর মতো কিছু করতে পারি footer_lines = total_lines - n
এবং skipfooter
কীওয়ার্ড আরগটিতে এটি পাস করতে পারি । আমার বর্তমান সমাধানটি হ'ল n
পাইথনটির সাথে প্রথম লাইনগুলি ম্যানুয়ালি দখল করা এবং স্ট্রিংআইও এটি পান্ডাসের কাছে:
import pandas as pd
from StringIO import StringIO
n = 20
with open('big_file.csv', 'r') as f:
head = ''.join(f.readlines(n))
df = pd.read_csv(StringIO(head))
এটি খুব খারাপ নয়, তবে কীওয়ার্ড বা কোনও কিছুর সাহায্যে আরও সংক্ষিপ্ত, 'প্যান্ডাসিক' (?) উপায় আছে?