একটি পান্ডাস ডেটা ফ্রেমে কোনও টিএসভি ফাইল লোড করবেন কীভাবে?


136

আমি অজগর এবং পান্ডাসে নতুন। আমি চেষ্টা করছি tsvএকটি প্যান্ডাসে লোড করা একটি ফাইল DataFrame

এটিই আমি চেষ্টা করছি এবং আমি যে ত্রুটিটি পাচ্ছি:

>>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))

Traceback (most recent call last):
  File "<pyshell#28>", line 1, in <module>
    df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__
    raise PandasError('DataFrame constructor not properly called!')
PandasError: DataFrame constructor not properly called!

11
2017+ এ এই উত্তরটিতে যারা আসছেন তাদের জন্য ব্যবহার করুন read_csv('path_to_file', sep='\t')। দেখুন নিচের এই উত্তর
টেড Petrou

ধন্যবাদ @ টেডপেট্রো
সালমোন

উত্তর:


153

দ্রষ্টব্য : 17.0 from_csvহিসাবে নিরুৎসাহিত করা হয়েছে: pd.read_csvপরিবর্তে ব্যবহার করুন

ডকুমেন্টেশন একটি .from_csv ফাংশন তালিকাভুক্ত করে যা আপনি যা চান তা করতে প্রদর্শিত হয়:

DataFrame.from_csv('c:/~/trainSetRel3.txt', sep='\t')

আপনার যদি একটি শিরোনাম থাকে তবে আপনি পাস করতে পারেন header=0

DataFrame.from_csv('c:/~/trainSetRel3.txt', sep='\t', header=0)

4
এই পদ্ধতিটি নিয়ে আমার কিছু সমস্যা ছিল - এটি খুব ধীর এবং শেষে সূচকে ব্যর্থ হয়েছিল। পরিবর্তে, আমি read_table () ব্যবহার করি, যা অনেক দ্রুত এবং অতিরিক্ত প্যারাম ছাড়াই কাজ করে।
ইয়ুরিক

21
নোট করুন যে 17.0 from_csvহিসাবে নিরুৎসাহিত করা হয়েছে: pd.read_csvপরিবর্তে ব্যবহার করুন!
রাফেলওয়ালে

2
আমাকে নিম্নলিখিতগুলি ব্যবহার করতে হয়েছিল: ডেটাফ্রেম.ড্রেড_সিএসভি ('filepath.tsv', sep = '', শিরোনাম = 0)
আর্চি

3
এটি একটি খারাপ উত্তর; আপনি টিএসভি স্থানীয়ভাবে পড়তে পারেন pd.read_csv/read_table, আপনাকে কেবল সেট করতে হবে delim_whitespace=Trueবাsep
স্মি

3
@ আরাফালভালে অবহেলিত নোটিশ যুক্ত করেছেন
আরায়ণ সিং

84

17.0 from_csvহিসাবে নিরুৎসাহিত করা হয়।

ব্যবহার করুন pd.read_csv(fpath, sep='\t')বা pd.read_table(fpath)


4
দ্রষ্টব্য: পঠন-টেবিলটি 0.24.0 সংস্করণ থেকে অবচয় করা হয়েছে। পরিবর্তে পান্ডাস.ড্রেড_সিএসভি () ব্যবহার করুন।
ম্যানুয়েলস্কিনিড 3 ই


19

এটা চেষ্টা কর

df = pd.read_csv("rating-data.tsv",sep='\t')
df.head()

এখানে চিত্র বর্ণনা লিখুন

আপনাকে আসলে সিপ প্যারামিটারটি ঠিক করতে হবে ।


7

ফাইল খুলুন, .csv হিসাবে সংরক্ষণ করুন এবং তারপরে প্রয়োগ করুন

df = pd.read_csv('apps.csv', sep='\t')

অন্য যে কোনও বিন্যাসের জন্যও কেবল সেপ ট্যাগ পরিবর্তন করুন


0
df = pd.read_csv('filename.csv', sep='\t', header=0)

ডিলিমিটার এবং শিরোনাম নির্দিষ্ট করে আপনি সরাসরি পান্ডাস ডেটা ফ্রেমে টিএসভি ফাইলটি লোড করতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.