কীভাবে আমি পিএসপার্ক ডেটাফ্রেমে একটি .csv ফাইল আমদানি করতে পারি? এমনকি আমি পান্ডাসে সিএসভি ফাইলটি পড়ার চেষ্টা করেছি এবং তারপরে এটি তৈরির ডেটা ফ্রেম ব্যবহার করে একটি স্পার্ক ডেটা ফ্রেমে রূপান্তরিত করেছি, তবে এটি এখনও কিছু ত্রুটি দেখাচ্ছে showing এর মাধ্যমে কেউ আমাকে গাইড করতে পারে? এছাড়াও, দয়া করে আমাকে বলুন আমি কীভাবে একটি এক্সএলএসএক্স ফাইল আমদানি করতে পারি? আমি সিএসভি কনটেন্টকে পান্ডাস ডেটাফ্রেমে আমদানি করার চেষ্টা করছি এবং তারপরে এটিকে স্পার্ক ডেটা ফ্রেমে রূপান্তরিত করব, তবে এটি ত্রুটিটি দেখাচ্ছে:
"Py4JJavaError" An error occurred while calling o28.applySchemaToPythonRDD. : java.lang.RuntimeException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
আমার কোডটি হ'ল:
from pyspark import SparkContext
from pyspark.sql import SQLContext
import pandas as pd
sqlc=SQLContext(sc)
df=pd.read_csv(r'D:\BestBuy\train.csv')
sdf=sqlc.createDataFrame(df)