আমার কাছে একটি স্পার্ক স্ট্রিমিং অ্যাপ্লিকেশন রয়েছে যা প্রতি মিনিটের জন্য একটি ডেটাसेट তৈরি করে। প্রক্রিয়াজাত ডেটার ফলাফলগুলিকে আমার সংরক্ষণ / ওভাররাইট করতে হবে।
আমি যখন ডেটাসেট org.apache.hadoop.mapred.FileAlreadyExistsException ডেটাসেট ওভাররাইট করার চেষ্টা করেছি তখন এক্সিকিউশনটি থামিয়ে দেয়।
আমি স্পার্ক সম্পত্তি সেট set("spark.files.overwrite","true")
, কিন্তু কোন ভাগ্য নেই।
কিভাবে ওভাররাইট বা স্পার্ক থেকে ফাইলগুলি প্রিডিলেট করবেন?
set("spark.files.overwrite","true")
যোগ এর মধ্য দিয়ে ফাইল কেবল কাজ করেspark.addFile()