পরীক্ষা চালিয়ে যায় ফলাফল এবং ফলাফল


11

আমি গবেষকের একজন হাত এবং আমি ব্যবহার্য সমাধানগুলি পরীক্ষা করতে পছন্দ করি, তাই আমার প্রচুর পরীক্ষা চালানোর ঝোঁক থাকে। উদাহরণস্বরূপ, আমি যদি দস্তাবেজের মধ্যে সাদৃশ্য স্কোর গণনা করি তবে আমি অনেকগুলি পদক্ষেপ চেষ্টা করে দেখতে চাই। আসলে, প্রতিটি পরিমাপের জন্য কিছু পরামিতিগুলির প্রভাব পরীক্ষা করতে আমার কয়েকটি রান করতে হবে।

এখনও অবধি, আমি ইনপুট সম্পর্কে যতটা তথ্য দিয়ে ফাইলগুলিতে ফলাফলগুলি লিখে রানের ইনপুটগুলি এবং তার ফলাফলগুলি ট্র্যাক করছি। সমস্যাটি হ'ল কোনও নির্দিষ্ট ফলাফল পুনরুদ্ধার করা কখনও কখনও চ্যালেঞ্জ হয়ে যায়, এমনকি আমি যদি ফাইলের নামের সাথে ইনপুট তথ্য যুক্ত করার চেষ্টা করিও। আমি ফলাফলের লিঙ্কগুলির সাথে একটি স্প্রেডশিট ব্যবহার করার চেষ্টা করেছি তবে এটি কোনও বিশাল পার্থক্য করছে না।

আপনার পরীক্ষাগুলি রাখার জন্য আপনি কোন সরঞ্জাম / প্রক্রিয়া ব্যবহার করেন?


1
আমি ট্যাগটি সেরা-অনুশীলনগুলি যুক্ত করতে চেয়েছিলাম তবে যেহেতু আমার কাছে 150 খ্যাতি পয়েন্ট নেই I সত্যি কথা বলতে, আমি বুঝতে পারি না যে এই জাতীয় সমস্ত নিয়ম সহ কোনও নতুন আগত কীভাবে কার্যকরভাবে সাইটটিতে একজন অবদানকারী হতে পারে। আমি প্রচুর প্রশ্ন দেখতে পেয়েছি যার জন্য আমি উত্তরগুলি জানি, তবে উত্তরটি ইতিমধ্যে থাকলে আমি উত্তর দিতে বা আপ করতে পারি না।
মেশিন-জ্ঞান

আমি মনে করি এটি একটি জেনেরিক প্রোগ্রামিং প্রশ্ন বেশি, সুতরাং স্ট্যাকওভারফ্লো আরও ভাল হতে পারে। আপনি যা করার চেষ্টা করছেন তার একটি স্নিপেট অন্তর্ভুক্ত করতে পারেন এবং এটি কেন ধীর, এবং প্রস্তাবিত অপ্টিমাইজেশনের জন্য জিজ্ঞাসা করতে পারেন।
শন ওওন

আসলে আমি মনে করি opendata.stackexchange.com আরও ভাল ফিট হবে।
এমরে

1
আমি সম্প্রতি এমন পণ্যগুলির জন্য বাজারের চারপাশ ঘুরে দেখেছি যা সেগুলির সাথে সহায়তা করে এবং আমি আমার অনুসন্ধানগুলি ভাগ করতে চাই। দুটি SAAS পণ্য রয়েছে যা পাইথন এবং আর-তে করা বিশ্লেষণগুলি ভাগ করতে কোনও ডেটা সায়েন্স টিমকে সহায়তা করতে পারে They তাদের দুজনেরই আইডিইয়ের মতো আইপিথন নোটবুক রয়েছে এবং তারা উভয়ই এটির কাজ চালানোর এবং ভাগ করে নেওয়ার জন্য অনেকগুলি বৈশিষ্ট্য তৈরি করে। আমি তাদের উভয়কেই প্রায় অভিন্ন দেখতে পেয়েছি: [ডোমিনো ডেটা ল্যাব] [১] এবং [সেনস.আইও] [২] [১]: প্রভোড্যাটালব.কম [২]: জ্ঞান.ও
যন্ত্র-বুদ্ধি

হ্যাডোপের জন্য একটি মেশিন লার্নিংয়ের পরিবেশও রয়েছে, যা জব রানের উপর নজর রাখে; [h2o.ai] [3]। এটি ডেটা দলের কাজকে আরও সহজ করার জন্য একটি সরঞ্জাম হওয়ার জন্য নয়, তবে কিছু সাবধানতার সাথে নামকরণের সম্মেলনগুলির সাহায্যে এটি অনেক সাহায্য করতে পারে। এইটি [3]: h2o.ai
যন্ত্র-বুদ্ধি

উত্তর:


5

আপনি HTTP থেকে দেখতে চাইতে পারেন: //ডিপলাইনিং ডটকম / সোফটওয়্যার / জবম্যান / সিন্ট্রো html

এটি গভীর শিক্ষার জন্য তৈরি করা হয়েছিল (আমার ধারণা), তবে এটি অ্যাপ্লিকেশন অজিনস্টিক। এটি কার্যকরভাবে সানইস্টারগুলির পদ্ধতির একটি এপিআই সংস্করণ


5

আমি সম্প্রতি একটি অনুরূপ সমস্যার মধ্যে দৌড়েছি: কীভাবে একটি বড় ডেটাসেট থেকে বিভিন্ন বৈশিষ্ট্য নিষ্কাশন পরিচালনা করতে হবে, সেগুলির সমস্ত কী হবে তা সামনে না জেনে। (এমনকি বারবার গড় মানগুলি গণনা করা গণনাগতভাবে ব্যয়বহুল হবে,) আরও, কীভাবে আমি বিভিন্ন বৈশিষ্ট্য সেটের উপর ভিত্তি করে পূর্বাভাসগুলি পরিচালনা করব? অর্থ, যদি আমি একটি নতুন বৈশিষ্ট্য যুক্ত করি তবে কীভাবে জানব যে কোন মডেলগুলি নতুন বৈশিষ্ট্যগুলিতে প্রশিক্ষণ দেবেন? এটি দ্রুত একটি বিশাল জগাখিচুড়ি মধ্যে তুষারবল পারে।

আমার বর্তমান সমাধানটি কোনও স্থানীয় নোএসকিউএল ডাটাবেসে (মঙ্গোডিবি) এগুলি ট্র্যাক করা। উদাহরণস্বরূপ, আমার কাছে একটি সংগ্রহ থাকতে পারে features, যার প্রতিটি প্রবেশের একটি নাম, বৈশিষ্ট্যটি কীভাবে গণনা করা হয়েছিল তার বিবরণ, নিষ্কাশন চালানো অজগর ফাইল ইত্যাদি etc.

তেমনি, কোনও সংকলনে modelsডেটা চালিত মডেলগুলি অন্তর্ভুক্ত থাকে। প্রতিটি প্রবেশের একটি নাম থাকতে পারে, এমন বৈশিষ্ট্যগুলির একটি তালিকা যা মডেলটি প্রশিক্ষণের জন্য ব্যবহৃত হয়েছিল, এর চূড়ান্ত পরামিতিগুলি, একটি আউট-আউট টেস্ট সেটটিতে পূর্বাভাসকৃত মানগুলি, মডেলটি কীভাবে সম্পাদন করেছিল তার জন্য মেট্রিকস ইত্যাদি have

আমার কার্যকর অবস্থান থেকে, এর অনেকগুলি সুবিধা রয়েছে:

  • পূর্বাভাসগুলি সংরক্ষণ করে, আমি সেগুলি পরে ভবিষ্যদ্বাণীগুলিতে ব্যবহার করতে পারি।
  • কোন বৈশিষ্ট্যগুলি ব্যবহৃত হয়েছিল সে সম্পর্কে আমি নজর রাখি, কারণ আমি আরও বৈশিষ্ট্যগুলি নিষ্কাশন করার সাথে সাথে কোনটি পুনরায় প্রশিক্ষণের প্রয়োজন তা আমি জানি।
  • মডেল বর্ণনাগুলি সংরক্ষণ করে, আমি নিশ্চিত হয়েছি যে আমি কী চেষ্টা করেছি তা সর্বদা জানি। আমাকে কখনই ভাবতে হবে না, "গ্রিড-সার্চ সিভি দ্বারা নির্ধারিত নিয়মিতকরণ পরামিতিগুলি দিয়ে আমি কি লাসো চেষ্টা করেছি?" আমি সর্বদা এটি সন্ধান করতে পারি এবং এটি কতটা সফল হয়েছিল তা দেখতে পাচ্ছি।

আপনার প্রশ্ন থেকে, মনে হচ্ছে আপনি এই পদ্ধতির আপনার সমস্যার কর্মপ্রবাহের সাথে মানিয়ে নিতে পারেন। মোঙ্গো বা পছন্দের অন্য একটি ডাটাবেস ইনস্টল করুন এবং তারপরে প্রতিটি পরীক্ষামূলক রান, তার ইনপুট, ফলাফল এবং আরও কিছু আপনি এই প্রকল্পের কোর্সে ট্র্যাক করতে ইচ্ছুক হতে পারে সেভ করুন। কমপক্ষে কমপক্ষে স্প্রেডশিটের চেয়ে ক্যোয়ারী করা আরও সহজ হওয়া উচিত।


আমি upvote করতে চাই তবে আমার অনুমতি নেই
মেশিন-প্রজ্ঞা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.