পাইথন মেশিন লার্নিং / ডেটা সায়েন্স প্রকল্পের কাঠামো


10

পাইথন মেশিন লার্নিং প্রকল্পটি কীভাবে সংগঠিত করা উচিত সে সম্পর্কে আমি তথ্য খুঁজছি। পাইথন স্বাভাবিক প্রকল্পের জন্য আছে Cookiecutter এবং R জন্য ProjectTemplate

এটি আমার বর্তমান ফোল্ডার কাঠামো, তবে আমি জপিটার নোটবুকগুলি প্রকৃত পাইথন কোডের সাথে মিশ্রিত করছি এবং এটি খুব পরিষ্কার বলে মনে হয় না।

.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools

আমি স্ক্রিপ্টস ফোল্ডারে কাজ করি এবং বর্তমানে আমার_মডিউলের অধীনে ফাইলগুলিতে সমস্ত ফাংশন যুক্ত করছি তবে এটি ডেটা লোড করার ক্ষেত্রে ত্রুটি বাড়ে (আপেক্ষিক / পরম পাথ) এবং অন্যান্য সমস্যা।

কিছু কাগজ প্রতিযোগিতার সমাধান এবং এই জাতীয় নোটবুকের শুরুতে সমস্ত ফাংশন সংশ্লেষিত কিছু নোটবুক ছাড়াও আমি এই বিষয়ে যথাযথ সেরা অনুশীলনগুলি বা ভাল উদাহরণগুলি খুঁজে পাইনি।


এটি সাহায্য করে কিনা তা দেখুন (কোনও ব্যক্তিগত অভিজ্ঞতা নেই)।
এমরে

উত্তর:


4

আমি মনে করি না এই বিকাশকারী অঞ্চলে এখনও সেরা অনুশীলন রয়েছে তবে কুকি কিউটর ছাড়াও সায়পাই ২০১ conference সম্মেলনে একটি টিউটোরিয়ালে কিছু আকর্ষণীয় ধারণা প্রদর্শিত হয়েছিল: http://isaacslavitt.com/2016/07/20/ ডেটা-বিজ্ঞান-is-সফ্টওয়্যার আলাপ /

ব্যক্তিগতভাবে, আমি কোনও প্রকল্পে সাব-ফোল্ডারগুলির সংখ্যা হ্রাস করার চেষ্টা করি যদি না আমার কাছে তাদের পার্থক্য করার সত্যিই ভাল উপায় থাকে এবং সেগুলি আলাদা রাখার উপযুক্ত কারণ না থাকে। খারাপ সংগঠন প্রায় কোনও সংস্থা হিসাবে খারাপ। আমি মনে করি সেরা অনুশীলন ব্যবহারের ক্ষেত্রে নির্ভর করতে পারে - প্রতিটি প্রকল্পের সমান পরিমাণ বয়লারপ্লেটের প্রয়োজন হয় না।


3

ওয়াশিংটন বিশ্ববিদ্যালয় ছোট বৈজ্ঞানিক পাইথন প্রকল্প (ডাটা বিজ্ঞান প্রকল্প সহ) নামক একটি প্রকল্পের টেমপ্লেট প্রকাশ করেছে shablona। আপনি যা খুঁজছেন তা কি কম কি কম?

https://github.com/uwescience/shablona

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.