নিউমার.ই এখন কিছুটা সময় হয়ে গেছে এবং ওয়েবে কেবলমাত্র কয়েকটি পোস্ট বা অন্যান্য আলোচনা রয়েছে বলে মনে হচ্ছে।
সিস্টেম সময়ে সময়ে পরিবর্তিত হয়েছে এবং আজ সেটআপটি নিম্নলিখিত:
- [0,1] এবং বাইনারি টার্গেটে অবিচ্ছিন্ন মান সহ 21 টি বৈশিষ্ট্য সহ ট্রেন (এন = 96 কে) এবং পরীক্ষা (এন = 33 কে) ডেটা।
- ডেটা পরিষ্কার (কোনও মূল্য নেই) এবং প্রতি 2 সপ্তাহে আপডেট হয়। আপনি আপনার পূর্বাভাস (পরীক্ষার সেটটিতে) আপলোড করতে এবং লগ-ক্ষতি দেখতে পারেন। পরীক্ষার ডেটার অংশটি হ'ল লাইভ ডেটা এবং আপনি ভাল পূর্বাভাসের জন্য অর্থ প্রদান করেন।
আমি যা আলোচনা করতে চাই:
বৈশিষ্ট্যগুলি সম্পূর্ণ বেনামে থাকাকালীন আমি মনে করি যে খুব বেশি বৈশিষ্ট্যযুক্ত ইঞ্জিনিয়ারিং আমরা করতে পারি না। সুতরাং আমার পদ্ধতির খুব যান্ত্রিক:
- অনুপ্রাণিত দ্বারা এই আমি একটি শ্রেণীবিভাগ অ্যালগরিদম ব্যবহার করেন প্রশিক্ষণ ডেটা যা আমার টেস্ট ডেটার সেরা মাপসই করা হবে ফিল্টার করার জন্য।
- কিছু সুন্দর প্রাকপ্রসেসিং বের করুন
- সুন্দর শ্রেণিবদ্ধকরণ অ্যালগরিদম প্রশিক্ষণ
- তাদের ensembles তৈরি (স্ট্যাকিং, ..)।
কংক্রিট প্রশ্ন:
পদক্ষেপ 1 সম্পর্কিত: আপনার কি এই জাতীয় পদ্ধতির অভিজ্ঞতা আছে? ধরা যাক আমি ট্রেনের নমুনাগুলির পরীক্ষার সাথে সম্পর্কিত হওয়ার সম্ভাবনাটি আদেশ করি (সাধারণত 0.5 এর নীচে) এবং তারপরে আমি বৃহত্তম কে সম্ভাব্যতা গ্রহণ করি। আপনি কে কে বেছে নেবেন? আমি 15 কে দিয়ে চেষ্টা করেছি .. তবে প্রধানত 3 ধাপে প্রশিক্ষণের গতি বাড়ানোর জন্য একটি ছোট প্রশিক্ষণের ডেটা সেট করা আছে।
পদক্ষেপ 2 সম্পর্কিত: ডেটা ইতিমধ্যে 0,1 স্কেলে। আমি যদি কোনও (পিসিএ লাইক) লিনিয়ার ট্রান্সফর্মেশন প্রয়োগ করি তবে আমি এই স্কেলটি ভেঙে ফেলব। আপনি যদি এমন সংখ্যাসূচক ডেটা রাখেন এবং এটি আসলে কী তা জানেন না তবে আপনি প্রিপ্রোসেসিংয়ে কী চেষ্টা করবেন?
PS: আমি জানি যেহেতু numer.ai এই বিষয়ে আলোচনা করা লোককে অর্থ প্রদান করে তা আমাকে কিছু অর্থোপার্জনে সহায়তা করতে পারে। তবে এটি সর্বজনীন হওয়ায় এখানকার যে কাউকে সাহায্য করবে ...
পিপিএস: আজকের লিডারবোর্ডটিতে একটি আকর্ষণীয় প্যাটার্ন রয়েছে: 0.64xx এর লগলাস সহ শীর্ষ দুটি, তারপরে 0.66xx সহ 3 নম্বরে এবং তারপরে বেশিরভাগ ভবিষ্যদ্বাণী 0.6888x এ পৌঁছে যায়।
সুতরাং এখানে খুব ছোট একটি শীর্ষ ক্ষেত্র এবং প্রচুর পরিমিতরূপে সফল ছেলে আছে (আমাকে সহ) বলে মনে হচ্ছে।