arff - Handling % sign in the string attribute in weka -


मेरे पास एक एआरएफ फाइल है जो इस तरह की है

  @relation training_set @attribute URL स्ट्रिंग @ एटिबूट डीओआई न्यूमेरिक @ एटिबिट आईबीएन न्यूमेरिक @ डिटेक्टिव निष्कर्ष न्यूमेरिक @ एट्रिब्यूट सोर्सटॉफी {वैज्ञानिक, गैर-वैज्ञानिक} @डेटा http://www.nejm.org/doi/full/10.1056/nejmra1002842, 0, 0, 1, 0, वैज्ञानिक http : //www.plosone.org/article/info%3adoi%2f10.1371%2fjournal.pone.0014270#pone-0014270-t003, 1, 0, 1, 0, वैज्ञानिक  

मुझे यह फाइल लोड करने में समस्या है क्योंकि मुझे यूआरएल डेटा में "%" चिह्न है I मुझे पता है कि% को वीका में टिप्पणी के रूप में माना जाता है, लेकिन क्या इस तरह की स्ट्रिंग लाने का कोई तरीका है? मैं यूआरएल को नाममात्र आंकड़े के रूप में नहीं बना रहा हूं क्योंकि यह प्रशिक्षण सेट में पहचानकर्ता है?

लपेटकर सिंगल-कोट्स में स्ट्रिंग, मैं आपकी फ़ाइल को सफलतापूर्वक Weka में लोड करने में सक्षम था (मैंने आपके डेटा की संरचना से मिलान करने के लिए एक अन्य विशेषता भी जोड़ा है):

  @relation training_set @attribute url string @ विशेषता आईओआई संख्यात्मक @ वरीयता आईबीएम संख्यात्मक @ पहुंच निष्कर्ष संख्यात्मक @ एटिट्यूड बाइनरी न्यूमेरिक @ एट्रिब्यूट स्रोत टाईप {वैज्ञानिक, गैर-वैज्ञानिक} @ डेटा 'http://www.nejm.org/doi/full/10.1056/nejmra1002842', 0, 0, 1 , 0, वैज्ञानिक 'http://www.plosone.org/article/info%3adoi%2f10.1371%2fjournal.pone.0014270#pone-0014270-t003', 1, 0, 1, 0, वैज्ञानिक  

आशा है कि यह मदद करता है!


Comments

Popular posts from this blog

apache - 504 Gateway Time-out The server didn't respond in time. How to fix it? -

c# - .net WebSocket: CloseOutputAsync vs CloseAsync -

c++ - How to properly scale qgroupbox title with stylesheet for high resolution display? -