चीन में लगातार हो रहे सिरदर्द कोपेकट पेपर्स का झंडा

शंघाई, चीन सर्च इंजन में अनुक्रमित पत्रिकाओं में रुझानों की खोज करने वाले दो कम्प्यूटेशनल बायोलॉजिस्ट्स ने संकेत भर में ठोकर खाई कि चाइना की पेपर-सेलिंग कंपनियां सक्रिय रहती हैं, 1 साल बाद विज्ञान ने एक विस्तृत अंडरकवर प्रकाशित किया जिसमें एक अत्यधिक परिष्कृत और वर्णन किया गया है आकर्षक उद्योग।

बार्सिलोना में दोनों के लिए सेंटर ऑफ़ जीनोमिक रेगुलेशन और ल्यूकस केरी के गुइल्यूम फिल्म्स ने बार्सिलोना में जनवरी 2012 और इस पिछले अप्रैल के बीच प्रकाशित होने वाले पत्रों के लिए सभी PubMed रिकॉर्ड डाउनलोड किए। प्राकृतिक भाषा प्रसंस्करण नामक एक बड़ी डेटा तकनीक का उपयोग करके उन 2 मिलियन कागजात के लिए सार पर आते हुए, उन्होंने उन शब्दों को अलग कर दिया जो 2014 में उपयोग में आए थे।

वे उम्मीद करते थे कि aboutnew विषयों के बारे में पता लगाने के लिए, Filion कहते हैं। आश्चर्य की बात नहीं है, उन्हें कागजों में एक अपसेट मिला, जिसमें CRISPR जैसे अत्याधुनिक विषयों का उल्लेख है, एक जीन-एडिटिंग तकनीक जिसे विज्ञान Break 2013 के लिए उपविजेता का नाम दिया गया था, और lncRNA, या लंबे गैर-कोडिंग RNA आरएनए का एक असामान्य रूप से लंबा रूप है जो अब जीनोमिक्स में एक गर्म विषय है

लेकिन उन अधिक पूर्वानुमान योग्य रुझानों के साथ, एक शब्द समाप्त हो गया: लंदन में CISCOM नामक पूरक चिकित्सा के लिए अनुसंधान परिषद द्वारा संचालित एक अल्पज्ञात डेटाबेस, या पूरक चिकित्सा के लिए केंद्रीकृत सूचना सेवा। 2013 तक, विद्वानों ने ध्यान दिया, CISCOM in शब्द प्रति वर्ष केवल दो से तीन पत्रों में दिखाई दिया। फरवरी में, डेटाबेस ने सप्ताह में एक बार क्रॉप करना शुरू किया।

अधिक बारीकी से देखने पर, Filion और कैरी को अलग-अलग विषयों पर 32 पेपरों का एक समूह मिला, जो फिर भी कुछ उत्सुक विशेषताओं को साझा करते थे। सभी मेटा-विश्लेषण या समीक्षा पत्र थे जिन्होंने पहले से प्रकाशित डेटा का विश्लेषण CISCOM में किया था, साथ ही साथ Google विद्वान, पबमेड और वेब ऑफ साइंस जैसे अधिक सामान्यतः उपयोग किए जाने वाले डेटाबेस के साथ। इसके अलावा, सभी 28 शहरों में फैले 28 विभिन्न अनुसंधान समूहों से चीन में उत्पन्न हुए।

4 अक्टूबर को प्रकाशित एक ब्लॉग पोस्ट में urbdisturbately इसी तरह के कागजात को क्या कहते हैं, इसका वर्णन करने वाले Filion ने कैरी के साथ मिलकर यह निर्धारित किया कि क्या चल रहा था। उन्होंने उन 25 पत्रों के पूर्ण संस्करण डाउनलोड किए, जिनके लिए विभिन्न संस्थागत सदस्यता या अन्य माध्यमों से उनकी पहुँच थी। (सभी लेकिन दो पेपर एक पे दीवार के पीछे हैं।) साहित्यिक चोरी का पता लगाने वाले कार्यक्रम iThenticate के माध्यम से कागजात को चलाने से कोई लाल झंडे नहीं निकले।

लेकिन सभी पत्रों के चर्चा अनुभागों में एक जैसे कथन होते हैं, जिनमें केवल मामूली बदलाव होते हैं। उदाहरण के लिए, एक पेपर पढ़ता है, जाहिर है, सभी शामिल अध्ययनों में मामलों और नियंत्रणों के समावेश मानदंड अच्छी तरह से परिभाषित नहीं किए गए हैं और इस तरह से हमारे परिणामों को प्रभावित किया जा सकता है। एक और राज्य, antlyIportportantly, शामिल किए जाने के मापदंड सभी शामिल अध्ययनों में मामलों और नियंत्रणों को अच्छी तरह से परिभाषित नहीं किया गया था, जो हमारे परिणामों को प्रभावित कर सकते थे

चार पत्रों में एक ही व्याकरणिक त्रुटि शामिल है। बाहरी परिणामों में oushad में पर्याप्त सांख्यिकीय शक्ति का अभाव था। लेकिन कागजात के बीच संबंधों को मैप करने में, दोनों ने देखा कि लगता है कि लेखक कई खाके खींच रहे थे। सुझाव है कि, Filion कहते हैं, लेखकों को सक्रिय रूप से पाठ laundering के रूप में जाना जाता साहित्यिक चोरी का पता लगाने सॉफ्टवेयर के ग्रंथ विधि की फेरबदल।

अधिकांश कागजात 2013 के अंत में प्रस्तुत किए गए थे, जिससे यह असंभव हो गया कि कुछ लेखकों ने प्रकाशन के बाद दूसरों को लूट लिया। फिलामेंट और कैरी ने इस तरह परिकल्पना की कि कागजात सभी एक ही कंपनी का काम हो सकते हैं। शंघाई के फुडन विश्वविद्यालय में एक आनुवंशिकीविद् याओ यू की मदद से, विद्वानों ने एक संगठन की पहचान की, जिसकी वेबसाइट ने मेटा-विश्लेषण पत्रों के अनुरूप विज्ञापन किया और कंपनी से उसकी सेवाओं के बारे में पूछताछ करने के लिए संपर्क किया। कंपनी कथित तौर पर $ 10, 000 के लिए 2 या 3 के प्रभाव कारक के साथ पत्रिकाओं के लिए मेटा-विश्लेषण पत्र प्रदान करती है।

पिछले साल विज्ञान में प्रकाशित 5 महीने की जांच में दर्जनों ऐसी ही कंपनियां मिलीं, जो थॉमसन रॉयटर्स के साइंस कैंटीन इंडेक्स, थॉमसन रॉयटर्स के सोशल साइंसेज केटेशन इंडेक्स, या एल्सेवियर इंजीनियरिंग इंडेक्स में प्रकाशित पत्रिकाओं के प्रकाशन के उद्देश्य से दर्जनों सेवाएं प्रदान कर रही हैं। कई चीनी संस्थान पदोन्नति हासिल करने के लिए महत्वपूर्ण हैं। अपने ग्राहकों द्वारा प्रदान किए गए डेटा के साथ खरोंच से मूल कागजात तैयार करने के अलावा, चीन की पेपर बेचने वाली कंपनियां डेटा तैयार करती हैं, वैज्ञानिकों के नामों को पहले से ही स्वीकार किए गए कागजात को जोड़ने और तैयार पांडुलिपियों को बेचने की व्यवस्था करती हैं।

समाप्त पांडुलिपियों के लिए सबसे लोकप्रिय विकल्पों में मेटा-विश्लेषण हैं, शायद इसलिए कि उन्हें मूल डेटा की आवश्यकता नहीं है। जून 2013 में पीएलओएस वन में प्रकाशित एक वैध विश्लेषण में पाया गया कि 2003 से 2011 तक, चीन से मेटा-एनालिसिस पेपर संयुक्त राज्य अमेरिका से इस तरह के कागजात की तुलना में 16 गुना अधिक तेजी से बढ़े। अन्य रुझानों के लिए PubMed आने से खराबी के अधिक प्रमाण सामने आ सकते हैं। लेकिन फिलियन का कहना है कि वह और कैरी अब अपना ध्यान अन्य विषयों की ओर मोड़ने की योजना बना रहे हैं: "हम चुड़ैल-शिकारी नहीं हैं, हम बड़े डेटा विश्लेषक हैं।"