ర్యాన్ హెచ్ రిండ్లిస్బాచెర్
పెద్ద డేటా అనేది డేటా మైనింగ్లో ఆవేశంగా ఉంటుంది కానీ సాధారణంగా పెద్ద వ్యాపారాలకు మాత్రమే పరిమితం చేయబడింది. చిన్న డేటా సాధారణంగా పెద్ద డేటా యొక్క ఉపసమితిగా భావించబడుతుంది. ఉదాహరణకు, Google శోధన కోసం ఉపయోగించే ట్రిలియన్ల రికార్డులను కలిగి ఉంది, కానీ ఇది దానికదే ఉపయోగకరంగా ఉండదు. ఎవరైనా Googleలో ఏదైనా శోధించినప్పుడు, సాధారణంగా మొదటి పేజీలో పది నుండి పదిహేను ఫలితాలు మాత్రమే చూపబడతాయి. ఇది జరగడానికి, గూగుల్ పెద్ద డేటాను తీసుకొని చిన్న డేటాను ఉత్పత్తి చేసింది. నిజమైన విలువ చిన్న డేటా ఉపసమితుల్లో ఉంటుంది. ఈ ఆలోచన, అయితే, చిన్న డేటా అనేది పెద్ద డేటా యొక్క ఉపసమితి, చిన్న డేటాకు మాత్రమే నిర్వచనం కాదు. చిన్న డేటాను మాత్రమే ఉత్పత్తి చేసే చిన్న వ్యాపారాలు డేటా మైనింగ్ పద్ధతుల నుండి కూడా ప్రయోజనం పొందవచ్చు. చిన్న డేటాను మాత్రమే చూసేటప్పుడు ఏ సమస్యలు తలెత్తుతాయి?