జర్నల్ ఆఫ్ కంప్యూటర్ ఇంజనీరింగ్ & ఇన్ఫర్మేషన్ టెక్నాలజీ

చిన్న డేటా యొక్క అర్థం మరియు మైనింగ్‌కు భిన్నమైన విధానం

ర్యాన్ హెచ్ రిండ్లిస్బాచెర్

పెద్ద డేటా అనేది డేటా మైనింగ్‌లో ఆవేశంగా ఉంటుంది కానీ సాధారణంగా పెద్ద వ్యాపారాలకు మాత్రమే పరిమితం చేయబడింది. చిన్న డేటా సాధారణంగా పెద్ద డేటా యొక్క ఉపసమితిగా భావించబడుతుంది. ఉదాహరణకు, Google శోధన కోసం ఉపయోగించే ట్రిలియన్ల రికార్డులను కలిగి ఉంది, కానీ ఇది దానికదే ఉపయోగకరంగా ఉండదు. ఎవరైనా Googleలో ఏదైనా శోధించినప్పుడు, సాధారణంగా మొదటి పేజీలో పది నుండి పదిహేను ఫలితాలు మాత్రమే చూపబడతాయి. ఇది జరగడానికి, గూగుల్ పెద్ద డేటాను తీసుకొని చిన్న డేటాను ఉత్పత్తి చేసింది. నిజమైన విలువ చిన్న డేటా ఉపసమితుల్లో ఉంటుంది. ఈ ఆలోచన, అయితే, చిన్న డేటా అనేది పెద్ద డేటా యొక్క ఉపసమితి, చిన్న డేటాకు మాత్రమే నిర్వచనం కాదు. చిన్న డేటాను మాత్రమే ఉత్పత్తి చేసే చిన్న వ్యాపారాలు డేటా మైనింగ్ పద్ధతుల నుండి కూడా ప్రయోజనం పొందవచ్చు. చిన్న డేటాను మాత్రమే చూసేటప్పుడు ఏ సమస్యలు తలెత్తుతాయి?

నిరాకరణ: ఈ సారాంశం ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ టూల్స్ ఉపయోగించి అనువదించబడింది మరియు ఇంకా సమీక్షించబడలేదు లేదా నిర్ధారించబడలేదు