నిర్వచనం
సింథటిక్ డేటా అనేది వాస్తవ ప్రపంచ డేటాను అనుకరించే కృత్రిమంగా ఉత్పత్తి చేయబడిన సమాచారం. దీనిని అనుకరణలు, GANలు లేదా ఇతర ఉత్పాదక పద్ధతులను ఉపయోగించి సృష్టించవచ్చు.
పర్పస్
వాస్తవ డేటా కొరతగా, సున్నితంగా లేదా సేకరించడానికి ఖరీదైనదిగా ఉన్నప్పుడు దాన్ని పెంచడం లేదా భర్తీ చేయడం దీని ఉద్దేశ్యం.
ప్రాముఖ్యత
- వ్యక్తిగత డేటాపై ఆధారపడటాన్ని తగ్గించడం ద్వారా గోప్యతను రక్షిస్తుంది.
- అరుదైన లేదా తీవ్రమైన కేసులకు శిక్షణను అనుమతిస్తుంది.
- వాస్తవ ప్రపంచ డేటా యొక్క పూర్తి సంక్లిష్టత లేకపోవచ్చు.
- భద్రతకు కీలకమైన AIలో ఎక్కువగా ఉపయోగించబడుతోంది.
అది ఎలా పని చేస్తుంది
- ప్రతిరూపం చేయడానికి డేటా లక్షణాలను నిర్వచించండి.
- డేటాను సృష్టించడానికి అనుకరణ లేదా ఉత్పాదక నమూనాలను ఉపయోగించండి.
- నిజమైన పంపిణీలకు వ్యతిరేకంగా సింథటిక్ డేటాను ధృవీకరించండి.
- శిక్షణ పైప్లైన్లలో సింథటిక్ డేటాను ఉపయోగించండి.
- వాస్తవికతలో అంతరాలను పర్యవేక్షించండి.
ఉదాహరణలు (వాస్తవ ప్రపంచం)
- వేమో: స్వయంప్రతిపత్తి శిక్షణ కోసం సింథటిక్ డ్రైవింగ్ దృశ్యాలను ఉపయోగిస్తుంది.
- NVIDIA Omniverse: రోబోటిక్స్ కోసం సింథటిక్ 3D డేటాను ఉత్పత్తి చేస్తుంది.
- ఆరోగ్య సంరక్షణ: పరిశోధన కోసం సింథటిక్ రోగి డేటా.
సూచనలు / తదుపరి పఠనం
- సింథటిక్ డేటాపై NIST ప్రత్యేక ప్రచురణ.
- గోన్కాల్వ్స్ మరియు ఇతరులు. “సింథటిక్ డేటా ఉత్పత్తి మరియు మూల్యాంకనం.” ACM కంప్యూటింగ్ సర్వేలు.
- సింథటిక్ డేటా వాల్ట్ (MIT).
- AI లో సింథటిక్ డేటా అంటే ఏమిటి