నిర్వచనం
డేటా డి-ఐడెంటిఫికేషన్ అంటే డేటాసెట్ల నుండి వ్యక్తిగతంగా గుర్తించదగిన సమాచారం (PII) ను తొలగించడం లేదా దాచిపెట్టడం, తద్వారా వ్యక్తులను సులభంగా గుర్తించలేరు. సాంకేతికతలలో అనామకీకరణ మరియు సూడోనిమైజేషన్ ఉన్నాయి.
పర్పస్
విశ్లేషణ, పరిశోధన మరియు AI మోడల్ శిక్షణ కోసం డేటాను ఉపయోగించడానికి అనుమతిస్తూనే గోప్యతను రక్షించడం దీని ఉద్దేశ్యం. ఇది GDPR మరియు HIPAA వంటి చట్టాలకు అనుగుణంగా ఉండేలా చేస్తుంది.
ప్రాముఖ్యత
- గోప్యతా ఉల్లంఘనల ప్రమాదాన్ని తగ్గిస్తుంది.
- నియంత్రణ సమ్మతికి అవసరం.
- డేటా యుటిలిటీని గోప్యతతో సమతుల్యం చేస్తుంది.
- అసంపూర్ణంగా గుర్తింపు తొలగించడం వలన తిరిగి గుర్తింపు ప్రమాదాలు సంభవించవచ్చు.
అది ఎలా పని చేస్తుంది
- వ్యక్తిగత గుర్తింపుదారులను (పేర్లు, చిరునామాలు, బయోమెట్రిక్ డేటా) గుర్తించండి.
- మాస్కింగ్, జనరలైజేషన్ లేదా ఎన్క్రిప్షన్ వంటి పద్ధతులను వర్తించండి.
- తిరిగి గుర్తించే ప్రమాదం తగ్గించబడిందని ధృవీకరించండి.
- ఆడిటింగ్ ప్రక్రియను డాక్యుమెంట్ చేయండి.
- గుర్తించబడని డేటాను సురక్షితంగా నిల్వ చేయండి మరియు పంచుకోండి.
ఉదాహరణలు (వాస్తవ ప్రపంచం)
- వైద్య పరిశోధన కోసం ఆరోగ్య సంరక్షణ డేటాసెట్ల గుర్తింపు తొలగించబడింది.
- ఆపిల్ యొక్క iOS: వినియోగదారు విశ్లేషణలకు అవకలన గోప్యతను వర్తింపజేస్తుంది.
- US సెన్సస్ బ్యూరో: జనాభా డేటా కోసం గుర్తింపును తొలగించే పద్ధతులను ఉపయోగిస్తుంది.
సూచనలు / తదుపరి పఠనం
- NIST స్పెషల్ పబ్లికేషన్ 800-188: డేటా గుర్తింపును తొలగించడం.
- ISO/IEC 20889: గోప్యతను పెంచే డేటా డి-ఐడెంటిఫికేషన్.
- అనామకీకరణపై GDPR మార్గదర్శకాలు — యూరోపియన్ డేటా రక్షణ బోర్డు.
- డేటా డి-ఐడెంటిఫికేషన్ & అనామక పరిష్కారాలు