నిర్వచనం
టెక్స్ట్ గుర్తింపు అనేది చిత్రాలు లేదా స్కాన్ చేసిన పత్రాలలోని టెక్స్ట్ అక్షరాల గుర్తింపును సూచిస్తుంది. ఇందులో ముద్రిత మరియు చేతితో రాసిన గుర్తింపు ఉంటుంది.
పర్పస్
దృశ్య ఫార్మాట్లలోని వచనాన్ని ప్రాప్యత చేయగల మరియు శోధించదగినదిగా చేయడమే దీని ఉద్దేశ్యం.
ప్రాముఖ్యత
- ఆర్కైవ్ల డిజిటలైజేషన్ను ప్రారంభిస్తుంది.
- యాక్సెసిబిలిటీ మరియు ఆటోమేషన్ కోసం కీలకం.
- ఖచ్చితత్వం చిత్ర నాణ్యతపై ఆధారపడి ఉంటుంది.
- OCR టెక్నాలజీలకు సంబంధించినది.
అది ఎలా పని చేస్తుంది
- స్కాన్ చేసిన లేదా ఫోటో తీసిన పత్రాలను సంగ్రహించండి.
- స్పష్టతను మెరుగుపరచడానికి చిత్రాలను ముందస్తుగా ప్రాసెస్ చేయండి.
- టెక్స్ట్ ప్రాంతాలను గుర్తించండి.
- గుర్తింపు నమూనాలను వర్తించండి.
- యంత్రం చదవగలిగే వచనాన్ని అవుట్పుట్ చేయండి.
ఉదాహరణలు (వాస్తవ ప్రపంచం)
- గూగుల్ లెన్స్: ఫోటోలలోని వచనాన్ని గుర్తిస్తుంది.
- ABBYY FineReader: స్కాన్ చేసిన పత్రాలను డిజిటలైజ్ చేస్తుంది.
- టెస్సెరాక్ట్ OCR: ఓపెన్-సోర్స్ టెక్స్ట్ రికగ్నిషన్ ఇంజిన్.
సూచనలు / తదుపరి పఠనం
- స్మిత్, ఆర్. “టెస్సెరాక్ట్ OCR ఇంజిన్ యొక్క అవలోకనం.” ICDAR.
- ISO/IEC 15938-4 ప్రమాణం.
- నమూనా విశ్లేషణ మరియు యంత్ర మేధస్సుపై IEEE లావాదేవీలు.