అరబిక్ & థాయ్ & వియత్నామీస్ & హిందీ & ఇంగ్లీష్ & చైనీస్ భాషా డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 150k
ఉల్లేఖనం: అవును
వివరణ: అరబిక్ & థాయ్ & వియత్నామీస్ & హిందీ & ఇంగ్లీష్ & చైనీస్ భాషా డేటాసెట్
అరబిక్ టెక్స్ట్ డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 1k
ఉల్లేఖనం: అవును
వివరణ: అరబిక్ టెక్స్ట్ డేటాసెట్ అరబిక్లో వ్రాయబడిన వచన నమూనాల సేకరణను కలిగి ఉంది. ఇది వార్తా కథనాలు, సోషల్ మీడియా పోస్ట్లు, సాహిత్యం మరియు సంభాషణలు వంటి వివిధ రకాల కంటెంట్లను కలిగి ఉంటుంది, విభిన్న అంశాలు మరియు వ్రాత శైలులను కలిగి ఉంటుంది. ఈ డేటాసెట్ నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ (NLP), టెక్స్ట్ క్లాసిఫికేషన్, సెంటిమెంట్ అనాలిసిస్ మరియు అరబిక్ లాంగ్వేజ్ అప్లికేషన్లలో మెషీన్ ట్రాన్స్లేషన్ వంటి పనుల కోసం ఉపయోగించబడుతుంది.
చైనీస్ & ఇంగ్లీష్ & టిబెటన్ & ఉయ్ఘర్ భాషా డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 38k
ఉల్లేఖనం: అవును
వివరణ: చైనీస్ & ఇంగ్లీష్ & టిబెటన్ & ఉయ్ఘర్ భాషా డేటాసెట్
చైనీస్ మరియు ఇంగ్లీష్ మెనూ డేటాసెట్
కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 60k
ఉల్లేఖనం: అవును
వివరణ: చైనీస్ మరియు ఇంగ్లీష్ మెనూ డేటాసెట్లో చైనీస్ మరియు ఇంగ్లీషు భాషలను కలిగి ఉన్న రెస్టారెంట్ మెనుల చిత్రాలు లేదా వచన నమూనాలు ఉన్నాయి. ఇది వివిధ ఫాంట్లు, లేఅవుట్లు మరియు మెను నిర్మాణాలను కలిగి ఉంటుంది, ద్విభాషా వంటల పేర్లు, వివరణలు మరియు ధరలను ప్రదర్శిస్తుంది. ఈ డేటాసెట్ ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR), మెషిన్ ట్రాన్స్లేషన్ మరియు బహుభాషా సెట్టింగ్లలో మెను డిజిటలైజేషన్ వంటి పనులకు ఉపయోగపడుతుంది.
చైనీస్ చేతివ్రాత కంపోజిషన్ డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 3k
ఉల్లేఖనం: అవును
వివరణ: చైనీస్ చేతివ్రాత కంపోజిషన్ డేటాసెట్ కంపోజిషన్లు, వ్యాసాలు మరియు ఇతర దీర్ఘ-రూప వచనంతో సహా చేతితో వ్రాసిన చైనీస్ టెక్స్ట్ యొక్క నమూనాలను కలిగి ఉంది. ఇది వివిధ చేతివ్రాత శైలులు మరియు సంక్లిష్టత స్థాయిలను కలిగి ఉంటుంది మరియు చేతివ్రాత గుర్తింపు, వచన విశ్లేషణ మరియు యంత్ర అభ్యాస నమూనా శిక్షణ వంటి పనుల కోసం ఉపయోగించబడుతుంది.
చైనీస్ WIFI ప్రాంప్ట్ డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 1k
ఉల్లేఖనం: అవును
వివరణ: చైనీస్ WIFI ప్రాంప్ట్ డేటాసెట్లో WIFI ప్రాంప్ట్లు మరియు చైనీస్ భాషలో వ్రాయబడిన లాగిన్ స్క్రీన్లలో కనిపించే టెక్స్ట్ నమూనాలు ఉంటాయి. ఇది సాధారణంగా WIFI నెట్వర్క్లకు కనెక్ట్ చేయడానికి లేదా నిర్వహించడానికి సంబంధించిన వివిధ ప్రాంప్ట్లు, సూచనలు మరియు దోష సందేశాలను కలిగి ఉంటుంది. ఈ డేటాసెట్ టెక్స్ట్ రికగ్నిషన్, నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ మరియు నెట్వర్క్ కనెక్టివిటీ కోసం యూజర్ ఇంటర్ఫేస్లను మెరుగుపరచడం వంటి పనుల కోసం ఉపయోగించబడుతుంది.
ఇంగ్లీష్ & చైనీస్ చేతివ్రాత డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 12k
ఉల్లేఖనం: అవును
వివరణ: ఇంగ్లీష్ & చైనీస్ చేతివ్రాత డేటాసెట్లో ఇంగ్లీష్ మరియు చైనీస్ రెండు భాషలలో చేతివ్రాత నమూనాలు ఉన్నాయి, వివిధ వ్రాత శైలులు మరియు అక్షర సంక్లిష్టతలను ప్రదర్శిస్తాయి. ఇది సాధారణంగా చేతివ్రాత గుర్తింపు నమూనాల శిక్షణ మరియు మూల్యాంకనం, బహుభాషా వచన విశ్లేషణ మరియు ఇతర సంబంధిత పరిశోధనలకు మద్దతు ఇవ్వడానికి ఉపయోగించబడుతుంది. డేటాసెట్లో రెండు భాషల్లోని విభిన్న శ్రేణి అక్షరాలు, అంకెలు, పదాలు మరియు వాక్యాలు ఉంటాయి.
ఇంగ్లీష్ & చైనీస్ షాప్సైన్ డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 30k
ఉల్లేఖనం: అవును
వివరణ: ఇంగ్లీష్ & చైనీస్ షాప్సైన్ డేటాసెట్లో ఇంగ్లీష్ మరియు చైనీస్ టెక్స్ట్ రెండింటినీ ఫీచర్ చేసే షాప్ చిహ్నాల చిత్రాలు ఉన్నాయి. ఇది విభిన్న ఫాంట్లు, స్టైల్స్ మరియు ఫార్మాట్లలో ప్రదర్శించబడే స్టోర్ పేర్లు, ప్రకటనలు, ప్రమోషన్లు మరియు దిశల వంటి వివిధ సంకేతాల మూలకాలను క్యాప్చర్ చేస్తుంది. ఈ డేటాసెట్ టెక్స్ట్ డిటెక్షన్ మరియు రికగ్నిషన్, బహుభాషా దృశ్య అవగాహన మరియు ద్విభాషా సంకేతాలను వివరించడానికి కంప్యూటర్ విజన్ మోడల్లను మెరుగుపరచడం వంటి పనుల కోసం ఉపయోగించబడుతుంది.
ఇంగ్లీష్ & చైనీస్ స్పెషల్ యాంగిల్ టెక్స్ట్ డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 50k
ఉల్లేఖనం: అవును
వివరణ: ఇంగ్లీష్ & చైనీస్ స్పెషల్ యాంగిల్ టెక్స్ట్ డేటాసెట్ ఇంగ్లీషు మరియు చైనీస్ రెండింటిలోనూ వివిధ కోణాలు మరియు ఓరియంటేషన్లలో ప్రదర్శించబడే వచన చిత్రాలను కలిగి ఉంటుంది. ఇది ప్రామాణిక క్షితిజ సమాంతర ఫార్మాట్లలో ప్రదర్శించబడని సంకేతాలు, ప్రకటనలు మరియు పత్రాల వంటి మూలాధారాల నుండి వచనాన్ని కలిగి ఉంటుంది. ఈ డేటాసెట్ టెక్స్ట్ డిటెక్షన్ మరియు రికగ్నిషన్ మోడల్లకు శిక్షణ మరియు మూల్యాంకనం కోసం ఉపయోగించబడుతుంది, ప్రత్యేకించి సాంప్రదాయేతర ధోరణులు మరియు దృక్కోణాలలో టెక్స్ట్ను హ్యాండిల్ చేయగల సామర్థ్యం ఉన్నవి.
ఆంగ్ల మెనూ డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 20k
ఉల్లేఖనం: అవును
వివరణ: ఇంగ్లీష్ మెనూ డేటాసెట్లో ఇంగ్లీషులో వ్రాయబడిన రెస్టారెంట్ మెనుల చిత్రాలు లేదా వచన నమూనాలు ఉంటాయి. ఇది డిష్ పేర్ల నుండి వివరణలు మరియు ధరల వరకు కంటెంట్తో విభిన్న ఫాంట్లు, లేఅవుట్లు మరియు ఫార్మాటింగ్ స్టైల్లను కలిగి ఉంది. ఈ డేటాసెట్ తరచుగా ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR), టెక్స్ట్ ఎక్స్ట్రాక్షన్ మరియు ఫుడ్-సంబంధిత అప్లికేషన్లలో మెను డిజిటలైజేషన్ వంటి పనుల కోసం ఉపయోగించబడుతుంది.
ఆంగ్ల దృశ్యాలు టెక్స్ట్ డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 33k
ఉల్లేఖనం: అవును
వివరణ: ఆంగ్ల దృశ్యాల వచన డేటాసెట్లో పొందుపరిచిన ఆంగ్ల వచనంతో సహజ దృశ్యాలను కలిగి ఉన్న చిత్రాలను కలిగి ఉంటుంది. వచనం సంకేతాలు, బిల్బోర్డ్లు మరియు పోస్టర్లు వంటి వివిధ రూపాల్లో తరచుగా విభిన్న ఫాంట్లు, పరిమాణాలు మరియు దిశలలో కనిపిస్తుంది. ఈ డేటాసెట్ సాధారణంగా టెక్స్ట్ డిటెక్షన్, రికగ్నిషన్ మరియు సీన్ అండర్ స్టాండింగ్ టాస్క్లలో మోడల్లకు శిక్షణ మరియు పరీక్ష కోసం ఉపయోగించబడుతుంది.
చేతితో వ్రాసిన వచన డేటాసెట్

కేసు ఉపయోగించండి: పత్రం AI
ఫార్మాట్: HEIC (చిత్రాలు) & .mov (వీడియోలు)
కౌంట్: 94053
ఉల్లేఖనం: తోబుట్టువుల
వివరణ: జపనీస్, కొరియన్ & రష్యన్ కోసం చేతితో వ్రాసిన వచనంతో ప్రత్యక్ష ఫోటోలు
రికార్డింగ్ పరికరం: iPhone & iPad కెమెరా
రికార్డింగ్ పరిస్థితి: - అగ్రెసివ్ లైటింగ్/గ్లేర్ - కెమెరా ఫ్లాష్ ఆన్ - రంగుల కాంతి - తక్కువ కాంతి, కెమెరా ఫ్లాష్ లేదు - సాధారణం
జపనీస్ & కొరియన్ భాషా డేటాసెట్

కేసు ఉపయోగించండి: OCR
ఫార్మాట్: చిత్రం
కౌంట్: 40k
ఉల్లేఖనం: అవును
వివరణ: జపనీస్ & కొరియన్ భాషా డేటాసెట్లో జపనీస్ మరియు కొరియన్ రెండింటిలోనూ వచన నమూనాలు ఉన్నాయి. ఇది వివిధ సందర్భాలు మరియు శైలులను కలిగి ఉన్న వాక్యాలు, పదబంధాలు మరియు పదాలు వంటి కంటెంట్ పరిధిని కలిగి ఉంటుంది. ఈ డేటాసెట్ నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ (NLP), మెషిన్ ట్రాన్స్లేషన్ మరియు బహుభాషా అప్లికేషన్లలో వచన విశ్లేషణ వంటి పనుల కోసం ఉపయోగించబడుతుంది.
ప్రింటెడ్ రెగ్యులర్/కర్సివ్ టెక్స్ట్ డేటాసెట్ (పత్రం AI)

కేసు ఉపయోగించండి: పత్రం AI
ఫార్మాట్: HEIC (చిత్రాలు) & .mov (వీడియోలు)
కౌంట్: 23930
ఉల్లేఖనం: తోబుట్టువుల
వివరణ: జపనీస్, కొరియన్ & రష్యన్ కోసం చేతితో వ్రాసిన వచనంతో ప్రత్యక్ష ఫోటోలు
రికార్డింగ్ పరికరం: iPhone & iPad కెమెరా
రికార్డింగ్ పరిస్థితి: - అగ్రెసివ్ లైటింగ్/గ్లేర్ - కెమెరా ఫ్లాష్ ఆన్ - రంగుల కాంతి - తక్కువ కాంతి, కెమెరా ఫ్లాష్ లేదు - సాధారణం
టెక్స్ట్ + ఆడియో-విజువల్ (బహుభాషా/OCR/NLP) – పుస్తకాలు, జర్నల్స్, ఆడియో+టెక్స్ట్
కేసు ఉపయోగించండి: టెక్స్ట్ + ఆడియో-విజువల్ (బహుభాషా / OCR / NLP)
ఫార్మాట్: వీడియోలు
కౌంట్: 100K+ లెక్చర్ వీడియోలు + PPT లాంగ్ ఫార్మాట్ వీడియోలు
ఉల్లేఖనం: తోబుట్టువుల
వివరణ: చైనీస్ పుస్తకాలు, ఇంగ్లీష్ పుస్తకాలు, జర్నల్స్, పబ్లిక్ పాలసీ, నవలలు, పిల్లలు, కాంటోనీస్ ఆడియో+టెక్స్ట్, లెక్చర్ వీడియో+PPT, లాంగ్-ఫార్మాట్ వీడియో హాఫ్ బిలియన్ పుస్తకాలు, ప్రశ్న సమాధానాల జతలు, వ్యాసాలు

