అరబిక్ & థాయ్ & వియత్నామీస్ & హిందీ & ఇంగ్లీష్ & చైనీస్ భాషా డేటాసెట్

అరబిక్ & థాయ్ & వియత్నామీస్ & హిందీ & ఇంగ్లీష్ & చైనీస్ భాషా డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 150k

ఉల్లేఖనం: అవును

X

వివరణ: అరబిక్ & థాయ్ & వియత్నామీస్ & హిందీ & ఇంగ్లీష్ & చైనీస్ భాషా డేటాసెట్

అరబిక్ టెక్స్ట్ డేటాసెట్

అరబిక్ టెక్స్ట్ డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 1k

ఉల్లేఖనం: అవును

X

వివరణ: అరబిక్ టెక్స్ట్ డేటాసెట్ అరబిక్‌లో వ్రాయబడిన వచన నమూనాల సేకరణను కలిగి ఉంది. ఇది వార్తా కథనాలు, సోషల్ మీడియా పోస్ట్‌లు, సాహిత్యం మరియు సంభాషణలు వంటి వివిధ రకాల కంటెంట్‌లను కలిగి ఉంటుంది, విభిన్న అంశాలు మరియు వ్రాత శైలులను కలిగి ఉంటుంది. ఈ డేటాసెట్ నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ (NLP), టెక్స్ట్ క్లాసిఫికేషన్, సెంటిమెంట్ అనాలిసిస్ మరియు అరబిక్ లాంగ్వేజ్ అప్లికేషన్‌లలో మెషీన్ ట్రాన్స్‌లేషన్ వంటి పనుల కోసం ఉపయోగించబడుతుంది.

చైనీస్ & ఇంగ్లీష్ & టిబెటన్ & ఉయ్ఘర్ భాషా డేటాసెట్

చైనీస్ & ఇంగ్లీష్ & టిబెటన్ & ఉయ్ఘర్ భాషా డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 38k

ఉల్లేఖనం: అవును

X

వివరణ: చైనీస్ & ఇంగ్లీష్ & టిబెటన్ & ఉయ్ఘర్ భాషా డేటాసెట్

చైనీస్ మరియు ఇంగ్లీష్ మెనూ డేటాసెట్

చైనీస్ మరియు ఇంగ్లీష్ మెనూ డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 60k

ఉల్లేఖనం: అవును

X

వివరణ: చైనీస్ మరియు ఇంగ్లీష్ మెనూ డేటాసెట్‌లో చైనీస్ మరియు ఇంగ్లీషు భాషలను కలిగి ఉన్న రెస్టారెంట్ మెనుల చిత్రాలు లేదా వచన నమూనాలు ఉన్నాయి. ఇది వివిధ ఫాంట్‌లు, లేఅవుట్‌లు మరియు మెను నిర్మాణాలను కలిగి ఉంటుంది, ద్విభాషా వంటల పేర్లు, వివరణలు మరియు ధరలను ప్రదర్శిస్తుంది. ఈ డేటాసెట్ ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR), మెషిన్ ట్రాన్స్‌లేషన్ మరియు బహుభాషా సెట్టింగ్‌లలో మెను డిజిటలైజేషన్ వంటి పనులకు ఉపయోగపడుతుంది.

చైనీస్ చేతివ్రాత కంపోజిషన్ డేటాసెట్

చైనీస్ చేతివ్రాత కంపోజిషన్ డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 3k

ఉల్లేఖనం: అవును

X

వివరణ: చైనీస్ చేతివ్రాత కంపోజిషన్ డేటాసెట్ కంపోజిషన్‌లు, వ్యాసాలు మరియు ఇతర దీర్ఘ-రూప వచనంతో సహా చేతితో వ్రాసిన చైనీస్ టెక్స్ట్ యొక్క నమూనాలను కలిగి ఉంది. ఇది వివిధ చేతివ్రాత శైలులు మరియు సంక్లిష్టత స్థాయిలను కలిగి ఉంటుంది మరియు చేతివ్రాత గుర్తింపు, వచన విశ్లేషణ మరియు యంత్ర అభ్యాస నమూనా శిక్షణ వంటి పనుల కోసం ఉపయోగించబడుతుంది.

చైనీస్ WIFI ప్రాంప్ట్ డేటాసెట్

చైనీస్ WIFI ప్రాంప్ట్ డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 1k

ఉల్లేఖనం: అవును

X

వివరణ: చైనీస్ WIFI ప్రాంప్ట్ డేటాసెట్‌లో WIFI ప్రాంప్ట్‌లు మరియు చైనీస్ భాషలో వ్రాయబడిన లాగిన్ స్క్రీన్‌లలో కనిపించే టెక్స్ట్ నమూనాలు ఉంటాయి. ఇది సాధారణంగా WIFI నెట్‌వర్క్‌లకు కనెక్ట్ చేయడానికి లేదా నిర్వహించడానికి సంబంధించిన వివిధ ప్రాంప్ట్‌లు, సూచనలు మరియు దోష సందేశాలను కలిగి ఉంటుంది. ఈ డేటాసెట్ టెక్స్ట్ రికగ్నిషన్, నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ మరియు నెట్‌వర్క్ కనెక్టివిటీ కోసం యూజర్ ఇంటర్‌ఫేస్‌లను మెరుగుపరచడం వంటి పనుల కోసం ఉపయోగించబడుతుంది.

ఇంగ్లీష్ & చైనీస్ చేతివ్రాత డేటాసెట్

ఇంగ్లీష్ & చైనీస్ చేతివ్రాత డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 12k

ఉల్లేఖనం: అవును

X

వివరణ: ఇంగ్లీష్ & చైనీస్ చేతివ్రాత డేటాసెట్‌లో ఇంగ్లీష్ మరియు చైనీస్ రెండు భాషలలో చేతివ్రాత నమూనాలు ఉన్నాయి, వివిధ వ్రాత శైలులు మరియు అక్షర సంక్లిష్టతలను ప్రదర్శిస్తాయి. ఇది సాధారణంగా చేతివ్రాత గుర్తింపు నమూనాల శిక్షణ మరియు మూల్యాంకనం, బహుభాషా వచన విశ్లేషణ మరియు ఇతర సంబంధిత పరిశోధనలకు మద్దతు ఇవ్వడానికి ఉపయోగించబడుతుంది. డేటాసెట్‌లో రెండు భాషల్లోని విభిన్న శ్రేణి అక్షరాలు, అంకెలు, పదాలు మరియు వాక్యాలు ఉంటాయి.

ఇంగ్లీష్ & చైనీస్ షాప్‌సైన్ డేటాసెట్

ఇంగ్లీష్ & చైనీస్ షాప్‌సైన్ డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 30k

ఉల్లేఖనం: అవును

X

వివరణ: ఇంగ్లీష్ & చైనీస్ షాప్‌సైన్ డేటాసెట్‌లో ఇంగ్లీష్ మరియు చైనీస్ టెక్స్ట్ రెండింటినీ ఫీచర్ చేసే షాప్ చిహ్నాల చిత్రాలు ఉన్నాయి. ఇది విభిన్న ఫాంట్‌లు, స్టైల్స్ మరియు ఫార్మాట్‌లలో ప్రదర్శించబడే స్టోర్ పేర్లు, ప్రకటనలు, ప్రమోషన్‌లు మరియు దిశల వంటి వివిధ సంకేతాల మూలకాలను క్యాప్చర్ చేస్తుంది. ఈ డేటాసెట్ టెక్స్ట్ డిటెక్షన్ మరియు రికగ్నిషన్, బహుభాషా దృశ్య అవగాహన మరియు ద్విభాషా సంకేతాలను వివరించడానికి కంప్యూటర్ విజన్ మోడల్‌లను మెరుగుపరచడం వంటి పనుల కోసం ఉపయోగించబడుతుంది.

ఇంగ్లీష్ & చైనీస్ స్పెషల్ యాంగిల్ టెక్స్ట్ డేటాసెట్

ఇంగ్లీష్ & చైనీస్ స్పెషల్ యాంగిల్ టెక్స్ట్ డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 50k

ఉల్లేఖనం: అవును

X

వివరణ: ఇంగ్లీష్ & చైనీస్ స్పెషల్ యాంగిల్ టెక్స్ట్ డేటాసెట్ ఇంగ్లీషు మరియు చైనీస్ రెండింటిలోనూ వివిధ కోణాలు మరియు ఓరియంటేషన్‌లలో ప్రదర్శించబడే వచన చిత్రాలను కలిగి ఉంటుంది. ఇది ప్రామాణిక క్షితిజ సమాంతర ఫార్మాట్‌లలో ప్రదర్శించబడని సంకేతాలు, ప్రకటనలు మరియు పత్రాల వంటి మూలాధారాల నుండి వచనాన్ని కలిగి ఉంటుంది. ఈ డేటాసెట్ టెక్స్ట్ డిటెక్షన్ మరియు రికగ్నిషన్ మోడల్‌లకు శిక్షణ మరియు మూల్యాంకనం కోసం ఉపయోగించబడుతుంది, ప్రత్యేకించి సాంప్రదాయేతర ధోరణులు మరియు దృక్కోణాలలో టెక్స్ట్‌ను హ్యాండిల్ చేయగల సామర్థ్యం ఉన్నవి.

ఆంగ్ల మెనూ డేటాసెట్

ఆంగ్ల మెనూ డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 20k

ఉల్లేఖనం: అవును

X

వివరణ: ఇంగ్లీష్ మెనూ డేటాసెట్‌లో ఇంగ్లీషులో వ్రాయబడిన రెస్టారెంట్ మెనుల చిత్రాలు లేదా వచన నమూనాలు ఉంటాయి. ఇది డిష్ పేర్ల నుండి వివరణలు మరియు ధరల వరకు కంటెంట్‌తో విభిన్న ఫాంట్‌లు, లేఅవుట్‌లు మరియు ఫార్మాటింగ్ స్టైల్‌లను కలిగి ఉంది. ఈ డేటాసెట్ తరచుగా ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR), టెక్స్ట్ ఎక్స్‌ట్రాక్షన్ మరియు ఫుడ్-సంబంధిత అప్లికేషన్‌లలో మెను డిజిటలైజేషన్ వంటి పనుల కోసం ఉపయోగించబడుతుంది.

ఆంగ్ల దృశ్యాలు టెక్స్ట్ డేటాసెట్

ఆంగ్ల దృశ్యాలు టెక్స్ట్ డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 33k

ఉల్లేఖనం: అవును

X

వివరణ: ఆంగ్ల దృశ్యాల వచన డేటాసెట్‌లో పొందుపరిచిన ఆంగ్ల వచనంతో సహజ దృశ్యాలను కలిగి ఉన్న చిత్రాలను కలిగి ఉంటుంది. వచనం సంకేతాలు, బిల్‌బోర్డ్‌లు మరియు పోస్టర్‌లు వంటి వివిధ రూపాల్లో తరచుగా విభిన్న ఫాంట్‌లు, పరిమాణాలు మరియు దిశలలో కనిపిస్తుంది. ఈ డేటాసెట్ సాధారణంగా టెక్స్ట్ డిటెక్షన్, రికగ్నిషన్ మరియు సీన్ అండర్ స్టాండింగ్ టాస్క్‌లలో మోడల్‌లకు శిక్షణ మరియు పరీక్ష కోసం ఉపయోగించబడుతుంది.

చేతితో వ్రాసిన వచన డేటాసెట్

చేతితో వ్రాసిన వచన డేటాసెట్

కేసు ఉపయోగించండి: పత్రం AI

ఫార్మాట్: HEIC (చిత్రాలు) & .mov (వీడియోలు)

కౌంట్: 94053

ఉల్లేఖనం: తోబుట్టువుల

X

వివరణ: జపనీస్, కొరియన్ & రష్యన్ కోసం చేతితో వ్రాసిన వచనంతో ప్రత్యక్ష ఫోటోలు

రికార్డింగ్ పరికరం: iPhone & iPad కెమెరా

రికార్డింగ్ పరిస్థితి: - అగ్రెసివ్ లైటింగ్/గ్లేర్ - కెమెరా ఫ్లాష్ ఆన్ - రంగుల కాంతి - తక్కువ కాంతి, కెమెరా ఫ్లాష్ లేదు - సాధారణం

జపనీస్ & కొరియన్ భాషా డేటాసెట్

జపనీస్ & కొరియన్ భాషా డేటాసెట్

కేసు ఉపయోగించండి: OCR

ఫార్మాట్: చిత్రం

కౌంట్: 40k

ఉల్లేఖనం: అవును

X

వివరణ: జపనీస్ & కొరియన్ భాషా డేటాసెట్‌లో జపనీస్ మరియు కొరియన్ రెండింటిలోనూ వచన నమూనాలు ఉన్నాయి. ఇది వివిధ సందర్భాలు మరియు శైలులను కలిగి ఉన్న వాక్యాలు, పదబంధాలు మరియు పదాలు వంటి కంటెంట్ పరిధిని కలిగి ఉంటుంది. ఈ డేటాసెట్ నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ (NLP), మెషిన్ ట్రాన్స్‌లేషన్ మరియు బహుభాషా అప్లికేషన్‌లలో వచన విశ్లేషణ వంటి పనుల కోసం ఉపయోగించబడుతుంది.

ప్రింటెడ్ రెగ్యులర్/కర్సివ్ టెక్స్ట్ డేటాసెట్ (పత్రం AI)

ప్రింటెడ్ రెగ్యులర్/కర్సివ్ టెక్స్ట్ డేటాసెట్ (పత్రం AI)

కేసు ఉపయోగించండి: పత్రం AI

ఫార్మాట్: HEIC (చిత్రాలు) & .mov (వీడియోలు)

కౌంట్: 23930

ఉల్లేఖనం: తోబుట్టువుల

X

వివరణ: జపనీస్, కొరియన్ & రష్యన్ కోసం చేతితో వ్రాసిన వచనంతో ప్రత్యక్ష ఫోటోలు

రికార్డింగ్ పరికరం: iPhone & iPad కెమెరా

రికార్డింగ్ పరిస్థితి: - అగ్రెసివ్ లైటింగ్/గ్లేర్ - కెమెరా ఫ్లాష్ ఆన్ - రంగుల కాంతి - తక్కువ కాంతి, కెమెరా ఫ్లాష్ లేదు - సాధారణం

టెక్స్ట్ + ఆడియో-విజువల్ (బహుభాషా/OCR/NLP) – పుస్తకాలు, జర్నల్స్, ఆడియో+టెక్స్ట్

టెక్స్ట్ + ఆడియో-విజువల్ (బహుభాషా/OCR/NLP) – పుస్తకాలు, జర్నల్స్, ఆడియో+టెక్స్ట్

కేసు ఉపయోగించండి: టెక్స్ట్ + ఆడియో-విజువల్ (బహుభాషా / OCR / NLP)

ఫార్మాట్: వీడియోలు

కౌంట్: 100K+ లెక్చర్ వీడియోలు + PPT లాంగ్ ఫార్మాట్ వీడియోలు

ఉల్లేఖనం: తోబుట్టువుల

X

వివరణ: చైనీస్ పుస్తకాలు, ఇంగ్లీష్ పుస్తకాలు, జర్నల్స్, పబ్లిక్ పాలసీ, నవలలు, పిల్లలు, కాంటోనీస్ ఆడియో+టెక్స్ట్, లెక్చర్ వీడియో+PPT, లాంగ్-ఫార్మాట్ వీడియో హాఫ్ బిలియన్ పుస్తకాలు, ప్రశ్న సమాధానాల జతలు, వ్యాసాలు