హిందీ డేటాసెట్

హిందీ డేటాసెట్

AI & ASR మోడల్‌ల కోసం అధిక-నాణ్యత హిందీ కాల్-సెంటర్, జనరల్ సంభాషణ మరియు పాడ్‌కాస్ట్ డేటాసెట్

అవలోకనం

శీర్షిక (భాష)

హిందీ భాషా డేటాసెట్

డేటాసెట్ రకాలు

కాల్ సెంటర్, జనరల్ సంభాషణ, మీడియా (పాడ్‌కాస్ట్), స్క్రిప్ట్ చేయబడిన మోనోలాగ్

దేశం

భారతదేశం

వివరణ

ఇద్దరు వ్యక్తుల మధ్య 15 నుండి 60 నిమిషాల వ్యవధిలో స్క్రిప్ట్ లేని టెలిఫోనిక్ సంభాషణలు అందుబాటులో ఉన్నాయి, అలాగే లైసెన్స్ పొందిన పబ్లిక్ డొమైన్ ఆడియో లేదా వీడియో ఫైల్‌లు, ఇంటర్వ్యూలు మరియు పాడ్‌కాస్ట్‌లు వంటివి ఒకే పరిధిలో 1 నుండి 5 మంది పాల్గొనేవారితో అందుబాటులో ఉన్నాయి. అదనంగా, సింగిల్-ఉచ్చారణ రికార్డింగ్‌లు సాధారణంగా 5 నుండి 30 సెకన్ల వరకు ఉంటాయి మరియు స్క్రిప్ట్ చేయబడిన మోనోలాగ్ డేటా కూడా అందుబాటులో ఉంటుంది.

కేస్ ఉపయోగించండి

ASR, వర్చువల్ అసిస్టెంట్, చాట్‌బాట్, సంభాషణ AI, స్పీచ్ అనలిటిక్స్, TTS, లాంగ్వేజ్ మోడలింగ్

డేటా సెట్ వివరాలు

డేటాసెట్ రకం మాదిరి రేటు స్పీకర్లు ఛానల్ మొత్తం గంటలు మొత్తం స్పీకర్ల సంఖ్య
కాల్ సెంటర్ 8 kHz 2 స్పీకర్లు ద్వంద్వ 70:45:51 అభ్యర్థన మేరకు
కాల్ సెంటర్ 8 kHz 2 స్పీకర్లు మోనో 20,000:00:00 అభ్యర్థన మేరకు
కాల్ సెంటర్ 16 kHz 2 స్పీకర్లు మోనో 29:17:20 261
కాల్ సెంటర్ 16 kHz 2 స్పీకర్లు ద్వంద్వ 400:27:10 1200
సాధారణ సంభాషణ 8 kHz 2 స్పీకర్లు ద్వంద్వ 47:48:40 224
మీడియా డేటా 16 kHz బహుళ స్పీకర్లు మోనో 227:57:43 438
స్క్రిప్ట్ మోనోలాగ్ 48 kHz సింగిల్ స్పీకర్ మోనో 2,866:00:00 3,988
స్క్రిప్ట్ మోనోలాగ్ 24 kHz సింగిల్ స్పీకర్ మోనో 29,000:00:00 అభ్యర్థన మేరకు

ఫీచర్ చేసిన క్లయింట్లు

ప్రపంచ ప్రముఖ AI ఉత్పత్తులను రూపొందించడానికి బృందాలకు అధికారం ఇవ్వడం.

అమెజాన్
గూగుల్
మైక్రోసాఫ్ట్
Shaip మమ్మల్ని సంప్రదించండి

మీరు వెతుకుతున్నది దొరకలేదా?

అన్ని డేటా రకాల్లో కొత్త ఆఫ్-ది-షెల్ఫ్ డేటాసెట్‌లు సేకరించబడుతున్నాయి

మీ ఆడియో/స్పీచ్ శిక్షణ డేటా సేకరణ చింతలను వదిలించుకోవడానికి ఇప్పుడే మమ్మల్ని సంప్రదించండి

  • ఈ ఫీల్డ్ ధ్రువీకరణ ప్రయోజనాల కోసం మరియు మారదు ఉండాలి.
  • నమోదు చేయడం ద్వారా, నేను షైప్‌తో అంగీకరిస్తున్నాను గోప్యతా విధానం (Privacy Policy) మరియు సేవా నిబంధనలు మరియు Shaip నుండి B2B మార్కెటింగ్ కమ్యూనికేషన్‌ని స్వీకరించడానికి నా సమ్మతిని అందించండి.