చైనీస్ డేటాసెట్

简体中文数据集

AI & స్పీచ్ మోడల్స్ కోసం అధిక-నాణ్యత చైనీస్ డేటాసెట్

అవలోకనం

శీర్షిక (భాష)

చైనీస్ భాషా డేటాసెట్

డేటాసెట్ రకాలు

కాల్ సెంటర్, సంగీతం, స్క్రిప్ట్ చేయబడిన మోనోలాగ్, మీడియా డేటా (పాడ్‌కాస్ట్ డేటా)

దేశం

చైనా

వివరణ

ఈ డేటాసెట్‌లో స్క్రిప్ట్ లేని సింథటిక్ ఏజెంట్–కస్టమర్ టెలిఫోనిక్ సంభాషణలు (5–15 నిమిషాలు), సహజ మానవుని నుండి మానవునికి టెలిఫోనిక్ సంభాషణలు (15–60 నిమిషాలు) మరియు ట్రాన్స్‌క్రిప్షన్‌లతో కూడిన ఆడియో పాడటం, ప్రసంగం మరియు భాషా సాంకేతికతలకు శిక్షణ మరియు మూల్యాంకనం కోసం విభిన్న ప్రసంగ డేటాను అందిస్తుంది.

కేస్ ఉపయోగించండి

ASR, వర్చువల్ అసిస్టెంట్, చాట్‌బాట్, సంభాషణ AI, స్పీచ్ అనలిటిక్స్, TTS, లాంగ్వేజ్ మోడలింగ్

డేటా సెట్ వివరాలు

భాష డేటాసెట్ రకం మాదిరి రేటు స్పీకర్లు ఛానల్ మొత్తం గంటలు మొత్తం స్పీకర్ల సంఖ్య
చైనీస్ గానం సంగీతం 48 kHz సింగిల్ స్పీకర్ మోనో 06:11:32 10
చైనీస్ (సాంప్రదాయ) స్క్రిప్ట్ మోనోలాగ్ 48 kHz సింగిల్ స్పీకర్ మోనో 1,499:00:00 1,805
చైనీస్ యాస ఇంగ్లీష్ మీడియా డేటా 16 kHz బహుళ స్పీకర్లు మోనో 306:04:58 2,130
సరళీకృత చైనీస్ స్క్రిప్ట్ మోనోలాగ్ 48 kHz సింగిల్ స్పీకర్ మోనో 2,761:00:00 3,725
చైనీస్ US యాస ఇంగ్లీష్ కాల్ సెంటర్ 8 kHz 2 స్పీకర్లు ద్వంద్వ 152:18:33 2,058
చైనీస్ US యాస ఇంగ్లీష్ మీడియా డేటా 16 kHz బహుళ స్పీకర్లు మోనో 245:55:15 468

ఫీచర్ చేసిన క్లయింట్లు

ప్రపంచ ప్రముఖ AI ఉత్పత్తులను రూపొందించడానికి బృందాలకు అధికారం ఇవ్వడం.

Shaip మమ్మల్ని సంప్రదించండి

మీరు వెతుకుతున్నది దొరకలేదా?

అన్ని డేటా రకాల్లో కొత్త ఆఫ్-ది-షెల్ఫ్ డేటాసెట్‌లు సేకరించబడుతున్నాయి

మీ ఆడియో/స్పీచ్ శిక్షణ డేటా సేకరణ చింతలను వదిలించుకోవడానికి ఇప్పుడే మమ్మల్ని సంప్రదించండి

  • ఈ ఫీల్డ్ ధ్రువీకరణ ప్రయోజనాల కోసం మరియు మారదు ఉండాలి.
  • నమోదు చేయడం ద్వారా, నేను షైప్‌తో అంగీకరిస్తున్నాను గోప్యతా విధానం (Privacy Policy) మరియు సేవా నిబంధనలు మరియు Shaip నుండి B2B మార్కెటింగ్ కమ్యూనికేషన్‌ని స్వీకరించడానికి నా సమ్మతిని అందించండి.