అవలోకనం
శీర్షిక (భాష)
చైనీస్ భాషా డేటాసెట్
డేటాసెట్ రకాలు
కాల్ సెంటర్, సంగీతం, స్క్రిప్ట్ చేయబడిన మోనోలాగ్, మీడియా డేటా (పాడ్కాస్ట్ డేటా)
దేశం
చైనా
వివరణ
ఈ డేటాసెట్లో స్క్రిప్ట్ లేని సింథటిక్ ఏజెంట్–కస్టమర్ టెలిఫోనిక్ సంభాషణలు (5–15 నిమిషాలు), సహజ మానవుని నుండి మానవునికి టెలిఫోనిక్ సంభాషణలు (15–60 నిమిషాలు) మరియు ట్రాన్స్క్రిప్షన్లతో కూడిన ఆడియో పాడటం, ప్రసంగం మరియు భాషా సాంకేతికతలకు శిక్షణ మరియు మూల్యాంకనం కోసం విభిన్న ప్రసంగ డేటాను అందిస్తుంది.
కేస్ ఉపయోగించండి
ASR, వర్చువల్ అసిస్టెంట్, చాట్బాట్, సంభాషణ AI, స్పీచ్ అనలిటిక్స్, TTS, లాంగ్వేజ్ మోడలింగ్
డేటా సెట్ వివరాలు
| భాష | డేటాసెట్ రకం | మాదిరి రేటు | స్పీకర్లు | ఛానల్ | మొత్తం గంటలు | మొత్తం స్పీకర్ల సంఖ్య |
|---|---|---|---|---|---|---|
| చైనీస్ గానం | సంగీతం | 48 kHz | సింగిల్ స్పీకర్ | మోనో | 06:11:32 | 10 |
| చైనీస్ (సాంప్రదాయ) | స్క్రిప్ట్ మోనోలాగ్ | 48 kHz | సింగిల్ స్పీకర్ | మోనో | 1,499:00:00 | 1,805 |
| చైనీస్ యాస ఇంగ్లీష్ | మీడియా డేటా | 16 kHz | బహుళ స్పీకర్లు | మోనో | 306:04:58 | 2,130 |
| సరళీకృత చైనీస్ | స్క్రిప్ట్ మోనోలాగ్ | 48 kHz | సింగిల్ స్పీకర్ | మోనో | 2,761:00:00 | 3,725 |
| చైనీస్ US యాస ఇంగ్లీష్ | కాల్ సెంటర్ | 8 kHz | 2 స్పీకర్లు | ద్వంద్వ | 152:18:33 | 2,058 |
| చైనీస్ US యాస ఇంగ్లీష్ | మీడియా డేటా | 16 kHz | బహుళ స్పీకర్లు | మోనో | 245:55:15 | 468 |
ఫీచర్ చేసిన క్లయింట్లు
ప్రపంచ ప్రముఖ AI ఉత్పత్తులను రూపొందించడానికి బృందాలకు అధికారం ఇవ్వడం.
మీరు వెతుకుతున్నది దొరకలేదా?
అన్ని డేటా రకాల్లో కొత్త ఆఫ్-ది-షెల్ఫ్ డేటాసెట్లు సేకరించబడుతున్నాయి
మీ ఆడియో/స్పీచ్ శిక్షణ డేటా సేకరణ చింతలను వదిలించుకోవడానికి ఇప్పుడే మమ్మల్ని సంప్రదించండి