బెంగాలీ డేటాసెట్
బాంలా డెటాసెట్
AI & స్పీచ్ మోడల్స్ కోసం అధిక-నాణ్యత బెంగాలీ కాల్-సెంటర్, జనరల్ సంభాషణ మరియు పాడ్కాస్ట్ డేటాసెట్
అవలోకనం
శీర్షిక (భాష)
బెంగాలీ భాషా డేటాసెట్
డేటాసెట్ రకాలు
కాల్ సెంటర్, జనరల్ సంభాషణ, మీడియా డేటా (పాడ్కాస్ట్ డేటా), స్క్రిప్ట్ చేయబడిన మోనోలాగ్
దేశం
భారతదేశం
వివరణ
ఏజెంట్ మరియు కస్టమర్ మధ్య స్క్రిప్ట్ లేని, సింథటిక్ టెలిఫోనిక్ సంభాషణలు సుమారు 5 నుండి 15 నిమిషాల వరకు అందుబాటులో ఉంటాయి. అదనంగా, ఇంటర్వ్యూలు, పాడ్కాస్ట్లు మరియు 1 నుండి 5 మంది పాల్గొనేవారితో కూడిన సారూప్య కంటెంట్ వంటి లైసెన్స్ పొందిన పబ్లిక్ డొమైన్ ఆడియో లేదా వీడియో ఫైల్లు సుమారు 15 నుండి 60 నిమిషాల వరకు అందుబాటులో ఉంటాయి.
కేస్ ఉపయోగించండి
ASR, వర్చువల్ అసిస్టెంట్, చాట్బాట్, సంభాషణ AI, స్పీచ్ అనలిటిక్స్, TTS, లాంగ్వేజ్ మోడలింగ్
డేటా సెట్ వివరాలు
| డేటాసెట్ రకం | మాదిరి రేటు | స్పీకర్లు | ఛానల్ | మొత్తం గంటలు | మొత్తం స్పీకర్ల సంఖ్య |
|---|---|---|---|---|---|
| కాల్ సెంటర్ | 8 kHz | 2 స్పీకర్లు | ద్వంద్వ | 117:03:45 | 498 |
| సాధారణ సంభాషణ | 8 kHz | 2 స్పీకర్లు | ద్వంద్వ | 168:13:39 | 458 |
| మీడియా డేటా | 16 kHz | బహుళ స్పీకర్ | మోనో | 24:58:58 | 90 |
| స్క్రిప్ట్ మోనోలాగ్ | 24 kHz | సింగిల్ స్పీకర్ | మోనో | 2,300:00:00 | అభ్యర్థన మేరకు |
ఫీచర్ చేసిన క్లయింట్లు
ప్రపంచ ప్రముఖ AI ఉత్పత్తులను రూపొందించడానికి బృందాలకు అధికారం ఇవ్వడం.
మీరు వెతుకుతున్నది దొరకలేదా?
అన్ని డేటా రకాల్లో కొత్త ఆఫ్-ది-షెల్ఫ్ డేటాసెట్లు సేకరించబడుతున్నాయి
మీ ఆడియో/స్పీచ్ శిక్షణ డేటా సేకరణ చింతలను వదిలించుకోవడానికి ఇప్పుడే మమ్మల్ని సంప్రదించండి