వాయిస్-ఆధారిత UPI చెల్లింపు ప్రాంప్ట్లు: మెరుగైన AI మోడల్ల కోసం వైవిధ్యాన్ని సంగ్రహించడం
అధిక-నాణ్యత, సాంస్కృతిక వైవిధ్యమైన డేటాతో వాయిస్-ఆధారిత UPI చెల్లింపు సిస్టమ్లకు మద్దతు ఇవ్వడానికి తక్షణ సృష్టి మరియు విభిన్న ఆడియో రికార్డింగ్లలో Shaip యొక్క నైపుణ్యాన్ని పెంచడం.
ప్రాజెక్టు అవలోకనం
విభిన్న UPI చెల్లింపు ప్రాంప్ట్లను సృష్టించడం మరియు రికార్డ్ చేయడం ద్వారా వాయిస్ ఆధారిత చెల్లింపు అప్లికేషన్ను అభివృద్ధి చేయడానికి Shaip ప్రముఖ ఫిన్టెక్ కంపెనీతో భాగస్వామ్యం కలిగి ఉంది. ప్రాజెక్ట్లో డబ్బు పంపడం, డబ్బును అభ్యర్థించడం, బ్యాలెన్స్ విచారణ మరియు బిల్లు చెల్లింపులు వంటి 2,500 చెల్లింపు-సంబంధిత ఉద్దేశాలలో 87,000 ప్రత్యేక ప్రాంప్ట్లు మరియు 13 విభిన్న ప్రాంప్ట్లు రూపొందించబడ్డాయి. ఈ ప్రాంప్ట్లు విభిన్న ప్రాంతాలు, నేపథ్యాలు మరియు వయో వర్గాల నుండి 200 మంది వక్తల ద్వారా 45 గంటల పాటు రికార్డ్ చేయబడ్డాయి, భాషా మరియు పర్యావరణ వైవిధ్యం యొక్క విస్తృత శ్రేణిని నిర్ధారిస్తుంది.
వాస్తవ-ప్రపంచ సెట్టింగ్లలో UPI చెల్లింపులకు సంబంధించిన వాయిస్ ఆదేశాలను గుర్తించి వాటికి ప్రతిస్పందించగల AI మోడల్ కోసం అధిక-నాణ్యత శిక్షణ డేటాను అభివృద్ధి చేయడం ప్రాజెక్ట్ యొక్క లక్ష్యం.
ముఖ్య గణాంకాలు
UPI చెల్లింపు ప్రాంప్ట్ల ఆడియో గంటలు రికార్డ్ చేయబడ్డాయి
200
విభిన్న నేపథ్యాల (వయస్సు, విద్య, ప్రాంతం) నుండి వక్తలు
45
87,000+ విభిన్న ప్రాంప్ట్లతో కవర్ చేయబడిన ఉద్దేశాలు
13
భాషలు: వివిధ స్థానిక భాషా నేపథ్యాల (కుమావోని, బెంగాలీ, మలయాళం, గుజరాతీ, హిందీ, మరాఠీ మొదలైనవి) మాట్లాడేవారితో ఇంగ్లీష్
ప్రాజెక్ట్ స్కోప్
ప్రాంప్ట్ సృష్టి
వాయిస్ ఆధారిత UPI చెల్లింపు సిస్టమ్ కోసం ప్రత్యేకమైన ప్రాంప్ట్లను సృష్టించడం కూడా స్కోప్లో ఉంది. ప్రాంప్ట్లు బహుళ ఉద్దేశాలను కవర్ చేయడానికి రూపొందించబడ్డాయి, అవి నిర్మాణం, పదజాలం మరియు పేరు పెట్టబడిన ఎంటిటీలలో విభిన్నంగా ఉన్నాయని నిర్ధారిస్తుంది. కొన్ని కీలక అంశాలు ఉన్నాయి:
13 ముఖ్య ఉద్దేశాలు, వీటితో సహా:
- డబ్బు పంపండి: 65,653 ప్రత్యేకమైన మరియు విభిన్నమైన ప్రాంప్ట్లు
- బ్యాలెన్స్ విచారణ: 3,052 ప్రాంప్ట్లు
- డబ్బు అభ్యర్థించండి: 26,972 ప్రాంప్ట్లు
- లావాదేవీ చరిత్ర, రీఛార్జ్, బిల్లు చెల్లింపు మొదలైనవి.
ఆడియో రికార్డింగ్
ప్రామాణికత మరియు వాస్తవ-ప్రపంచ అనువర్తనాన్ని నిర్ధారించడానికి, వివిధ భాషా నేపథ్యాల నుండి 45 స్పీకర్ల ద్వారా ప్రాంప్ట్లు రికార్డ్ చేయబడ్డాయి. వివిధ స్థానిక భాషలు, ప్రాంతీయ మాండలికాలు మరియు పరిసరాల (ఇండోర్ మరియు అవుట్డోర్) ద్వారా సంగ్రహించబడిన వైవిధ్యం శిక్షణ డేటాను మెరుగుపరచడంలో సహాయపడింది.
- భాషా వైవిధ్యం: వినియోగదారులు ఆంగ్లంలో నిష్ణాతులు కానీ కుమావోని, గుజరాతీ, హిందీ, బంగ్లా, మరాఠీ & మలయాళం వంటి విభిన్న స్థానిక భాషలతో ఉంటారు.
- వయస్సు, లింగం మరియు విద్యా నేపథ్యం: డేటా విస్తృత శ్రేణి జనాభాలను సంగ్రహించింది.
- అర్బన్ & రూరల్ స్పీకర్లు: వాస్తవ-ప్రపంచ వినియోగాన్ని ప్రతిబింబించేలా, పట్టణ మరియు గ్రామీణ మాట్లాడేవారు చేర్చబడ్డారు.
- రికార్డింగ్ పర్యావరణం: ఆడియో రికార్డింగ్లు ఇండోర్ మరియు అవుట్డోర్ సెట్టింగ్లలో నిర్వహించబడ్డాయి, విభిన్న నేపథ్య శబ్దాలు చేర్చబడ్డాయి.
సవాళ్లు
భాషా మరియు ప్రాంతీయ వైవిధ్యం
ప్రాంప్ట్లు విభిన్న ప్రాంతీయ మాండలికాలు మరియు స్పీకర్ లక్షణాలను ప్రతిబింబించేలా జాగ్రత్త వహించడం మరియు అమలు చేయడం అవసరం.
సహజ ఆడియో వైవిధ్యాలు
వాస్తవ ప్రపంచ అనువర్తనానికి నేపథ్య శబ్దాలు మరియు పర్యావరణ పరిస్థితులను (ఇండోర్ vs. అవుట్డోర్) నిర్వహించడం చాలా కీలకమైనది.
విభిన్న స్పీకర్ ప్రొఫైల్లు
వివిధ వయస్సుల సమూహాలు, విద్యా నేపథ్యాలు మరియు గ్రామీణ/పట్టణ ప్రాంతాల నుండి మాట్లాడే వ్యక్తులను చేర్చడం వలన ప్రామాణికమైన డేటాను సంగ్రహించడంలో సంక్లిష్టత ఏర్పడింది.
సొల్యూషన్
సత్వర సృష్టి మరియు రికార్డింగ్ రెండింటిలోనూ అధునాతన NLP పద్ధతులను మరియు జాగ్రత్తగా ప్రణాళికను అమలు చేయడం ద్వారా ప్రాజెక్ట్ యొక్క సవాళ్లను పరిష్కరించే పరిష్కారాన్ని షైప్ అందించారు. పరిష్కారం యొక్క ముఖ్య అంశాలు:
ప్రాంప్ట్ సృష్టి
- 2,500 ప్రత్యేకమైన ప్రాంప్ట్లు సృష్టించబడ్డాయి, ప్రతి ఒక్కటి నిర్మాణం మరియు పదజాలం ద్వారా విభిన్నంగా ఉంటాయి.
- 13 ప్రాథమిక చెల్లింపు అభ్యర్థనల నుండి లావాదేవీ చరిత్ర మరియు బిల్లు చెల్లింపుల వంటి క్లిష్టమైన విచారణల వరకు ఉద్దేశాలు కవర్ చేయబడ్డాయి.
ఆడియో రికార్డింగ్
- 200 గంటల ఆడియో రికార్డింగ్లను నిర్వహించారు 45 వినియోగదారులు, స్థానిక భాషలు, పరిసరాలు, & స్పీకర్ డెమోగ్రాఫిక్స్ అంతటా వైవిధ్యాన్ని నిర్ధారిస్తుంది.
- సహజమైన ఆడియో వైవిధ్యాన్ని నిర్ధారించడానికి రికార్డింగ్ కోసం ఇండోర్ మరియు అవుట్డోర్ పరిసరాలు రెండూ ఉపయోగించబడ్డాయి.
- వక్తలు ఖచ్చితమైన భాషా ప్రాతినిధ్యాన్ని నిర్ధారిస్తూ ప్రాంతీయ మాండలికాల శ్రేణిని సూచిస్తారు.
| ఇంటెంట్ | పంపండి | బ్యాలెన్స్ విచారణ | డబ్బు అభ్యర్థించండి | లావాదేవీ చరిత్ర |
|---|---|---|---|---|
| ప్రాంప్ట్ | ఇంటి అద్దె కోసం సుమత్రికి ఇరవై వందలు చెల్లించండి | నేను నా పొదుపు ఖాతాలో నా ప్రస్తుత బ్యాలెన్స్ తెలుసుకోవాలనుకుంటున్నాను. | మీరు ఎమర్జెన్సీ కోసం మూడు వందల పద్దెనిమిది రూపాయలు రాజీని అభ్యర్థించగలరా? | నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపించు. |
| గుజరాతీ | సుమాత్రీణే ఘరానా భాడా పేటే ఏకవీసో భోదించండి | హుం మారా బచత్ ఖాతామాం మారీ వర్తమాన్ లైన్ జానవ మాంగు చుం. | శుం మీ రాజి పాసేథి ఇమర్జన్సీ మాట్టె అధార్ రూపియా మాంగి షాకో చో? | మన మారా డెబిట్ కార్డనా వ్యాహార్ దేఖాడ్. |
| లేదు | సుమత్రి కో మకాన్ కిరాయే ఇక్కీస్ సౌ రూపే కా భుగతన్ కరేం. | నేను అపనే బచత్ ఖాతే మేం వర్తమాన శేష రాశి జాననా చాహతా హూం. | క్యా మీరు రాజి సే కిసీ ఇమరాజెన్సీ తీన్ సౌ అథారహ రూపయే మాంగ్ సకటే? | ముజే మేరా డెబిట్ కార్డ్ కా లేనదేన్ బ్యూరా దిఖాయో. |
| మలయాళం | ఇంటివాటకయై సుమత్రిక్ రెండయిరత్తిఅన్నూట్ అందించు. | ఎన్టీ సేవింగ్స్ ఖాతాలో ప్రస్తుత మొత్తాన్ని తెలుసుకోవాలనుకుంటున్నాను. | రాజీనామా మున్నూటి పతినెట్ రూపాయి అత్యవసర అవసరాలకు డిమాండ్ చేయాలా? | ఎన్ట్ డెబిట్ కార్డ్ లావాదేవీ వివరణను చూపించు. |
| తెలుగు | ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క వంద చెల్లించండి | నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రస్తుత బ్యాలెన్స్ ను తెలుసుకోవాలనుకుంటున్నాను. | ఎమర్జెన్సీ కోసం రాజిని మూడు వందల పద్దెనిమిది రూపాయలు అడగగలరా? | నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపించండి. |
| బంగ్లా () | బడి వాడా జన్య సుమాత్రికే నాధ్, పాదాలు పరిశోధ కరుణ్ | ఆమి ఆమె సంచయ అయాకవుంటే బర్తమా బ్యాలెన్సు జానతే చై. | ఆపని రాజకీయం తినోషో ఆథారో టాకా చైతే పారెన్? | ఆమార్ డెబిట్ కార్డ్ |
| మరాఠీ | సుమత్రీలా ఘరాచ్యా భాద్యాసాఠీ దోన్ హాజరు ఏకే రూపయే ద్యా. | మలా మాజ్యా బచత్ ఖాత్యతీల్ సధ్యాచా శిల్ల జాణూన్ గ్యాయాచా ఆహే. | ఆపన్ రాజీకడూన్ తాతడీసాఠీ తీనషే అథరా రూపయే మాగూ శకతా కా? | మాజ్యా డెబిట్ కార్డుచే వ్యాపార దాఖవా. |
ఫలితం
Shaip ద్వారా బట్వాడా చేయబడిన అధిక-నాణ్యత, విభిన్న ఆడియో డేటా క్లయింట్ని వివిధ మాండలికాలు, పరిసరాలు మరియు సందర్భాలలో కమాండ్లను గుర్తించగల సామర్థ్యం గల AI-ఆధారిత వాయిస్-ఆధారిత UPI చెల్లింపు వ్యవస్థను అభివృద్ధి చేయడానికి అనుమతించింది. డేటా మెరుగుపరచడంలో సహాయపడింది:
- నిజ-సమయ వాయిస్ గుర్తింపు సంక్లిష్ట వాతావరణంలో.
- మరింత ఖచ్చితమైన UPI లావాదేవీ విస్తృత శ్రేణి వినియోగదారుల కోసం నిర్వహించడం.
- వ్యాప్తిని: ఇతర భారతీయ భాషల్లోకి విస్తరించేందుకు ఈ ప్రాజెక్ట్ బలమైన పునాదిని ఏర్పరుస్తుంది.
deliverables
- 200 గంటల ఆడియో ఫైల్స్ (8 kHz PCM WAV ఫార్మాట్, మోనో)
- 87,000 + విభిన్నమైన ప్రాంప్ట్లు ప్రత్యేకమైన ఉద్దేశాలతో వ్యాఖ్యానించబడ్డాయి
- మెటాడేటా: స్పీకర్ ప్రొఫైల్లు, పర్యావరణ వివరాలు మరియు ట్రాన్స్క్రిప్షన్ ఖచ్చితత్వం
ప్రత్యేకమైన ప్రాంప్ట్లు మరియు ప్రామాణికమైన ఆడియో రికార్డింగ్ల ద్వారా భారతదేశ వైవిధ్యాన్ని క్యాప్చర్ చేయగల Shaip యొక్క సామర్థ్యం మా వాయిస్-ఆధారిత UPI చెల్లింపు వ్యవస్థకు గేమ్-ఛేంజర్. ప్రాంప్ట్ క్రియేషన్ నుండి రికార్డింగ్ నాణ్యత వరకు - ప్రాజెక్ట్లోని ప్రతి అంశం ఖచ్చితత్వంతో నిర్వహించబడుతుందని వారి బృందం నిర్ధారిస్తుంది, ఇది మరింత సమగ్రమైన, బలమైన వాయిస్ రికగ్నిషన్ మోడల్ను రూపొందించడంలో మాకు సహాయపడుతుంది.