వాయిస్-ఆధారిత UPI చెల్లింపు ప్రాంప్ట్‌లు: మెరుగైన AI మోడల్‌ల కోసం వైవిధ్యాన్ని సంగ్రహించడం

అధిక-నాణ్యత, సాంస్కృతిక వైవిధ్యమైన డేటాతో వాయిస్-ఆధారిత UPI చెల్లింపు సిస్టమ్‌లకు మద్దతు ఇవ్వడానికి తక్షణ సృష్టి మరియు విభిన్న ఆడియో రికార్డింగ్‌లలో Shaip యొక్క నైపుణ్యాన్ని పెంచడం.

వాయిస్ ఆధారిత upi చెల్లింపు ప్రాంప్ట్‌లు

ప్రాజెక్టు అవలోకనం

విభిన్న UPI చెల్లింపు ప్రాంప్ట్‌లను సృష్టించడం మరియు రికార్డ్ చేయడం ద్వారా వాయిస్ ఆధారిత చెల్లింపు అప్లికేషన్‌ను అభివృద్ధి చేయడానికి Shaip ప్రముఖ ఫిన్‌టెక్ కంపెనీతో భాగస్వామ్యం కలిగి ఉంది. ప్రాజెక్ట్‌లో డబ్బు పంపడం, డబ్బును అభ్యర్థించడం, బ్యాలెన్స్ విచారణ మరియు బిల్లు చెల్లింపులు వంటి 2,500 చెల్లింపు-సంబంధిత ఉద్దేశాలలో 87,000 ప్రత్యేక ప్రాంప్ట్‌లు మరియు 13 విభిన్న ప్రాంప్ట్‌లు రూపొందించబడ్డాయి. ఈ ప్రాంప్ట్‌లు విభిన్న ప్రాంతాలు, నేపథ్యాలు మరియు వయో వర్గాల నుండి 200 మంది వక్తల ద్వారా 45 గంటల పాటు రికార్డ్ చేయబడ్డాయి, భాషా మరియు పర్యావరణ వైవిధ్యం యొక్క విస్తృత శ్రేణిని నిర్ధారిస్తుంది.

వాస్తవ-ప్రపంచ సెట్టింగ్‌లలో UPI చెల్లింపులకు సంబంధించిన వాయిస్ ఆదేశాలను గుర్తించి వాటికి ప్రతిస్పందించగల AI మోడల్ కోసం అధిక-నాణ్యత శిక్షణ డేటాను అభివృద్ధి చేయడం ప్రాజెక్ట్ యొక్క లక్ష్యం.

వాయిస్ ఆధారిత upi చెల్లింపు

ముఖ్య గణాంకాలు

UPI చెల్లింపు ప్రాంప్ట్‌ల ఆడియో గంటలు రికార్డ్ చేయబడ్డాయి

200

విభిన్న నేపథ్యాల (వయస్సు, విద్య, ప్రాంతం) నుండి వక్తలు

45

87,000+ విభిన్న ప్రాంప్ట్‌లతో కవర్ చేయబడిన ఉద్దేశాలు

13

భాషలు: వివిధ స్థానిక భాషా నేపథ్యాల (కుమావోని, బెంగాలీ, మలయాళం, గుజరాతీ, హిందీ, మరాఠీ మొదలైనవి) మాట్లాడేవారితో ఇంగ్లీష్

ప్రాజెక్ట్ స్కోప్

ప్రాంప్ట్ సృష్టి

వాయిస్ ఆధారిత UPI చెల్లింపు సిస్టమ్ కోసం ప్రత్యేకమైన ప్రాంప్ట్‌లను సృష్టించడం కూడా స్కోప్‌లో ఉంది. ప్రాంప్ట్‌లు బహుళ ఉద్దేశాలను కవర్ చేయడానికి రూపొందించబడ్డాయి, అవి నిర్మాణం, పదజాలం మరియు పేరు పెట్టబడిన ఎంటిటీలలో విభిన్నంగా ఉన్నాయని నిర్ధారిస్తుంది. కొన్ని కీలక అంశాలు ఉన్నాయి:

13 ముఖ్య ఉద్దేశాలు, వీటితో సహా:

  • డబ్బు పంపండి: 65,653 ప్రత్యేకమైన మరియు విభిన్నమైన ప్రాంప్ట్‌లు
  • బ్యాలెన్స్ విచారణ: 3,052 ప్రాంప్ట్‌లు
  • డబ్బు అభ్యర్థించండి: 26,972 ప్రాంప్ట్‌లు
  • లావాదేవీ చరిత్ర, రీఛార్జ్, బిల్లు చెల్లింపు మొదలైనవి.

ఆడియో రికార్డింగ్

ప్రామాణికత మరియు వాస్తవ-ప్రపంచ అనువర్తనాన్ని నిర్ధారించడానికి, వివిధ భాషా నేపథ్యాల నుండి 45 స్పీకర్ల ద్వారా ప్రాంప్ట్‌లు రికార్డ్ చేయబడ్డాయి. వివిధ స్థానిక భాషలు, ప్రాంతీయ మాండలికాలు మరియు పరిసరాల (ఇండోర్ మరియు అవుట్‌డోర్) ద్వారా సంగ్రహించబడిన వైవిధ్యం శిక్షణ డేటాను మెరుగుపరచడంలో సహాయపడింది.

  • భాషా వైవిధ్యం: వినియోగదారులు ఆంగ్లంలో నిష్ణాతులు కానీ కుమావోని, గుజరాతీ, హిందీ, బంగ్లా, మరాఠీ & మలయాళం వంటి విభిన్న స్థానిక భాషలతో ఉంటారు.
  • వయస్సు, లింగం మరియు విద్యా నేపథ్యం: డేటా విస్తృత శ్రేణి జనాభాలను సంగ్రహించింది.
  • అర్బన్ & రూరల్ స్పీకర్లు: వాస్తవ-ప్రపంచ వినియోగాన్ని ప్రతిబింబించేలా, పట్టణ మరియు గ్రామీణ మాట్లాడేవారు చేర్చబడ్డారు.
  • రికార్డింగ్ పర్యావరణం: ఆడియో రికార్డింగ్‌లు ఇండోర్ మరియు అవుట్‌డోర్ సెట్టింగ్‌లలో నిర్వహించబడ్డాయి, విభిన్న నేపథ్య శబ్దాలు చేర్చబడ్డాయి.

సవాళ్లు

భాషా మరియు ప్రాంతీయ వైవిధ్యం

ప్రాంప్ట్‌లు విభిన్న ప్రాంతీయ మాండలికాలు మరియు స్పీకర్ లక్షణాలను ప్రతిబింబించేలా జాగ్రత్త వహించడం మరియు అమలు చేయడం అవసరం.

సహజ ఆడియో వైవిధ్యాలు

వాస్తవ ప్రపంచ అనువర్తనానికి నేపథ్య శబ్దాలు మరియు పర్యావరణ పరిస్థితులను (ఇండోర్ vs. అవుట్‌డోర్) నిర్వహించడం చాలా కీలకమైనది.

విభిన్న స్పీకర్ ప్రొఫైల్‌లు

వివిధ వయస్సుల సమూహాలు, విద్యా నేపథ్యాలు మరియు గ్రామీణ/పట్టణ ప్రాంతాల నుండి మాట్లాడే వ్యక్తులను చేర్చడం వలన ప్రామాణికమైన డేటాను సంగ్రహించడంలో సంక్లిష్టత ఏర్పడింది.

సొల్యూషన్

సత్వర సృష్టి మరియు రికార్డింగ్ రెండింటిలోనూ అధునాతన NLP పద్ధతులను మరియు జాగ్రత్తగా ప్రణాళికను అమలు చేయడం ద్వారా ప్రాజెక్ట్ యొక్క సవాళ్లను పరిష్కరించే పరిష్కారాన్ని షైప్ అందించారు. పరిష్కారం యొక్క ముఖ్య అంశాలు:

ప్రాంప్ట్ సృష్టి

  • 2,500 ప్రత్యేకమైన ప్రాంప్ట్‌లు సృష్టించబడ్డాయి, ప్రతి ఒక్కటి నిర్మాణం మరియు పదజాలం ద్వారా విభిన్నంగా ఉంటాయి.
  • 13 ప్రాథమిక చెల్లింపు అభ్యర్థనల నుండి లావాదేవీ చరిత్ర మరియు బిల్లు చెల్లింపుల వంటి క్లిష్టమైన విచారణల వరకు ఉద్దేశాలు కవర్ చేయబడ్డాయి.

ఆడియో రికార్డింగ్

  • 200 గంటల ఆడియో రికార్డింగ్‌లను నిర్వహించారు 45 వినియోగదారులు, స్థానిక భాషలు, పరిసరాలు, & స్పీకర్ డెమోగ్రాఫిక్స్ అంతటా వైవిధ్యాన్ని నిర్ధారిస్తుంది.
  • సహజమైన ఆడియో వైవిధ్యాన్ని నిర్ధారించడానికి రికార్డింగ్ కోసం ఇండోర్ మరియు అవుట్‌డోర్ పరిసరాలు రెండూ ఉపయోగించబడ్డాయి.
  • వక్తలు ఖచ్చితమైన భాషా ప్రాతినిధ్యాన్ని నిర్ధారిస్తూ ప్రాంతీయ మాండలికాల శ్రేణిని సూచిస్తారు.
ఇంటెంట్ పంపండి బ్యాలెన్స్ విచారణ డబ్బు అభ్యర్థించండి లావాదేవీ చరిత్ర
ప్రాంప్ట్ ఇంటి అద్దె కోసం సుమత్రికి ఇరవై వందలు చెల్లించండి నేను నా పొదుపు ఖాతాలో నా ప్రస్తుత బ్యాలెన్స్ తెలుసుకోవాలనుకుంటున్నాను. మీరు ఎమర్జెన్సీ కోసం మూడు వందల పద్దెనిమిది రూపాయలు రాజీని అభ్యర్థించగలరా? నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపించు.
గుజరాతీ సుమాత్రీణే ఘరానా భాడా పేటే ఏకవీసో భోదించండి హుం మారా బచత్ ఖాతామాం మారీ వర్తమాన్ లైన్ జానవ మాంగు చుం. శుం మీ రాజి పాసేథి ఇమర్జన్సీ మాట్టె అధార్ రూపియా మాంగి షాకో చో? మన మారా డెబిట్ కార్డనా వ్యాహార్ దేఖాడ్.
లేదు సుమత్రి కో మకాన్ కిరాయే ఇక్కీస్ సౌ రూపే కా భుగతన్ కరేం. నేను అపనే బచత్ ఖాతే మేం వర్తమాన శేష రాశి జాననా చాహతా హూం. క్యా మీరు రాజి సే కిసీ ఇమరాజెన్సీ తీన్ సౌ అథారహ రూపయే మాంగ్ సకటే? ముజే మేరా డెబిట్ కార్డ్ కా లేనదేన్ బ్యూరా దిఖాయో.
మలయాళం ఇంటివాటకయై సుమత్రిక్ రెండయిరత్తిఅన్నూట్ అందించు. ఎన్‌టీ సేవింగ్స్ ఖాతాలో ప్రస్తుత మొత్తాన్ని తెలుసుకోవాలనుకుంటున్నాను. రాజీనామా మున్నూటి పతినెట్ రూపాయి అత్యవసర అవసరాలకు డిమాండ్ చేయాలా? ఎన్ట్ డెబిట్ కార్డ్ లావాదేవీ వివరణను చూపించు.
తెలుగు ఇంటి అద్దె కోసం సుమత్రికి ఇరవై ఒక్క వంద చెల్లించండి నేను నా సేవింగ్స్ అకౌంట్ లో నా ప్రస్తుత బ్యాలెన్స్ ను తెలుసుకోవాలనుకుంటున్నాను. ఎమర్జెన్సీ కోసం రాజిని మూడు వందల పద్దెనిమిది రూపాయలు అడగగలరా? నా డెబిట్ కార్డ్ లావాదేవీ చరిత్రను నాకు చూపించండి.
బంగ్లా () బడి వాడా జన్య సుమాత్రికే నాధ్, పాదాలు పరిశోధ కరుణ్ ఆమి ఆమె సంచయ అయాకవుంటే బర్తమా బ్యాలెన్సు జానతే చై. ఆపని రాజకీయం తినోషో ఆథారో టాకా చైతే పారెన్? ఆమార్ డెబిట్ కార్డ్
మరాఠీ సుమత్రీలా ఘరాచ్యా భాద్యాసాఠీ దోన్ హాజరు ఏకే రూపయే ద్యా. మలా మాజ్యా బచత్ ఖాత్యతీల్ సధ్యాచా శిల్ల జాణూన్ గ్యాయాచా ఆహే. ఆపన్ రాజీకడూన్ తాతడీసాఠీ తీనషే అథరా రూపయే మాగూ శకతా కా? మాజ్యా డెబిట్ కార్డుచే వ్యాపార దాఖవా.

ఫలితం

Shaip ద్వారా బట్వాడా చేయబడిన అధిక-నాణ్యత, విభిన్న ఆడియో డేటా క్లయింట్‌ని వివిధ మాండలికాలు, పరిసరాలు మరియు సందర్భాలలో కమాండ్‌లను గుర్తించగల సామర్థ్యం గల AI-ఆధారిత వాయిస్-ఆధారిత UPI చెల్లింపు వ్యవస్థను అభివృద్ధి చేయడానికి అనుమతించింది. డేటా మెరుగుపరచడంలో సహాయపడింది:

  • నిజ-సమయ వాయిస్ గుర్తింపు సంక్లిష్ట వాతావరణంలో.
  • మరింత ఖచ్చితమైన UPI లావాదేవీ విస్తృత శ్రేణి వినియోగదారుల కోసం నిర్వహించడం.
  • వ్యాప్తిని: ఇతర భారతీయ భాషల్లోకి విస్తరించేందుకు ఈ ప్రాజెక్ట్ బలమైన పునాదిని ఏర్పరుస్తుంది.

deliverables

  • 200 గంటల ఆడియో ఫైల్స్ (8 kHz PCM WAV ఫార్మాట్, మోనో)
  • 87,000 + విభిన్నమైన ప్రాంప్ట్‌లు ప్రత్యేకమైన ఉద్దేశాలతో వ్యాఖ్యానించబడ్డాయి
  • మెటాడేటా: స్పీకర్ ప్రొఫైల్‌లు, పర్యావరణ వివరాలు మరియు ట్రాన్స్‌క్రిప్షన్ ఖచ్చితత్వం

ప్రత్యేకమైన ప్రాంప్ట్‌లు మరియు ప్రామాణికమైన ఆడియో రికార్డింగ్‌ల ద్వారా భారతదేశ వైవిధ్యాన్ని క్యాప్చర్ చేయగల Shaip యొక్క సామర్థ్యం మా వాయిస్-ఆధారిత UPI చెల్లింపు వ్యవస్థకు గేమ్-ఛేంజర్. ప్రాంప్ట్ క్రియేషన్ నుండి రికార్డింగ్ నాణ్యత వరకు - ప్రాజెక్ట్‌లోని ప్రతి అంశం ఖచ్చితత్వంతో నిర్వహించబడుతుందని వారి బృందం నిర్ధారిస్తుంది, ఇది మరింత సమగ్రమైన, బలమైన వాయిస్ రికగ్నిషన్ మోడల్‌ను రూపొందించడంలో మాకు సహాయపడుతుంది.

గోల్డెన్-5-స్టార్