హైదరాబాద్: టెక్ దిగ్గజం మైక్రోసాఫ్ట్ ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (AI) రంగంలో మరో మైలురాయిని అధిగమించింది. మాటను అత్యంత ఖచ్చితత్వంతో వచన రూపంలోకి (Speech-to-Text) మార్చగల సామర్థ్యం ఉన్న ‘MAI-Transcribe-1’ అనే శక్తివంతమైన మోడల్ను అధికారికంగా విడుదల చేసింది. గ్లోబల్ మార్కెట్లో ప్రస్తుతం ఉన్న ట్రాన్స్క్రిప్షన్ టూల్స్కు ఇది గట్టి పోటీనిస్తుందని సాంకేతిక నిపుణులు భావిస్తున్నారు.
‘MAI-Transcribe-1’ ప్రధాన ఫీచర్లు:
1. అత్యున్నత ఖచ్చితత్వం (Unmatched Accuracy): మైక్రోసాఫ్ట్ ప్రకటించిన వివరాల ప్రకారం, ఈ మోడల్ గతంలో ఉన్న ఓపెన్-సోర్స్ మోడల్స్ కంటే మెరుగైన పనితీరును కనబరుస్తుంది. ముఖ్యంగా వివిధ రకాల యాసలు (Accents) మరియు నేపథ్య శబ్దాలు (Background Noise) ఉన్నప్పటికీ, మాటను తప్పులు లేకుండా గుర్తించగలగడం దీని ప్రత్యేకత.
2. బహుభాషా మద్దతు (Multilingual Support): ఈ మోడల్ ప్రపంచవ్యాప్తంగా వందలాది భాషలను గుర్తించగలదు. ఇది కేవలం మాటను రాయడమే కాకుండా, ఒక భాష నుండి మరొక భాషలోకి తక్షణమే అనువదించే (Real-time Translation) సామర్థ్యాన్ని కూడా కలిగి ఉంది.
3. తక్కువ ధర – ఎక్కువ వేగం: మైక్రోసాఫ్ట్ ఈ మోడల్ను డెవలపర్ల కోసం తక్కువ ధరకే అందుబాటులోకి తెచ్చింది. పెద్ద మొత్తంలో ఆడియో ఫైళ్లను అతి తక్కువ సమయంలో ప్రాసెస్ చేయగల సామర్థ్యం దీనికి ఉంది, ఇది మీడియా, విద్యా మరియు కార్పొరేట్ రంగాలకు ఎంతో ఉపయోగకరం.
ఎవరికి ప్రయోజనం?
- మీడియా రంగం: ఇంటర్వ్యూలు మరియు వార్తా కథనాల ట్రాన్స్క్రిప్షన్ సులభతరం అవుతుంది.
- కార్పొరేట్ మీటింగ్స్: సమావేశాల్లో చర్చించిన అంశాలను నిమిషాల్లో నోట్స్ రూపంలో పొందే అవకాశం ఉంది.
- కంటెంట్ క్రియేటర్స్: వీడియోలకు సబ్టైటిల్స్ (Subtitles) రూపొందించడం ఇప్పుడు మరింత వేగవంతం కానుంది.
గూగుల్, ఓపెన్ ఏఐలకు సవాలు:
ప్రస్తుతం మార్కెట్లో ఉన్న గూగుల్ స్పీచ్-టు-టెక్స్ట్ మరియు ఓపెన్ ఏఐ (OpenAI) వారి ‘విస్పర్’ (Whisper) మోడళ్లకు ‘MAI-Transcribe-1’ గట్టి పోటీ ఇవ్వనుంది. మైక్రోసాఫ్ట్ అజూర్ (Azure) క్లౌడ్ ప్లాట్ఫారమ్ ద్వారా ఈ సేవలను ప్రపంచవ్యాప్తంగా ఉన్న డెవలపర్లు వాడుకోవచ్చు.
ముగింపు: AI సాంకేతికతతో భాషా అడ్డంకులను తొలగించడంలో మైక్రోసాఫ్ట్ తీసుకున్న ఈ నిర్ణయం, డిజిటల్ కమ్యూనికేషన్ రంగంలో విప్లవాత్మక మార్పులకు దారితీస్తుందని విశ్లేషకులు అంచనా వేస్తున్నారు.