Početkom ove godine kineski tehnološki gigant Baidu predstavio je novi sistem koji se zove DeepVoice. Reč je o sistemu koji koristi učenje na dubokom nivou, što je popularna tehnika iz oblasti veštačke inteligencije, kako bi omogućio konvertovanje govora u pisanu reč.
Prva verzija je bila u stanju da kovertuje kratke rečenice. Takođe, sistem je bio u stanju da nauči jedan po jedan jezik i bili su mu potrebni sati da ga savlada u potpunosti. U maju nam je stigla i druga verzija ovog sistema koja se očekivano zvala DeepVoice 2 i koja je mogla da imitira glas sa samo pola sata vremena potrebnog za punjene baze podataka.
Sada je stigla i treća, finalna verzija ovog sistema koja može da nauči 10.000 glasova sa svega pola sata vremena potrebnog za punjenje baze podataka. Iz kompanije Baidu navode da postojanje ovakvog sistema koji je u stanju da efikasno generiše širok spektar najrazličitijih glasova otvara vrata za brojne nove mogućnosti koje u suprotnom ne bi bile izvodljive.
Opširnije u audio izdanju …
171108deepvoice.mp3 |