Nová technologie rozpoznávání hlasu společnosti Microsoft může převést váš přirozený hlas do jiného jazyka [Video]

, v tuto chvíli se v mobilním prostoru děje trochu bitvy hlasového příkazu, s Apple Digital Siri Assistantkou a hlasovým vyhledáváním společnosti Google Google Google Google Používání dukingu proti sobě navzájem za náklonnost uživatelů. Oba přicházejí s vlastním souborem výhod a nevýhod a bude se zlepšit, až se vstoupíme do budoucna, ale zdá se, že týmy Microsoftovy výzkumné a vývojové týmy pracují na něčem hlasu na základě jejich vlastních zákulisí, které by mohly změnit cestu Lidé spolu komunikují.

Přestože je Siri mnohem silnější než hlasové vyhledávání Google na platformě iOS, oba obecně fungují stejným způsobem tím, že před zveřejněním a zpracováním tohoto příkazu na serveru back-end zachycují zvukové příkazy Zpět k uživateli a jednat na požadavku. Video zveřejnilo Microsoft s prezentací od Ricka Rashida, která nastiňuje vylepšení, která společnost učinila v oblasti přirozených uživatelských intervací pomocí lidské řeči.

Počítačové systémy, které chápou lidskou řeč, nejsou novým vynálezem. V průběhu let jsme viděli mnoho vydání, které ukazují významný pokrok v této oblasti, přičemž vyhledávání společnosti Siri a Google je několik posledních příkladů toho, jak lze tuto technologii aplikovat v reálném světě. Microsoft se však tiše pokouší podniknout věci o několik kroků navíc vytvořením systému kolem technologií, které mohou nejen rozpoznat lidskou řeč, ale také ji převést do textu cizího jazyka a poté opakovat slova v tomto jazyce pomocí generovaného syntetizovaného hlasu Zní to jako reproduktor.

Demonstrace na stádiu s hlavním výzkumným ředitelem společnosti Microsoft ukazuje technologii v akci tím, že uznává jeho mluvená anglická slova, přeměňuje je na čínštinu na promítaném displeji a poté slyšitelně oznamuje stejnou větu zpět v Mandarinu. To vše je dost foukání mysli, ale pak se věci pořizují trochu navíc, když si uvědomíte, že Rashid a jeho kolegové nakrmili systém více než hodinu svých vlastních hlasových údajů, aby umožnili systému opakovat větu v Mandarinu pomocí jeho Vlastní hlas!

Tato technologie není nejlepší a stále dělá chyby, ale je opravdu ohromující uvědomit si, že je to možné. Budoucnost lidské interakce je absolutně na obzoru.

(Via TechNetBlog)

Můžete nás sledovat na Twitteru, přidat nás do svého kruhu na Google+ nebo se vám líbí naše stránka na Facebooku, abyste se informovali o všech aktuálních od společnosti Microsoft, Google, Apple a Web.

Leave a Reply

Your email address will not be published. Required fields are marked *