Zprávy

AppleInsider může získat přidruženou provizi za nákupy uskutečněné prostřednictvím odkazů na našich stránkách.
Nová patentová přihláška společnosti Apple popisuje převod iMessage na hlasovou poznámku přehrávanou hlasem, který uživatel vytvořil pomocí vzorků hlasu odesílatele.
Uživatelé Applu již mohou posílat zvukové nahrávky v iMessage nebo si nechat Siri přečíst textové zprávy zpět, ale patent popisuje způsob, jak nechat zařízení přečíst textovou zprávu hlasem odesílatele namísto Siri pomocí hlasového souboru.
„Hlasový model je poskytován druhému elektronickému zařízení,“ uvádí patent. „V některých příkladech je přijata zpráva od příslušného uživatele druhého elektronického zařízení.“
To znamená, že když někdo odešle zprávu iMessage, může se rozhodnout připojit hlasový soubor, který bude uložen v zařízení. Pokud k tomu dojde, bude příjemce vyzván, aby se rozhodl, zda chce přijmout zprávu i hlasový záznam.
„V reakci na přijetí zprávy je přijat hlasový model příslušného uživatele,“ píše se v patentu. „Na základě hlasového modelu je poskytován zvukový výstup odpovídající přijaté zprávě.“
Podle patentu by pak dotyčný iPhone vytvořil profil podobný Siri pro hlas odesílatele a poté jej simuloval při čtení této zprávy a jakýchkoli budoucích zpráv, které od tohoto odesílatele obdrží. Model hlasové simulace lze také odeslat samostatně, takže si jej kontakty osoby mohou stáhnout před zprávami.
Nabízelo by to větší přizpůsobení, když si přátelé a rodina navzájem posílají textové zprávy, místo aby slyšeli hlas Siri, když čte zprávy. Páry také mohly slyšet zprávy osobnějším způsobem, například slyšet „Miluji tě“ v hlase svého partnera.
Vynálezci patentu jsou Qiong Hi, Jiangchuan Li a David A. Winarsky. Winarsky je ředitel společnosti Apple pro technologii převodu textu na řeč, zatímco Li je starší softwarový inženýr Siri pro strojové učení ve společnosti Apple a Hu dříve pracoval na Siri ve společnosti.
Jako obvykle, s patenty se to nutně nestane realitou, ale je to možné vzhledem k nedávné práci Applu s umělou inteligencí a hlasy. Apple například s iOS 11 přešel hlas Siri ze spoléhání se na nahrávky hlasových herců na model převodu textu na řeč pomocí strojového učení.
V roce 2020 Apple získal společnost s názvem Voysis, která pracovala na zlepšení zpracování přirozeného jazyka ve virtuálních asistentech. Používali technologii WaveNet, kterou v roce 2016 představil program DeepMind společnosti Google.
WaveNets jsou „hluboké generativní modely nezpracovaných zvukových křivek“, které lze použít ke generování řeči, která napodobuje jakýkoli lidský hlas.
Apple také začal používat umělou inteligenci k vyprávění konkrétních žánrů audioknih namísto použití lidí. Patent je tedy zcela v oblasti možnosti, že se zařízení Apple nakonec naučí číst zprávy hlasem člověka.
Zdroj: appleinsider.com